Python自动化读取邮件基础代码讲解
大家好,在之前的文章中我们已经了解如何对自己的邮箱做一些代码操作前的基础配置,也学会了通过 yagmail
发送邮件。这篇文章将分别介绍两个很实用的收取及读取邮件的库:imbox
和 poplib
,主要将讲解:
“”
imbox
收取邮件poplib
收取邮件keyring
存储密码
之前的文章中我们也提到了,基础配置需要打开 POP3/SMTP/IMAP
,针对不同邮箱有不同的操作,并以网易 163 邮箱和 QQ 邮箱 举例说明,如果你不熟悉,可以查看Python发送邮件基础代码讲解
确定配置好了之后就可以继续阅读今天的文章!
一、poplib库
poplib
模块提供了 poplib.POP3
和 poplib.POP3_SSL
两个类,分别用于连接普通的 POP 服务器和基于 SSL 的 POP 服务器。连接到服务器后,按照 POP3 协议与服务器交互。
注意:虽然 POP3 得到了广泛支持,但已过时。POP3 服务器的实现质量差异很大,而且太多的服务器都很差。后面会介绍基于 IMAP 服务器的 imbox
库
下面以 QQ 邮箱为例示范如何完整 poplib
库的使用
1、创建连接
使用poplib.POP3_SSL
创建连接
import poplib
import email.parser, email.policy
conn = poplib.POP3_SSL('pop.qq.com', 995)
2、登录服务器
注意输入的是邮箱授权码而不是真实 QQ 密码
conn.user('xxxx@qq.com')
conn.pass_('xxxx') # 注意输入的是邮箱授权码而不是真实 QQ 密码
3、获取邮件列表
response, maillist, r = conn.list()
print('响应:', response)
print('邮件列表:', maillist)
4、遍历邮件
multipart 代表邮件内容的容器,无需处理
msg = email.parser.BytesParser(policy=email.policy.default).parsebytes(data)
for part in msg.walk():
# multipart 代表邮件内容的容器,无需处理
if part.get_content_type().split("/", 1)[0] == 'multipart':
continue
elif part.get_content_type().split("/", 1)[0] == 'text':
print(part.get_content())
else:
filename = part.get_filename()
print(filename)
with open(filename, 'wb') as f:
f.write(part.get_payload(decode=True))
多级判断的目的主要是跳过容器、输出正文、下载附件的本地
5、退出服务器
conn.quit()
常用的代码中有部分稍微繁琐,但整体还是比较好理解的
二 、imbox库
在正式介绍 imbox
库之前,再分享一个技巧。从上面 poplib
的代码中也可以看到,当输入密码(授权码)的时候是在代码中明文显示,这就带来了风险:
“假如你不小心把这个代码没有处理就发给别人,或者上传的 github,那么所有拿到这段代码的人都可以对你的邮箱大肆操作,这是很可怕的事情
这里读取邮件用的模块 imbox 也和 poplib 一样需要密码这个参数,但不希望在代码中明文呈现密码,怎么办?
”
解决办法是利用 keyring
库,通过系统密钥环将密码(授权码),预先在本地存储好,后面在代码中调用 keyring
库的方法,通过账号把密码取出来作为变量就可以。
这样即使别人拿到了全部代码,但他的本地中没有预先配置好密码,就不会有泄露信息的风险了。具体使用方法为,首先打开命令行输入:
import keyring
keyring.set_password("qqmail", "username", "password")
这样 password
在本地存储好了,后面只需要 keyring.get_password
获取作为变量即可:
import keyring
password = keyring.get_password('qqmail', 'username')
用 imbox
读取邮件的代码如下:
import keyring
from imbox import Imbox
password = keyring.get_password('qqmail', 'username')
with Imbox('imap.qq.com', 'xxx@qq.com', password, ssl=True) as imbox:
# 获取全部邮件
all_inbox_messages = imbox.messages()
for uid, message in all_inbox_messages:
print(message.subject) # 邮件主题
print(message.body['plain']) # 邮件文本格式正文
Imbox('imap.qq.com', 'xxx@qq.com', password, ssl=True)
这行代码中需要填写服务器、用户名邮箱、密码、SSL加密循环体中 uid
参数是每封邮件的编号,邮件编号十分重要,可以用于邮件的标记和删除。除了邮件主题及文本格式正文外,我们主要常用获取以下内容:
除了获取全部邮件用 all_inbox_messages = imbox.messages()
外,我们常常会有选择性获取已读、未读和红旗标记邮件:
unread_inbox_messages = imbox.messages(unread=True) # 未读邮件
read_inbox_messages = imbox.messages(unread=False) # 已读邮件
flagged_inbox_messages = imbox.messages(flagged=True) # 红旗标记邮件
也可以通过邮件的收件时间获取邮件:
inbox_message_before = imbox.messages(date__lt=datetime.date(2021, 1, 18))
inbox_message_after = imbox.messages(date__gt=datetime.date(2021, 1, 18))
inbox_message_on_date = imbox.messages(date__on=datetime.date(2021, 1, 18))
那么如何筛选指定发件人发送的邮件呢?答案就在于对 message.sent_from
的理解了。message.sent_from
是一个字典元组,在遍历的过程中只需要简单通过 message.sent_from[0]['email']
就能够将发件人邮箱提取出来,接着做判断就能够达到目的:
with Imbox('imap.qq.com', 'xxx@qq.com', password, ssl=True) as imbox:
all_inbox_messages = imbox.messages()
for uid, message in all_inbox_messages:
print(message.subject)
print(message.sent_from)
print(message.body['plain'])
# 把邮箱提取出来
email = message.sent_from[0]['email']
if email == 某个特定的邮箱:
pass
上文还提到了邮件编号 uid
的重要性。基于编号的两个重要方法:
“”
标记已读 imbox.mark_seen(uid)
删除邮件 imbox.delete(uid)
使用以删除邮件为例:
for uid, message in all_inbox_messages:
if 满足某种条件的邮件:
imbox.delete(uid)
以上就是基于 POP3 的 poplib
和基于 IMAP 的 imbox
针对收取邮件的常用操作!之后我们将更新更多基于邮件的自动化办公系列文章!
-END-
扫码添加早小起
1. 回复「进群」进入Python技术交流群
2. 回复「Python」获得Python技术图书
3. 回复「习题」领取Python数据处理200题