Python 中为什么不建议使用 time.sleep 实现定时功能?
有时候,我们想实现一个非常简单的定时功能,例如:让一个程序每天早上 8 点调用某个函数
但我们又不想安装任何第三方库,也不会使用 crontab 或者任务计划功能,就想使用纯 Python 来实现
可能有同学会这样写代码:
import time
import datetime
def run():
print('我是需要被每天调用的函数')
def schedule():
target_time = datetime.time(8, 0, 0)
today = datetime.date.today()
target_date = today + datetime.timedelta(days=1)
target_datetime = datetime.datetime.combine(target_date, target_time)
now = datetime.datetime.now()
delta = (target_datetime - now).total_seconds()
time.sleep(delta)
run()
while True:
time.sleep(24 * 3600)
run()
if __name__ == '__main__':
schedule()
这段程序,首先计算出现在距离明天早上 8 点相差的秒数;睡眠这么多秒以后,第一次运行目标函数,然后进入一个死循环,每隔 86400 秒,程序调用一次 run 函数
这个程序初看起来,似乎没有什么问题
但如果你每天观察它的运行时间,你会发现随着时间的推移,时间会越来越不准确
这是因为,run 函数不是一瞬间就运行完成的。它运行也会消耗时间
假设程序第一次运行 run 函数的时候,确实刚刚好是 8:00,run 函数运行了 2秒;那么,程序睡眠 86400 秒以后,时间实际上是 8:00:02.从第二天开始,每天晚 2 秒钟。一个月就会晚一分钟
但实际上,我们如果付出一点点微不足道的代价,我们就可以防止这种误差的发生,并且程序代码会变得更简单:
import time
import datetime
def run():
print('我是需要被每天调用的函数')
def schedule():
last_run = None
while True:
now = datetime.datetime.now()
if now.strftime('%H:%M') == '08:00' and last_run != now.date():
run()
last_run = now.date()
time.sleep(1)
if __name__ == '__main__':
schedule()
程序在一个死循环中,每秒做一次检查,如果当前的时分正好是 08:00,并且上一次运行不是今天,那么就调用 run 函数,并把上一次运行的时间设置为今天。否则,就睡眠 1 秒钟
这样做,相当于每秒都会校对时间,从而避免了长时间运行导致的时间误差。虽然看起来这个死循环会非常消耗 CPU,但只要你算一下,实际上它只不过每天循环 86400 次而已。这个次数并不多
但无论如何,专业的事情应该交由专业的工具来做;time.sleep 用来设置周期性的时间间隔可以,但它实际上不适合用来做定时任务
因为一个支持定时任务的库,例如:Python 的schedule
或者APScheduler
,他们在确保定时时间准确上,做了很多工作。还有一些库甚至用到了时间轮
这样的数据结构来确保时间的准确性。这不是我们简单用两三行 Python 代码就能完成的。
总结
如果能用 crontab 或者任务计划,那么这是最优选择;其次,使用 Python 专用的定时模块;最次,才是使用 time.sleep 来实现
如果不得不用 time.sleep,那么应该尽量缩短检查的间隔,避免长时间睡眠