多个 Python 项目怎么调用我自己的工具函数?
“
阅读本文大概需要 4 分钟。
在多年写代码的过程中,我总结了不少常用的工具函数。这些工具函数有的能够实现快速重试网络请求,有的可以把任意格式的时间转成标准格式,还有的可以自动生成正则表达式。
我把这些工具函数分别放到多个.py
文件中。然后把这些.py
文件放在一个叫做my_awesome_util
的文件夹中。
由于我没有把这些代码上传到 Pypi 或者 Github,因此我每次在新的项目中要使用时,都要把my_awesome_util
文件夹复制到新的项目中,非常麻烦,而且会形成大量的重复代码。
有没有什么办法,能让新开的项目直接就能导入这些工具函数呢?就像导入官方模块import time
一样,如果我要使用时间相关的工具函数,我只需要import time_util
就可以了。
首先要排除的方法,就是手动在代码里面,通过sys.path
添加文件夹。因为这个方法需要在每个项目的入口文件中增加两行代码,无法做到全自动
。
今天的方法,是在 Python 的site-packages
文件夹中做文章。相信很多同学都知道,任何放到site-packages
文件夹里面的.py
文件或者文件夹,都可以在 Python 中直接导入:
看到这里,肯定有同学要问,那是不是把my_awesome_util
文件夹整个复制到site-packages
文件夹中呢?
当然不是的。因为我的工具包里面的代码是在持续演进的,我会经常更新里面的代码,放到site-packages
里面以后,代码修改起来很不方便。
我们要用到的,是 Python 的一个特性,叫做.pth
文件。在site-packages
文件夹中,任意创建一个.pth
文件。文件名可以随便取,只要不跟已有的模块冲突就可以了。例如叫做xxxx.pth
。这个文件里面只有一行,就是my_awesome_util
文件夹的绝对路径。例如:
现在,我在任何一个文件夹中启动 Python,直接就可以导入my_awesome_util
文件夹中的任何.py
文件:
.pth
文件可以有很多行,每行一个文件夹的绝对路径,就可以让 Python 同时导入这些文件夹里面的所有.py
文件。
有时候,我们的电脑上有多个虚拟环境。A 环境有 pandas,没有 pymongo;B 环境有 pymongo,但没有 pandas。现在我在 B 环境里面要写一段代码,既需要 pandas,又需要 pymongo 怎么办呢?如果不想重新安装,我可以把 A 环境的site-packages
文件夹的绝对路径,写入到一个.pth
文件中,然后把这个文件存放到 B 环境的site-packages
文件夹中。这样,我就可以在B环境里面直接使用 A 环境中的所有第三方库了。
有同学会问,怎么知道site-packages
文件夹在哪里呢?其实只需要执行下面两行代码就能查询到:
>>> import sysconfig
>>> print(sysconfig.get_path('purelib'))
运行效果如下图所示:
End
崔庆才的新书《Python3网络爬虫开发实战(第二版)》已经正式上市了!书中详细介绍了零基础用 Python 开发爬虫的各方面知识,同时相比第一版新增了 JavaScript 逆向、Android 逆向、异步爬虫、深度学习、Kubernetes 相关内容,同时本书已经获得 Python 之父 Guido 的推荐,目前本书正在七折促销中!
内容介绍:《Python3网络爬虫开发实战(第二版)》内容介绍
扫码购买