细思恐极,插上 U 盘就开始执行 Python 代码

数据森麟

共 3029字,需浏览 7分钟

 ·

2022-08-18 20:53

来源于网络,侵删

132c6188169d66c9eb9e86845218c0ca.webp

一个突发奇想,当你把usb插进去的时候,能不能自动执行usb上的程序。查了一下,发现只有windows上可以,具体的大家也可以搜索(搜索关键词usb autorun)到。但是,如果我想,比如,当一个usb插入时,在后台自动把usb里的重要文件神不知鬼不觉地拷贝到本地或者上传到某个服务器,就需要特殊的软件辅助。

于是我心想,能不能用python写一个程序,让它在后台运行。每当有u盘插入的时候,就自动拷贝其中重要文件。

如何判断U盘的插入与否?

9875acb2b2973877e287cee7fb1e836f.webp

首先我们打开电脑终端,进入/Volumes目录,这时候插入U盘,可以发现它被挂载在了这个目录之下,也就是说,我们只要在固定时间扫描这个目录,当这个目录有新文件夹出现的时候,很可能有U盘被插入了。

我的设计是这样的,用time.sleep(3)函数,让程序保持运行状态,并且每隔三秒查看一下/Volumes/目录,如果多出来文件夹,就将其拷贝到另外的文件夹。

bdef952d07908557b28cc996621651b7.webp

就像标题所示,我们真的只用了10行(其实是11行,凑个整:)完成了这个“病毒”。我们可以发现usb中的目录,在插入半分钟后全部躺在了home目录下了。

如何选择性的复制文件?

刚刚我们写了一个很简易的脚本测试了一下这个想法的可行性,但是还是有问题。刚才之所以能把U盘中所有文件很快复制进去,是因为U盘中只有两三个文件,大小不超过15M。如果目标U盘中有很多电影,音乐,这些我们并不需要的文件,我们的程序就应该能跳过它们,仅仅选择一些重要的比如.docx比如.ppt文件,或者仅仅复制最近修改过的那些文件,或者排除所有大小大于5M的文件。我们可以用python做到吗?当然!

还是举个例子吧。

我在某目录下创建了testwalk文件夹,里面有file123.txt三个文件,folder123三个文件夹,其中folder1中有文件file4.txt以及folder4

95f5e66b569cfdd985ad0e8b3bdf1e98.webp

现在我们来测试一下

4661cb3554c5ff117326817b96a3ac2a.webp

root存放的是当前位置,它会把./testwalk/下所有的文件夹作为根目录,往下搜索

97ae8fff00517c6ef08ce115a9055a90.webp

单独查看 dirs

839e84d0c24c0987310833072e3134c9.webp

单独查看 files

2adf3d729f97c2ad215e88f1503b667c.webp

好了,我们现在需要递归usb文件夹,找到所有的file,查看大小,如果小于,比如3M,就拷贝进home,大于就舍去。

shutil模块

4b00e8f95ecd90109011d8024dea41e4.webp

现在我们拿刚才的文件夹举例子,如果想把file1.txt拷贝到folder2:

73e6df162e3d1549a6b0c9918a6ccab5.webp

还有许多使用工具在shutil里面这里就不详述了。

os.path.getsize()判断大小

os.path.getsize(文件名)返回的是一个单位为byte的数值,如果用来查看文件大小,我们则需要手动写一个函数,将其换算成容易阅读的形式。

d73eb2e46c5482051f8f7af4903d54dc.webp

这里我们只要选择文件大小小于3M的即可,3M = 3 * 1024kB = 3 * 1024*1024byte

e93799c5b2c3f6a41029dd5080af94be.webp

结合shutil.copy2就可以把选定大小的文件复制进我们的目标文件夹了

如何指定文件类型

这里就需要正则表达式来帮助我们了。

正则表达式内容很多,《python核心编程》中用了整整一章来讲,所以我们也不深入了。

如下,我们让指定文件后缀以及指定文件大小可以复制进我们的目标文件:

别忘了导入 re

a9e4724c547cdcd49f79db576fc10d4d.webp

用更加复杂的正则表达式可以更好地指定文件类型

根据修改时间筛选文件

3f024a877369c3ce52f62fd3dc058e3d.webp

这时候我在目录下创建了一个文件叫做newfile

e99cb6c23963a9dd72629478eaff7c1b.webp

总之,对每一个文件进行修改时间的筛选可以只复制那些近期,或者特定时期修改或者添加过的文件,这个功能在特定情况下很有用。

总结

其实,标题这么起只是为了吸引大家注意,这就是一个小程序,也谈不上病毒

我更想通过这个例子,展示python对于文件处理的强大能力,引发大家的学习热情

以上实现都是基于macos,linux应该一样,windows稍加修改也可以成功。 以上技术仅供学习,切勿用于其他行为


        

麟哥新书已经在当当上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前当当正在举行活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:




      
          

f98bd33552b411a09d566d2010ca666a.webp



            

数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容, 还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。


管理员二维码:



浏览 40
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报