几行代码,网盘链接提头来见!

小詹学Python

共 4462字,需浏览 9分钟

 ·

2021-08-09 19:44

文 | 闲欢

来源:Python 技术「ID: pythonall」

背景

晚上,女朋友下班回来,我邀请她下楼去散步,她一副愁眉苦脸的样子,说今晚要加班。

仔细询问之下得知:女朋友今天接到上司一个任务,领导丢给她一个文件,里面密密麻麻满是百度网盘链接和提取码,需要她今天结束之前把网盘里的文件提取出来。

听到她说要熬夜肝工作那种委屈的模样,我是真的有点心疼。于是本能地问她,现在工作中最影响效率的是哪个环节,我来帮她一起肝。她告诉我,看这个百度网盘的链接看得眼都花了,要复制链接,以及复制提取码是个技术活,因为有其他文字干扰,经常复制不准。

链接类似下面这样的:

链接: https://pan.baidu.com/s/1ctcXiZymWst2NC_JPDkr4Q 提取码: j1ub 复制这段内容后打开百度网盘手机App,操作更方便哦

想必大家看到这个链接,都不会陌生。不止百度网盘,还有好多网盘都是这样的。

既然这样,那我当然要帮她解决这个棘手的问题。

思路

其实她的需求很简单,把网盘链接和对应提取码从这个分享文字中提取出来。

解决这个需求只需要用正则表达式匹配分享文字中的 URL 和提取码就行了。

实现解析

代码很简单,直接上:


url_pattern = 'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+'
code_pattern = '(?<=提取码: )[0-9a-z]{4}'
url_regex = re.compile(url_pattern)
code_regex = re.compile(code_pattern)

接下来,测试一下:

str = '链接: https://pan.baidu.com/s/1ctcXiZymWst2NC_JPDkr4Q 提取码: j1ub 复制这段内容后打开百度网盘手机App,操作更方便哦'
print(url_regex.findall(str)[0])
print(code_regex.findall(str)[0])

可以在控制台上看到打印输出两行,第一行是链接,第二行是提取码:

https://pan.baidu.com/s/1ctcXiZymWst2NC_JPDkr4Q j1ub

几行代码一敲,事情就这么搞定了!

等等,这太程序员思维了!

现在还只是个程序,难道要她把一段段文字复制到我的程序里面再运行?这不是更麻烦吗???

就这?

当然不行,我还是有点产品素养的!

当然要给个界面给她。我搜索了下我的知识库,准备用 tkinter 来画一个简单的界面给她使用。

其实现如下:

def draw_window(self):
        self.init_window = Tk()  # 实例化出一个父窗口
        self.init_window.title("百度网盘提取链接工具_v1.0")  # 窗口名
        self.init_window.geometry('800x300+10+10')
        # 源信息
        self.init_data_label = Label(self.init_window, text="复制的提取信息")
        self.init_data_label.grid(row=0, column=0)
        self.init_data_text = Text(self.init_window, width=100, height=5, borderwidth=1, relief="solid")  # 原始数据录入框
        self.init_data_text.grid(row=1, column=0, columnspan=10)

        # 按钮
        self.str_trans_button = Button(self.init_window, text="提取", width=10, height=2, bg="blue",
                                       command=self.extractData)  # 调用内部方法  加()为直接调用
        self.str_trans_button.grid(row=2, column=2)

        # 链接
        self.link_data_label = Label(self.init_window, width=10, text="链接")
        self.link_data_label.grid(row=3, column=0, columnspan=1)
        self.link_data_text = Text(self.init_window, width=60, height=2, borderwidth=1, relief="solid")
        self.link_data_text.grid(row=3, column=1, columnspan=6)

        # 提取码
        self.code_data_label = Label(self.init_window, width=10, text="提取码")
        self.code_data_label.grid(row=3, column=7, columnspan=1)
        self.code_data_text = Text(self.init_window, width=20, height=2, borderwidth=1, relief="solid")
        self.code_data_text.grid(row=3, column=8, columnspan=2)

上面就是画一个界面的代码,运行之后长这样:

界面

丑是丑了点,但是时间紧,任务重,先用起来再说。

和解析代码合体之后,正常的运行情况应该是这样的:

运行

当然,还可以进一步改造,比如获取到网盘链接和提取码之后,直接使用 selenium 来自动控制浏览器打开相应的百度网盘页面,女朋友直接在页面选择文件点击下载即可。

但是今晚时间不够了,先让她用着。

总结

处理一个简单的需求,咱们就用到了正则、画界面,还可以使用浏览器模拟操作的 selenium ,可见平时的知识积累多重要。小伙伴们平时还是要有意识积累一些实用的技术,当需求来时方可信手拈来,而不是“书到用时方恨少”!

推荐阅读


Pandas处理数据太慢,来试试Polars吧!
懒人必备!只需一行代码,就能导入所有的Python库
绝!关于pip的15个使用小技巧
介绍10个常用的Python内置函数,99.99%的人都在用!
可能是全网最完整的 Python 操作 Excel库总结!

浏览 15
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报