随着身体的一阵抖动,python 下载的抖音小姐姐都没味了-技术圈

文 | 某某白米饭

来源：Python 技术「ID: pythonall」

大伙都知道抖音上有非常多的漂亮小姐姐，说话又好听，皮肤又好。刷的都停不下来。

爬虫开始

首先将 google 浏览器在设置中将将重定向设置成否，再打开 F12 控制面板设置页面为 android 样式，如下图：

然后开始把抖音分享的地址，复制到地址栏。在控制面板的网络中，就可以找到那个 url，提取header 下的 location 与其中的 sec_uid。

import request
import re
import json
import os
import time

headers = {
    "user-agent": "Mozilla/5.0 (Linux; Android 6.0.1; Moto G (4)) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Mobile Safari/537.36"
}

#share  = '长按复制此条消息，打开抖音搜索，查看TA的更多作品。https://v.douyin.com/Rwauvh4/'
share = input('分享的链接：')

url = re.findall('(https?://[-A-Za-z0-9+&@#/%?=~_|!:,.;]+[-A-Za-z0-9+&@#/%=~_|]+)', share)[0]

resp = requests.get(url=url, headers=headers, allow_redirects=False)
location = resp.headers['location']

temp = location.split('&')
sec_uid = temp[4].split('=')[1]
print(sec_uid)

在控制面板中有一个 /web/api/v2/user/info/ 的地址，这个就是用户的个人资料。其中有需要的昵称，提取后创建文件夹。

url = "https://www.iesdouyin.com/web/api/v2/user/info/?sec_uid={}".format(sec_uid)
resp = requests.get(url, headers=headers)
userinfo = json.loads(resp.text)

name = userinfo['user_info']['nickname']

if os.path.exists(name) == False:
    os.mkdir(name)
os.chdir(name)

从响应面板中找到一个是 json 串返回值的，并且有视频标题的存在 /web/api/v2/aweme/post/，这个就是我们需要的。这里面包含了：视频的地址和标题。它有五个 post 参数：1. sec_uid，2. count 每次查询的视频个数，3. max_cursor：时间戳，4. _signature：标记，5. 还有一个隐藏的 min_cursor：最小的时间戳

year = [2020,2021,2022]
cursor = []
for y in year:
    for i in range(1,13):
        calc = str(y) + '-'+ str(i) + '-' + '01 00:00:00'
        timeArray = time.strptime(calc, "%Y-%m-%d %H:%M:%S")
        timeStamp = int(time.mktime(timeArray)) * 1000
        cursor.append(timeStamp)

for i in range(len(cursor) - 1):
    params = {
        "sec_uid": sec_uid,
        "count": 200,
        "min_cursor": cursor[i],
        "max_cursor": cursor[i+1],
        "_signature": "Sq1xlgAAK2.rxFYl7oQq7EqtcY"
    }


    url = 'https://www.iesdouyin.com/web/api/v2/aweme/post/?'

    resp = requests.get(url=url, params=params, headers=headers)
    data = json.loads(resp.text)
    awemenum = data['aweme_list']
    for item in awemenum:
        title = re.sub('[\/:*?"<>|]','-',item['desc'])
        url = item['video']['play_addr']['url_list'][0]
        print(title + ":" + url)

获取到视频列表后循环下载每个视频，并写入文件中。

with open(title + ".mp4", 'wb') as f:
    f.write(requests.get(url, headers=headers).content)
    print(title + "------------------下载完成")

总结

上班摸鱼下载，下班路上愉快的刷刷刷。觉得本文还可以的小伙伴，可以点个赞吗？

PS：公号内回复「Python」即可进入Python 新手学习交流群，一起 100 天计划！

老规矩，兄弟们还记得么，右下角的 “在看” 点一下，如果感觉文章内容不错的话，记得分享朋友圈让更多的人知道！

【代码获取方式】

识别文末二维码，回复：某某白米饭