十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
本篇文章给大家分享的是有关Python如何爬取没有水印的抖音视频,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
成都创新互联公司-专业网站定制、快速模板网站建设、高性价比民丰网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式民丰网站制作公司更省心,省钱,快速模板网站建设找我们,业务覆盖民丰地区。费用合理售后完善,十余年实体公司更值得信赖。
使用更简单的方法
随便打开一个抖音个人主页,我选择的是爱奇艺体育,接着右键检查网页元素,点击network选项卡下的xhr选项,分析抓到的包
点到preview选项卡,点击video->download_addr->url_list
提取到这个网址的时候我以为已经结束了,但是一个大佬@金亭玉立给我发来了一篇文章提醒了我一些没有想到的东西,在此表示感谢!
我们接着往下看,在下面的play_addr下面也有一个链接,这个链接下面的视频就是无水印版本的视频
代码
import requests import json import jsonpath class Douyin: def page_num(self,max_cursor): #随机码 random_field = '00nvcRAUjgJQBMjqpgesfdNJ72&dytk=4a01c95562f1f10264fb14086512f919' #网址的主体 url = 'https://www.iesdouyin.com/web/api/v2/aweme/post/?sec_uid=MS4wLjABAAAAU7Bwg8WznVaafqWLyLUwcVUf9LgrKGYmctJ3n5SwlOA&count=21&max_cursor=' + str(max_cursor) + '&aid=1128&_signature=' + random_field #请求头 headers = { 'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36', } response = requests.get(url,headers=headers).text #转换成json数据 resp = json.loads(response) #提取到max_cursor max_cursor = resp['max_cursor'] #遍历 for data in resp['aweme_list']: # 视频简介 video_title = data['desc'] #使用jsonpath语法提取paly_addr video_url = jsonpath.jsonpath(data,'$..paly_addr') for a in video_url: #提取出来第一个链接地址 video_realurl = a['url_list'][1] # 请求视频 video = requests.get(video_realurl, headers=headers).content with open('t/' + video_title, 'wb') as f: print('正在下载:', video_title) f.write(video) #判断停止构造网址的条件 if max_cursor==0: return 1 else: douyin.page_num(max_cursor) if __name__ == '__main__': douyin = Douyin() douyin.page_num(max_cursor=0)
优点
这个方法的优点是可以省去很大一部分的分析网址的步骤,而且没有调用到webdriver(可以不限制浏览器),速度也会有显著提升,得到的视频也是无水印的
不足
还是没有解决随机生成字符串的问题,操作比较麻烦
以上就是Python如何爬取没有水印的抖音视频,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注创新互联行业资讯频道。