快上网专注成都网站设计 成都网站制作 成都网站建设
成都网站建设公司服务热线:028-86922220

网站建设知识

十年网站开发经验 + 多家企业客户 + 靠谱的建站团队

量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决

怎么编写Python爬虫爬取B站小视频的源码

今天就跟大家聊聊有关怎么编写Python爬虫爬取B站小视频的源码,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

成都创新互联是一家专业提供大新企业网站建设,专注与做网站、成都做网站、H5页面制作、小程序制作等业务。10年已为大新众多企业、政府机构等服务。创新互联专业的建站公司优惠进行中。

如果要爬取多页的话 在最下方循环中 填写好循环的次数就可以了

项目源码

from fake_useragent import UserAgentimport requestsimport time
ua=UserAgent()

def downloader(url, path):    start = time.time()   # 开始时间    size = 0    headers = {        'User-Agent':ua.random    }    response = requests.get(url, headers=headers, stream=True)   # stream 属性必须带上    chunk_size = 1024    # 每次下载的数据大小    content_size = int(response.headers['content-length'])   # 总大小    if response.status_code == 200:        print('[文件大小]:%0.2f MB' % (content_size / chunk_size / 1024))   # 换算单位        with open(path, 'wb') as file:            for data in response.iter_content(chunk_size=chunk_size):                file.write(data)                size += len(data)   # 已下载的文件大小                print('\r' + '[下载进度]:%s%.2f%%' % ('>' * int(size * 50 / content_size), float(size / content_size *                                                                                             100)), end=" ")    end = time.time()    # 结束时间    print('\n' + '视频下载完成!用时%.2f秒' % (end - start))


def The_URL(page):    URL='http://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset={}&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc'.format(page)    headers={        'User-Agent':ua.random    }    sponse=requests.get(URL,headers=headers).json()    item=sponse.get('data').get('items')    for i in item:        ite=i.get('item')        #视频标题        Video_name=ite.get('description')
       #发布日期        Release_time=ite.get('upload_time_text')
       #视频下载地址        Video_download_link=ite.get('video_playurl')
       #视频作者        The_name=i.get('user').get('name')
       try:            print('当前下载的是:%s'%Video_name)            downloader(Video_download_link,path='%s.mp4'%Video_name)        except Exception as e:            print(e.args)
for i in range(0,100):    i=i*10+1    The_URL(i)

看完上述内容,你们对怎么编写Python爬虫爬取B站小视频的源码有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注创新互联行业资讯频道,感谢大家的支持。


网站题目:怎么编写Python爬虫爬取B站小视频的源码
URL分享:http://6mz.cn/article/gpohee.html

其他资讯