快上网专注成都网站设计成都网站制作成都网站建设

成都网站建设公司服务热线：028-86922220

网站建设知识

十年网站开发经验 + 多家企业客户 + 靠谱的建站团队

量身定制 + 运营维护+专业推广+无忧售后，网站问题一站解决

python简单爬虫笔记

python模拟游览器爬取相关页面

创新互联公司2013年成立，是专业互联网技术服务公司，拥有项目网站建设、网站制作网站策划，项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命，1280元西宁做网站,已为上家服务,为西宁各地企业和个人服务,联系电话:18982081108

import urllib.request

url="https://blog.51cto.com/itstyle/2146899"

#模拟浏览器
headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
data=opener.open(url).read()

fh=open("D:/5.html","wb")
fh.write(data)
fh.close()

python爬取新闻网站并将文章下载到本地

import urllib.request
import urllib.error
import re
data=urllib.request.urlopen("http://news.sina.com.cn/").read()
data2=data.decode("utf-8","ignore")
pat='href="(http://news.sina.com.cn/.*?)">'
allurl=re.compile(pat).findall(data2)
for i in range(0,len(allurl)):
    try:
        print("第"+str(i+1)+"次爬取")
        thisurl=allurl[i]
        file="D:/pac/sinanews/"+str(i)+".html"
        urllib.request.urlretrieve(thisurl,file)
        print("-----成功-----")
    except urllib.error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)

python爬取月光博客文章下载到本地

import re
import urllib.request
import urllib.error

data=urllib.request.urlopen("http://www.williamlong.info/").read()
pat='rel="bookmark">(.*?)'
pat_url='class="post-title">

            
            
                        

            网页题目：python简单爬虫笔记            

            标题路径：http://6mz.cn/article/jodseg.html


    
        其他资讯
        
            
                    专业义乌抖音代运营
                

                    淮安全网短视频推广费,淮安全网短视频推广费
                

                    深圳短视频代运营广告
                

                    直播运营攻略，提升直播观众互动的方法与方法
                

                    找抖音探店拍照文案方法与注意事项



    
        
            免费获取网站建设与品牌策划方案报价
            *主要业务范围包括：高端网站建设， 集团网站建设(网站建设网站制作)找网站建设公司就上快上网。
            
                
                
                
                提交需求
            
        
    
    
        
            
                联系我们
                028-86922220
                手机：13518219792
                地址：成都市太升南路288号锦天国际A幢1002号
                
                24小时服务热线：400-028-6601
            
            
                网站建设服务
                网页设计
                网站制作
                网站开发
            
            
                网站推广服务
                营销网站建设
                百度快速排名
                整站网站推广
            
            
                网站运维服务
                基础维护
                网站改版
                网站维护
            
            
                FOLLOW US
                
                
                    微信二维码
                    微信二维码
                
            
        
        
            友情链接：
            眉山主机托管   网站定制   四川成都网站制作   成都导视系统设计   成都手机网站开发   达州电信机房   成都响应式网站   旅游网站建设方案   网站推广营销   成都网站建设           
    
    
        
            
                Copyright © 2022  成都快上网科技有限公司     成都网站建设公司-选网站建设公司快上网！国内专业的网站制作公司！
            
            
                All Rights Reserved 版权所有 蜀ICP备19037934号-11