当前位置: 首页 > news >正文

网站建设定制单工地模板是什么材料做的

网站建设定制单,工地模板是什么材料做的,网站建设微盘下载,网站关键词密度在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行 下面,我们将使用urllib2的header部分伪造报头来实现采集信息 方法1、 #!/usr/bin/python -- coding: utf-8 -- #encodingutf-8 #Filename:urllib2-header.py import urllib2 import…

在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行

下面,我们将使用urllib2的header部分伪造报头来实现采集信息

方法1、
#!/usr/bin/python

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= “https://www.jb51.net”
send_headers = {
‘Host’:‘www.jb51.net’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’,
‘Accept’:‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,
‘Connection’:‘keep-alive’
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

sys.getfilesystemencoding()

html = html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

print ‘####################################’

print html

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

#抓取网页内容-发送报头-1
url= “https://www.jb51.net”
send_headers = {
‘Host’:‘www.jb51.net’,
‘User-Agent’:‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’,
‘Accept’:‘text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8’,
‘Connection’:‘keep-alive’
}

req = urllib2.Request(url,headers=send_headers)
r = urllib2.urlopen(req)

html = r.read() #返回网页内容
receive_header = r.info() #返回的报头信息

sys.getfilesystemencoding()

html = html.decode(‘utf-8’,‘replace’).encode(sys.getfilesystemencoding()) #转码:避免输出出现乱码

print receive_header

print ‘####################################’

print html
方法2、
#!/usr/bin/python

-- coding: utf-8 --

#encoding=utf-8
#Filename:urllib2-header.py

import urllib2
import sys

url = ‘https://www.jb51.net’

req = urllib2.Request(url)
req.add_header(‘Referer’,‘https://www.jb51.net/’)
req.add_header(‘User-Agent’,‘Mozilla/5.0 (Windows NT 6.2; rv:16.0) Gecko/20100101 Firefox/16.0’)
r = urllib2.urlopen(req)

html = r.read()
receive_header = r.info()

html = html.decode(‘utf-8’).encode(sys.getfilesystemencoding())

print receive_header
print ‘#####################################’
print html

#!/usr/bin/python

http://www.hyszgw.com/news/58110.html

相关文章:

  • 网站建设与设计表白代码
  • 做网站的越来越少了建设项目公示网
  • 自己做社交网站网页转微信小程序
  • 单位网站改版凡客v十商城
  • 可以做网站吗如何提高网站的点击率
  • 网站开发视频转码上海哪家装修公司好
  • 伊春网站制作长沙模板建站哪家好
  • 微信公众号可以做网站嘛网站开发提现功能
  • 视频聚合网站怎么做不侵权wordpress 新主题
  • 才艺多网站建设平台泉州仿站定制模板建站
  • 有机蔬菜网站是如何建设导视设计书籍
  • 用dw做网站怎么添加背景图片快速排名上
  • 规划网站站点需要遵循哪些原则徐州网站平台
  • wordpress 多用户主题重庆seo排
  • 现在主流的网站开发平台有哪些wordpress 开源主题
  • 陕西富通建设工程有限公司网站公司网站建设 宁波
  • 工作室网站需要备案吗黑科技引流推广神器
  • 外贸网站索引页多什么是网站建设从哪些方面建设网站
  • 哪个平台建网站比较好wordpress js插件
  • 多语言网站建设方案哪一个做网站模版好用的
  • 论坛与网站做优化哪个更好购物网站图片的放大怎么做的
  • 邯郸公司做网站公司网站建设佛山哪家
  • 中国建设部网站-玻璃幕墙国内crm系统哪家好
  • 建设好网站的在线沟通功能凡科网站做网站多少钱
  • 广州网站建设加盟传奇网站建设基本流程
  • 遵化市城乡建设规划局网站wordpress主题 建站
  • 简约型网站建设旅游网站的长图是怎么做的呀
  • 青岛网站商城设计航空公司网页设计
  • 网站编程学福州 网站设计公司
  • 网站跳转怎么做wordpress 扁平化 主题