当前位置: 首页 > news >正文

北京小企业网站建设详情页设计方法

北京小企业网站建设,详情页设计方法,购物网名,腾讯云物联网开发平台网络爬虫过程中三种中文乱码的处理方案,希望对大家的学习有所帮助 一、思路 其实解决问题的关键点就是在于一点,就是将乱码的部分进行处理,而处理的方案主要可以从两个方面进行出发。其一是针对整体网页进行提前编码,其二是针对…

网络爬虫过程中三种中文乱码的处理方案,希望对大家的学习有所帮助

一、思路

其实解决问题的关键点就是在于一点,就是将乱码的部分进行处理,而处理的方案主要可以从两个方面进行出发。其一是针对整体网页进行提前编码,其二是针对局部具体中文乱码的部分进行编码处理。

二、分析

1、当出现网页编码为gbk,获取到的内容在控制台打印类似如下情况的时候:

ÃÀÅ® µçÄÔ×À ¼üÅÌ »ú·¿ ¿É°® С½ã½ã4k±ÚÖ½

虽然看上去控制台输出正常,没有报错, 但是输出的中文内容,却不是普通人能看得懂的。

2、当出现网页编码为gbk,获取到的内容在控制台打印类似

�װŮ�� ��Ů ˮ СϪ Ψ��
 这种情况下的话,就可以通过使用本文给出的三种方法进行解决,屡试不爽!

三、具体实现

1)方法一:将requests.get().text改为requests.get().content
我们可以看到通过text()方法获取到的源码,之后进行打印输出的话,确实是会存在乱码的,如下图所示。
在这里插入图片描述
此时可以考虑将请求变为.content,得到的内容就是正常的了。
在这里插入图片描述
2)方法二:手动指定网页编码
#手动设定响应数据的编码格式

response.encoding = response.apparent_encoding

如果觉得上面的方法很难记住,或者你可以尝试直接指定gbk编码也可以进行处理,如下图所示:
在这里插入图片描述 这个方法稍微复杂一些,但是比较好理解,对于初学者来说,还是比较好接受的。
如果觉得上面的方法很难记住,或者你可以尝试直接指定gbk编码也可以进行处理,如下图所示:
在这里插入图片描述
上面介绍的两种方法都是针对网页进行整体编码,效果显著,接下来的第三种方法就是针对中文局部乱码部分使用通用编码方法进行处理。

3)方法三:使用通用的编码方法

img_name.encode('iso-8859-1').decode('gbk')

在这里插入图片描述

http://www.hyszgw.com/news/63361/

相关文章:

  • 无锡网站开发公司电话书法网站建设
  • 北京开发网站建设重庆ppt制作
  • 个人网站备案条件太原市做网站公司
  • 查网站是否正规网站开发广告宣传语
  • 网站微信收款二维码怎么做中信建设有限责任公司国内区事业部招聘
  • 买了个网站后怎么做中小型网站建设咨询
  • 网站开发协议模板中盛客户管理软件
  • 公司网站修改方案教学网站开发代码
  • 海珠建网站多少钱毕业视频代做网站
  • 旅游网站开发方案ppt团购网站大全做相册
  • 西宁房地产网站建设跨境电商个人可以开店吗
  • 可以建网站的公司wordpress修改主题版权
  • 网络公司建设网站硬件开发工程师面试
  • 个人免费自助建站迅 网站 模板
  • 网站搭建公司排行榜wordpress英文博客主题
  • 帝国cms 网站描述的全局变量做高仿表网站容易被k吗
  • 基于php房产网站开发青岛平台公司
  • 国家建设人才网站成都市建网站公司
  • 用word做旅游网站安徽建网站
  • 自己 做网站学什么 平面设计怎么开网店
  • 网站安全建设目的是什么wordpress 自定义页面插件
  • 网站用户群纪念馆展厅设计
  • 个人网站设计 优帮云海外推广什么意思
  • 有源码做网站南宁关键词排名公司
  • 有限公司网站建设 中企动力佛山免费培训seo
  • 我要表白网站idc数据中心排名
  • 织梦图片自适应网站源码网站排名查询软件alexa
  • 外贸网站建设公司流程万能浏览器手机版下载安装2022
  • 网站建设多少价格wordpress 分词插件
  • 台州建设网站做參考資料的网站