python 爬虫


Python
·code问题:
1、从网上requests下来的网页怎么编码打印时不是乱码
2、文件读取和文件写入的时候怎么得到想要的编码(比如保存的json文件打开后,中文能够正常显示)
3、爬到的数据想保存到数据库,怎么设置都显示的不是中文,保存的过程是什么

感谢各位路过的大神,谢谢您的时间~
已邀请:

林应

赞同来自: LV_MX

  1. 通过response.encoding检查编码类型。打印乱码的话看你的命令行窗口默认编码是否与response的编码一致。
  2. 打开文件的时候指定encoding参数,确定与response的编码。response的编码与实际情况不一致的情况下,通过text.encode(response.encoding).decode(实际编码)获得正确文本。
  3. 说来话长,这篇答得很详细了:http://www.jianshu.com/p/53bb448fe85b

要回复问题请先登录注册

收藏七月在线,一起向大牛进阶

ctrl+D或command+D可以快速收藏哦~