求帮忙解决编码问题

m8346***

#coding:utf8from bs4 import BeautifulSoupimport urllib2import reimport csvdef get_attractions(url,data=None): web_request = urllib2.urlopen(url) web_data = web_request.read().decode('gb2312') soup = BeautifulSoup(web_data,'html.parser') div_title = soup.find_all('div',class_="title") div_content = soup.find_all('div',class_="message") for d_title,d_content in zip(div_title,div_content): data = { 'div_title':d_title.get_text(), 'div_content':d_content.get_text() } for datas in list(data.values()): a=datas.replace('\n','') b=a.replace('\r','') c=b.replace(" ",'') print c return cdef write_data(data, name): file_name = name with open(file_name, 'wb') as f: f_csv = csv.writer(f) f_csv.writerows(data) url = 'http://liuyan.people.com.cn/list.php?fid=733'urls = ['http://liuyan.people.com.cn/list.php?fid=733&display=&total=112&page={}'.format(str(i)) for i in range(1,13,1)]for single_url in urls: datas = get_attractions(single_url)write_data(datas, 'liuyan.csv')

花***

是只有page6是乱码吗？

半***

要不你试试python3.X,对字符编码比python2好一些，python2和python3是不太兼容的，未来也是以新版本用的多吧

已有账号？

找人解决需求

求帮忙解决编码问题

全部参与2

热门问答

m8346***

今日需求悬赏

今日问答求助

发布任务需求已有1031288位用户正在使用天盟网服务

新手帮助

平台规则

关于天盟

一键快捷导航

微信公众号

手机客户端