python3.6中用beautifulsoup抓取网页内容时,关于lxml的错误
import requestsfrom bs4 import BeautifulSoupimport resum = 0r = requests.get('https://book.douban.com/subject/5299764/comments/')soup = BeautifulSoup(r.text, 'lxml')pattern = soup.find_all('p','comment-content')for item in pattern: print(item.string)pattern_s = re.compile(' |
免责声明:本内容仅代表回答会员见解不代表天盟观点,请谨慎对待。
版权声明:作者保留权利,不代表天盟立场。
|
|
|
|
`BeautifulSoup(r.text, 'lxml')`第二个参数 lxml 是一个 package,需要安装:pip install lxml |
|
|
|
|