爬虫爬取豆瓣数据时,python正则匹配url问题
https://movie.douban.com/subject/1291546/
上面是url,我写的匹配是:
re.compile(r'http?://.*/subject/.*/',re.S))网上测试结果也是匹配,但是,程序运行就是提取不出网址 |
免责声明:本内容仅代表回答会员见解不代表天盟观点,请谨慎对待。
版权声明:作者保留权利,不代表天盟立场。
|
|
|
|
re.compile(r'http?://.*/subject/.*/',re.S))是创建匹配规则。是否未使用?
例如:
patten=re.compile(r'http?://.*/subject/.*/',re.S))result=patten.findall(index.html)有很多匹配方法具体可以度娘一下 |
|
|
|
|