• 手机版

    扫码体验手机版

  • 微信公众号

    扫码关注公众号

国内首家协议开发

软芯音视解码保护平台

在线
客服

发布
需求

在线
聊天

天盟
APP

天盟APP下载

关注
微信

微信扫一扫访问
顶部

请帮我看看这段爬取怎么错了

# coding=utf-8
def getHTMLlines(htmlpath):
         f=open(htmlpath,"r",encoding="utf-8")
         ls=f.readlines()
         f.close()
         return ls
def extractImageUrls(htmllist):
         urls=[]
         for line in htmllist:
                  if "img"in line:
                           url=line.split("src=")[-1].split('"')[1]
                           if "http"in url:
                                    urls.append(url)
         return urls
def showResults(urls):
         count=0
         for url in urls:
                  print("第{:2}个的URL:{}".format(count,url))
                  count +=1
def saveResults(filepath,urls):
         f=open(filepath,"w")
         for url in urls:
                  f.write(url+"\n")
         f.close()
def main():
         inputfile="F:/html/nationalgeographic.html"
         outfile="F:/html/ues.txt"
         htmlLines=getHTMLlines(inputfile)
         imageUrls=extractImageUrls(htmlLines)
         showResults(imageUrls)
         saveResults(outputfile,imageUrls)
main()

免责声明:本内容仅代表回答会员见解不代表天盟观点,请谨慎对待。

版权声明:作者保留权利,不代表天盟立场。

使用道具 举报

发新帖

发布任务需求已有1031167位用户正在使用天盟网服务

发布分类: *
任务预算: *
需求内容: *
手机号码: *
任务商家报价为
  • 预算价 :
  • 成交价 :
  • 完工期 :
  • 质保期 :

* 最终任务项目以服务商报价、双方协商为准!