• 手机版

    扫码体验手机版

  • 微信公众号

    扫码关注公众号

国内首家协议开发

软芯音视解码保护平台

在线
客服

发布
需求

在线
聊天

天盟
APP

天盟APP下载

关注
微信

微信扫一扫访问
顶部

扫描的pdf文件要怎么能转化为图片?(用pyton)

pymupdf只能提取出文字清晰的pdf。
使用wand的时候有些pdf处理不了,会报图像出错的bug,那些wand处理的不了pdf几乎都是扫描的pdf。
判断扫描的pdf可能是文字不清晰,也可能是格式问题。不容易处理。
所以,想要把pdf转化为图片,然后再用ocr识别图片中的文字。
下面代码,用wand把pdf转化为图片,不过pdf为扫描文件的时候会报错CorruptImageError: unable to read image data
from __future__ import print_functionfrom wand.image import Image filePath="C:/Users/wt271/Downloads/康熙教子庭训格言.pdf"with Image(filename=filePath) as img:    print('pages = ', len(img.sequence))     with img.convert('png') as converted:        converted.save(filename='imagetest/page.png')

免责声明:本内容仅代表回答会员见解不代表天盟观点,请谨慎对待。

版权声明:作者保留权利,不代表天盟立场。

使用道具 举报

发新帖

发布任务需求已有1031167位用户正在使用天盟网服务

发布分类: *
任务预算: *
需求内容: *
手机号码: *
任务商家报价为
  • 预算价 :
  • 成交价 :
  • 完工期 :
  • 质保期 :

* 最终任务项目以服务商报价、双方协商为准!