全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 825|回复: 8

[全球PDF论坛]扫描PDF的OCR问题

[复制链接]
发表于 2020-10-14 16:05:58 | 显示全部楼层 |阅读模式
扫描了一部分书 想OCR成那种可搜索PDF 用了ocrmypdf这个之后识别率一言难尽 白描的识别率很好 用的百度API 可惜不能做成可搜索PDF或者word 返回的是没有排版的文字 对于大量文档就很难用了 求大佬一个中文OCR识别率好的 因为扫描件 所以很多是倾斜 求一个好用的软件
发表于 2020-10-14 17:22:35 来自手机 | 显示全部楼层
百度API我用的最准,文字排版把标点符号和换行符简单复制替换就可以,一共就那几个标点
发表于 2020-10-14 16:20:15 来自手机 | 显示全部楼层
acrobat自带OCR功能,可以添加一层文字层,用作检索 复制 高亮
发表于 2020-10-14 16:11:00 | 显示全部楼层
abbyy试下。。。没扫过书,一般文字没问题
发表于 2020-10-14 16:18:53 来自手机 | 显示全部楼层
微软那个也试一下
发表于 2020-10-14 16:20:25 | 显示全部楼层
用Adobe的PDF软件转换为可搜索的PDF
 楼主| 发表于 2020-10-14 17:16:28 | 显示全部楼层
感谢各位大佬 我去试试
 楼主| 发表于 2020-10-14 19:23:50 | 显示全部楼层
杨过 发表于 2020-10-14 17:22
百度API我用的最准,文字排版把标点符号和换行符简单复制替换就可以,一共就那几个标点 ...

我里面还有图表 不止效果咋样
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-26 23:25 , Processed in 0.081218 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表