需要把一堆照片、扫描件里的文字快速转成可编辑文本时,很多在线工具要上传文件,用起来不太安心,本地方案又往往太重。OCRmyPDF是一个专门处理PDF文字识别的开源工具,目标很单一,就是把扫描型PDF变成可搜索、可复制的文件。项目地址:github.com/ocrmypdf/OCRmyPDF主要功能1.对扫描版PDF进行文字识别,不破坏原排版;2.生成带隐藏文字层的PDF,外观不变但可搜索;3.支持多语言识别,适合资料类文件;4.可批量处理,适合一次性整理大量文件;5.本地运行,不需要上传文件;OCRmyPDF不追求可视化界面,更像一个安静干活的工具,适合偶尔需要整理合同、资料或老文档的人,用完就关,不打扰。
