GitHub 热榜：这款超硬核的 OCR 开源工具，我给 99.99 分！_小言_互联网的博客

2021-01-16 15:35 1079人阅读评论(0)

公众号关注 “GitHubDaily”

设为 “星标”，每天带你逛 GitHub！

大家好，我是小 G。

近几年，各类线上办公软件层出不穷，OCR （Optical Character Recognition，光学字符识别）技术也开始被大部分人所知晓与应用。

此中，OCR 被应用最为广泛的，应该要属将图片、或纸质文件扫描成可编辑的电子版文件了。

之前我曾在网上找过不少工具，但大部分都是要收费的。作为一枚喜欢分享 GitHub 开源项目的博主，还是想尽力给大家找一些免费开源，用户友好度比较好的可替代软件。

上个月曾给大家推荐过百度在 GitHub 上开源的一款 OCR 文字识别工具 Panddle OCR，对于想研究具体技术底层原理的同学，这个项目值得一看。

https://github.com/PaddlePaddle/PaddleOCR

不过，今天我想另外推荐一款，相对比较成熟，也更偏向于小白用户的 OCR 工具：PandaOCR。

相较于其他工具，这个开源项目的功能要显得更为齐全与强大。

除了我们日常使用的图片、截图、剪切识别的功能之外，它还拥有智能翻译、朗读、弹窗预览、公式整合等功能。

界面相对于小白用户来说，也显得更为友好：

而除了集成上述功能之外，API 配置灵活也是其最大亮点之一。

例如，在文字识别一项，Panda OCR 便整合了百度飞桨、腾讯、搜狗、有道、阿里、网易等多个平台的接口。

在公式与表格识别、翻译及朗读引擎等位置，也同样可配置多方平台接口。

公式识别：

在此需要多说一句的是，部分平台的接口可能是收费的，大家可按自身需求来定制方案。

最后，放下该项目的 GitHub 地址，大家感兴趣的可前往查看。工具使用教程，可看作者提供的 wiki：

https://github.com/miaomiaosoft/PandaOCR/

查看评论