小言_互联网的博客

GitHub 热榜:这款超硬核的 OCR 开源工具,我给 99.99 分!

548人阅读  评论(0)

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

大家好,我是小 G。

近几年,各类线上办公软件层出不穷,OCR (Optical Character Recognition,光学字符识别)技术也开始被大部分人所知晓与应用。

此中,OCR 被应用最为广泛的,应该要属将图片、或纸质文件扫描成可编辑的电子版文件了。

之前我曾在网上找过不少工具,但大部分都是要收费的。作为一枚喜欢分享 GitHub 开源项目的博主,还是想尽力给大家找一些免费开源,用户友好度比较好的可替代软件。

上个月曾给大家推荐过百度在 GitHub 上开源的一款 OCR 文字识别工具 Panddle OCR,对于想研究具体技术底层原理的同学,这个项目值得一看。

https://github.com/PaddlePaddle/PaddleOCR

不过,今天我想另外推荐一款,相对比较成熟,也更偏向于小白用户的 OCR 工具:PandaOCR。

相较于其他工具,这个开源项目的功能要显得更为齐全与强大。

除了我们日常使用的图片、截图、剪切识别的功能之外,它还拥有智能翻译、朗读、弹窗预览、公式整合等功能。

界面相对于小白用户来说,也显得更为友好:

而除了集成上述功能之外,API 配置灵活也是其最大亮点之一。

例如,在文字识别一项,Panda OCR 便整合了百度飞桨、腾讯、搜狗、有道、阿里、网易等多个平台的接口。

在公式与表格识别、翻译及朗读引擎等位置,也同样可配置多方平台接口。

公式识别:

在此需要多说一句的是,部分平台的接口可能是收费的,大家可按自身需求来定制方案。

最后,放下该项目的 GitHub 地址,大家感兴趣的可前往查看。工具使用教程,可看作者提供的 wiki:

https://github.com/miaomiaosoft/PandaOCR/


转载:https://blog.csdn.net/sinat_33224091/article/details/111877968
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场