小言_互联网的博客

卧槽,javaCV不到十行代码实现图片OCR文字识别

285人阅读  评论(0)

spring boot项目pom文件中添加以下依赖 


  
  1. <!-- https://mvnrepository.com/artifact/org.bytedeco/javacv-platform -->
  2. <dependency>
  3. <groupId>org.bytedeco </groupId>
  4. <artifactId>javacv-platform </artifactId>
  5. <version>1.5.5 </version>
  6. </dependency>

 单类代码实现,复制到idea编辑器里,右键run运行即可。

OCR方法参数说明,

1.lng 语言类型 分为两种 1.eng 英语 2.chi_sim 中文简体

2.dataPath 语言数据集文件夹路径

3.imagePath 需要识别的图片文件路径


  
  1. import org.bytedeco.javacpp.BytePointer;
  2. import org.bytedeco.leptonica.PIX;
  3. import org.bytedeco.leptonica.global.lept;
  4. import org.bytedeco.tesseract.TessBaseAPI;
  5. public class OcrTest {
  6. public static String OCR( String lng, String dataPath, String imagePath) {
  7. TessBaseAPI api= new TessBaseAPI();
  8. if (api.Init(dataPath, lng)!= 0){
  9. System.out.println( "error");
  10. }
  11. PIX image= lept.pixRead(imagePath);
  12. if (image== null){
  13. return "";
  14. }
  15. api.SetImage(image);
  16. BytePointer outText=api.GetUTF8Text();
  17. String result=outText.getString();
  18. api.End();
  19. outText.deallocate();
  20. lept.pixDestroy(image);
  21. return result;
  22. }
  23. public static void main( String[] args) {
  24. String text= OCR( "chi_sim", "E:\\traineddata", "C:\\Users\\tarzan\\Desktop\\image\\test5.png");
  25. System.out.println(text);
  26. }
  27. }

测试样例结果

test1.jpg

test2.jpg

test3.jpg

test4.jpg

test5.jpg

相关文章推荐

JavaCV 将抖音小视频分割成图片帧图片和将图片合成小视频代码实现

需要 traineddata 语言训练数据集的可以关注我,私信获取。

也可以自行付费下载

https://download.csdn.net/download/weixin_40986713/18800645

 


转载:https://blog.csdn.net/weixin_40986713/article/details/116919640
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场