卧槽，javaCV不到十行代码实现图片OCR文字识别_小言_互联网的博客

卧槽，javaCV不到十行代码实现图片OCR文字识别

2021-05-18 15:38 725人阅读评论(0)

spring boot项目pom文件中添加以下依赖


  
   
    
     
    
    
     		
      <!-- https://mvnrepository.com/artifact/org.bytedeco/javacv-platform -->
     
    
   
    
     
    
    
     		
      <dependency>
     
    
   
    
     
    
    
     			
      <groupId>org.bytedeco
      </groupId>
     
    
   
    
     
    
    
     			
      <artifactId>javacv-platform
      </artifactId>
     
    
   
    
     
    
    
     			
      <version>1.5.5
      </version>
     
    
   
    
     
    
    
     		
      </dependency>

单类代码实现，复制到idea编辑器里，右键run运行即可。

OCR方法参数说明，

1.lng 语言类型分为两种 1.eng 英语 2.chi_sim 中文简体

2.dataPath 语言数据集文件夹路径

3.imagePath 需要识别的图片文件路径


  
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      import org.bytedeco.javacpp.BytePointer;
     
    
   
    
     
    
    
     
      import org.bytedeco.leptonica.PIX;
     
    
   
    
     
    
    
     
      import org.bytedeco.leptonica.global.lept;
     
    
   
    
     
    
    
     
      import org.bytedeco.tesseract.TessBaseAPI;
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      public 
      class OcrTest {
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
         
      public 
      static 
      String OCR(
      String lng,
      String dataPath,
      String imagePath) {
     
    
   
    
     
    
    
     
              TessBaseAPI api=
      new TessBaseAPI();
     
    
   
    
     
    
    
             
      if (api.Init(dataPath, lng)!=
      0){
     
    
   
    
     
    
    
     
                  System.out.println(
      "error");
     
    
   
    
     
    
    
     
              }
     
    
   
    
     
    
    
     
              PIX image= lept.pixRead(imagePath);
     
    
   
    
     
    
    
             
      if (image==
      null){
     
    
   
    
     
    
    
                 
      return 
      "";
     
    
   
    
     
    
    
     
              }
     
    
   
    
     
    
    
     
              api.SetImage(image);
     
    
   
    
     
    
    
     
              BytePointer outText=api.GetUTF8Text();
     
    
   
    
     
    
    
             
      String result=outText.getString();
     
    
   
    
     
    
    
     
              api.End();
     
    
   
    
     
    
    
     
              outText.deallocate();
     
    
   
    
     
    
    
     
              lept.pixDestroy(image);
     
    
   
    
     
    
    
             
      return result;
     
    
   
    
     
    
    
     
          }
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
         
      public 
      static 
      void main(
      String[] args) {
     
    
   
    
     
    
    
            
      String text= OCR(
      "chi_sim", 
      "E:\\traineddata", 
      "C:\\Users\\tarzan\\Desktop\\image\\test5.png");
     
    
   
    
     
    
    
     
              System.out.println(text);
     
    
   
    
     
    
    
     
          }
     
    
   
    
     
    
    
     
      }