正文:
Windows下PaddleOCR的C++编译并生成dll
1. 使用CMake编译PaddleOCR C++文件生成本地化工程文件
使用CMake编译PaddleOCR C++文件生成本地化工程文件
1.1 准备工作
1)安装CMake 3.18.0,Visual Studio 2019,OpenCV 4.5.1三个软件。
2)PaddleOCR 下载。
3)根据自己的CUDA和cuDNN版本,下载相应的Paddle官方提供的Windows预测库,我用的版本是paddle_inference.zip,其他版本未测试。
4) 推理模型库准备。
综上,将以上paddle OCR、预测库和模型放在同一文件夹中方便后续添加(无强制要求)。
1.2 CMake编译PaddleOCR
本人没有用到GPU,CUDA_LIB未填写,如需用到GPU需要填写CUDA地址。
CMake编译PaddleOCR可以参考Windows 下 PaddleOCR C++推理部署 cmake vs2017
2. C++生成DLL文件
CMake PaddleOCR在Configuring done和Generating done后,点击Open Project,即会自动用Visual Studio 2019打开本地化工程文件。建议:利用原始文件先生成ocr_system.exe测试一下,CMake后本地文件可用。
2.1 测试ocr_system.exe
右键–>仅用于项目–>仅生成ocr_system, 生成ocr_system.exe,打开cmd cd到Release目录下,可能会缺失paddle_fluid.dll和opencv_world451.dll动态链接库,从opencv和推理预测库中复制。cmd运行。
ocr_system.exe D:\paddle\PaddleOCR\deploy\cpp_infer\tools\config.txt D:\paddle\PaddleOCR\doc\imgs\1.jpg
在Windows下的终端中执行文件exe时,可能会发生乱码的现象,此时需要在终端中输入 CHCP 65001 ,将终端的编码方式由GBK编码(默认)改为UTF-8编码,更加具体的解释可以参考这篇博客:https://blog.csdn.net/qq_35038153/article/details/78430359。 ————————————————————
2.2 修改main.cpp 生成dll
右键–>属性 配置属性Release,平台x64,配置类型 动态库dll,比较坑的地方:更改完配置类型 动态库dll后,编译生成仅生成ocr_system还是生成的exe,后续更改了高级:目标文件扩展名。
#include "glog/logging.h"
#include "omp.h"
#include "opencv2/core.hpp"
#include "opencv2/imgcodecs.hpp"
#include "opencv2/imgproc.hpp"
#include <chrono>
#include <iomanip>
#include <iostream>
#include <ostream>
#include <vector>
#include <cstring>
#include <fstream>
#include <numeric>
#include <include/config.h>
#include <include/ocr_det.h>
#include <include/ocr_rec.h>
//#include"ocr.h"
using namespace std;
using namespace cv;
using namespace PaddleOCR;
/*
1.返回框选字体;
2.返回解析字符串
*/
extern "C" __declspec(dllexport) cv::Mat * LoadModel(char* input, int width, int height);
__declspec(dllexport) cv::Mat* LoadModel(char* input, int width, int height)
{
OCRConfig config("D:\\Paddle\\PaddleOCR\\deploy\\cpp_infer\\tools\\config.txt");
config.PrintConfigInfo();
//std::string img_path(argv[2]);
//cv::Mat srcimg = cv::imread(img_path, cv::IMREAD_COLOR);
cv::Mat srcimg(height, width, CV_8UC3, input);
DBDetector det(config.det_model_dir, config.use_gpu, config.gpu_id,
config.gpu_mem, config.cpu_math_library_num_threads,
config.use_mkldnn, config.max_side_len, config.det_db_thresh,
config.det_db_box_thresh, config.det_db_unclip_ratio,
config.visualize, config.use_tensorrt, config.use_fp16);
Classifier *cls = nullptr;
if (config.use_angle_cls == true) {
cls = new Classifier(config.cls_model_dir, config.use_gpu, config.gpu_id,
config.gpu_mem, config.cpu_math_library_num_threads,
config.use_mkldnn, config.cls_thresh,
config.use_tensorrt, config.use_fp16);
}
CRNNRecognizer rec(config.rec_model_dir, config.use_gpu, config.gpu_id,
config.gpu_mem, config.cpu_math_library_num_threads,
config.use_mkldnn, config.char_list_file,
config.use_tensorrt, config.use_fp16);
auto start = std::chrono::system_clock::now();
std::vector<std::vector<std::vector<int>>> boxes;
// 检测
cv::Mat ocrImage;
ocrImage= det.Run(srcimg, boxes);
// 识别
rec.Run(boxes, srcimg, cls);
auto end = std::chrono::system_clock::now();
auto duration =
std::chrono::duration_cast<std::chrono::microseconds>(end - start);
std::cout << "Cost "
<< double(duration.count()) *
std::chrono::microseconds::period::num /
std::chrono::microseconds::period::den
<< "s" << std::endl;
cv::Mat gray;
cv::cvtColor(srcimg, gray, COLOR_BGR2GRAY);
return new cv::Mat(ocrImage);
}
3. 使用C#编写界面调用DLL实现文字识别
将动态链接库libiomp5md.dll 、mkldnn.dll、mklml.dll、ocr_system.dll、opencv_world451.dll、paddle_fluid.dll 添加到c# 项目中.
using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using System.Runtime.InteropServices;
using OpenCvSharp;
using OpenCvSharp.XImgProc;
namespace WindowsFormsApp1
{
public partial class Form1 : Form
{
public Form1()
{
InitializeComponent();
}
[DllImport("ocr_system.dll", EntryPoint = "LoadModel", SetLastError = true, CharSet = CharSet.Ansi)]
static extern IntPtr LoadModel(byte[] input, int height, int width); //out IntPtr seg_res
private void button1_Click(object sender, EventArgs e)
{
string image_path = "D://Paddle//PaddleOCR//doc//imgs//1.jpg";
Bitmap bmp = new Bitmap(image_path);
//pictureBox1.Image = bmp;
int stride;
byte[] source = GetBGRValues(bmp, out stride);
IntPtr seg_img = LoadModel(source, bmp.Width, bmp.Height); //out seg_img
Mat img = new Mat(seg_img);
Bitmap seg_show = new Bitmap(img.Cols, img.Rows, (int)img.Step(), System.Drawing.Imaging.PixelFormat.Format24bppRgb, img.Data);
pictureBox1.Image = seg_show;
}
// 将Btimap类转换为byte[]类函数
public static byte[] GetBGRValues(Bitmap bmp, out int stride)
{
var rect = new Rectangle(0, 0, bmp.Width, bmp.Height);
var bmpData = bmp.LockBits(rect, System.Drawing.Imaging.ImageLockMode.ReadOnly, bmp.PixelFormat);
stride = bmpData.Stride;
var rowBytes = bmpData.Width * Image.GetPixelFormatSize(bmp.PixelFormat) / 8;
var imgBytes = bmp.Height * rowBytes;
byte[] rgbValues = new byte[imgBytes];
IntPtr ptr = bmpData.Scan0;
for (var i = 0; i < bmp.Height; i++)
{
Marshal.Copy(ptr, rgbValues, i * rowBytes, rowBytes);
ptr += bmpData.Stride;
}
bmp.UnlockBits(bmpData);
return rgbValues;
}
}
}
特别注意:
若是与工业相机连接,需要注意图像采集的通道数,PaddleOCR不支持四通道数据输入。如需使用需要将四通道转为3通道RGB。
提醒:部署相关问题请微信咨询 …
参考:
转载:https://blog.csdn.net/ch_ccc/article/details/113857304