用python实现识别图像中的文字

主要使用的是paddleocr库（一个基于PaddlePaddle的OCR（光学字符识别）库），安装这个库之前还需要安装其依赖项lmbd(是一个C库，用于存储键值对的数据库)，而安装lmdb，又需要安装一个名为patch-ng。

xiao-chong

2561人浏览 · 2024-06-03 19:49:16

xiao-chong · 2024-06-03 19:49:16 发布

环境配置

主要使用的是paddleocr库（一个基于PaddlePaddle的OCR（光学字符识别）库），安装这个库之前还需要安装其依赖项lmbd(是一个C库，用于存储键值对的数据库)，而安装lmdb，又需要安装一个名为patch-ng的Python模块，这是用于编译C库的必要工具，所以安装过程如下：

pip install paddlepaddle
pip install patch-ng
pip install lmdb
pip install paddleocr

实现代码

from paddleocr import PaddleOCR
#实例化OCR模型
ocr=PaddleOCR()

#识别图片中的文字
result=ocr.ocr('D:\\work_zxt\\code\\长恨歌.jpg')
# print('识别结果：',result)
with open('D:\\work_zxt\\code\\text.txt','w',encoding='utf-8') as file:
    for line in result:
        for word in line:
            text_line=word[-1] #提取出识别数据中的文字元组
            text=text_line[0]  #从文字元组中提取文字内容
            print("text:",text)
            file.write(text+'\n') #将文字内容写入文件中
print("文字写入成功！")

解释说明：其中word是一个列表，包含图中每一句的位置信息（通常是一个四元组，形式为 (xmin, ymin, xmax, ymax)），置信度（表示文字被正确识别的概率），文字内容，其他信息（文字的类型、语言等）