Python OCR 使用easyocr库将图片中的文章提取出来

您所在的位置：网站首页 › word提取图片中文字的图文教程 › Python OCR 使用easyocr库将图片中的文章提取出来

Python OCR 使用easyocr库将图片中的文章提取出来

2024-07-16 16:58:11| 来源: 网络整理| 查看: 265

Python OCR 使用easyocr库将图片中的文章提取出来初环境内容步骤一：安装easyocr库步骤二：导入必要的库步骤三：创建OCR阅读器对象步骤四：指定要识别的图片路径步骤五：执行OCR识别并提取文章内容步骤六：遍历识别结果并打印文章内容完整代码运行结果

EasyOCR是一个开源的Python库，专注于提供易用而准确的文字识别功能。它基于深度学习技术，使用了一种端到端的方法，能够在多种语言和字体下进行稳定的识别。

初

希望能写一些简单的教程和案例分享给需要的人

环境

Python 3.10.12 系统： ubuntu 22.04

内容

接下来我分享如何使用Python的easyocr库，将图片中的文字提取出来。

步骤一：安装easyocr库

首先，确保您已经安装了Python。接下来，我们需要安装easyocr库，可以通过以下命令在命令行中进行安装：

pip install easyocr 步骤二：导入必要的库

在您的Python脚本中，导入所需的库，其中包括我们即将使用的easyocr库：

import easyocr 步骤三：创建OCR阅读器对象

创建一个OCR阅读器对象，您可以选择要识别的语言。以下示例选择了中文和英文语言：

reader = easyocr.Reader(['ch_sim', 'en']) 步骤四：指定要识别的图片路径

将要进行OCR识别的图片放置在您选择的路径下，并将该路径赋值给变量image_path：

image_path = 'test.png'

确保将test.png替换为您实际的图片路径。

步骤五：执行OCR识别并提取文章内容

使用OCR阅读器对象的readtext方法读取图片中的文本，将识别结果存储在变量results中：

results = reader.readtext(image_path) 步骤六：遍历识别结果并打印文章内容

使用循环遍历results中的每个识别结果，然后打印出每个结果的文本内容：

for (bbox, text, prob) in results: print(text) 完整代码 # 导入所需库 import easyocr # 创建一个OCR阅读器对象，选择中文和英文语言 reader = easyocr.Reader(['ch_sim', 'en']) # 指定要进行OCR识别的图片路径 image_path = 'aaa.png' # 使用OCR阅读器对象读取图片中的文本 results = reader.readtext(image_path) # 遍历识别结果并打印文本内容 for (bbox, text, prob) in results: print(text) 运行结果

在这里插入图片描述

python3 a.py

在这里插入图片描述识别出来是这样：识别率还行，不过有些确实不是很正确。

盗理者玛龄7年企业员工 355 4954 1458 103万+ 原创屑#名总排名访问 1万+ 1770 788 241 1071 讧论

在sublime text 的效果：

在这里插入图片描述

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

Python OCR 使用easyocr库将图片中的文章提取出来

Python OCR 使用easyocr库将图片中的文章提取出来

今日新闻

点击排行

推荐新闻

图片新闻

专题文章