(OCR技术)使用ChatGPT扣除图片中的文字 您所在的位置:网站首页 嘚瑟图片文字 (OCR技术)使用ChatGPT扣除图片中的文字

(OCR技术)使用ChatGPT扣除图片中的文字

2023-03-28 10:07| 来源: 网络整理| 查看: 265

1、下面的python的方法

使用 Python 的 OCR 扣除图片中的文字需要使用 OCR 库,常用的 OCR 库有 Tesseract、pytesseract、pyocr 等。

下面是一个使用 pytesseract 库扣除图片文字的示例代码:

import pytesseract from PIL import Image # 使用 pytesseract 库识别图片中的文字 text = pytesseract.image_to_string(Image.open('cookbook100K.jpg'), lang='chi_sim') print(text)

需要注意的是,需要先安装 pytesseract 库和 tesseract-ocr,并将 tesseract-ocr 的路径添加到环境变量中。还需要下载中文语言模型,在上面代码中,lang='chi_sim' 就是指定中文语言模型。

如果需要识别网络图片,需要使用urllib.request库

import urllib.request urllib.request.urlretrieve("https://download.ydstatic.com/ead/zhiyun/guanwang_cdn_2019/images/p-ocr/cookbook100K.jpg", "cookbook100K.jpg")

代码运行完成之后,识别出的文字将会打印在终端上,如果需要把结果发给你,可以使用邮件发送或接口上传。

2、下面是ChatGPT方法

问法:

给我使用python的ocr扣除图片中的文字,图片的地址是:https://download.ydstatic.com/ead/zhiyun/guanwang_cdn_2019/images/p-ocr/cookbook100K.jpg,我不要实现代码,直接把识别结果给我就行

图片地址1:https://www.baidu.com/img/bd_logo1.png

测试结果:

图片地址2:

https://download.ydstatic.com/ead/zhiyun/guanwang_cdn_2019/images/p-ocr/cookbook100K.jpg

测试结果:

很明显,ChatGPT也能做ocr,只是效果没那么好,比较ChatGPT的结果有的是NLP生成结果,所有在ocr结果上会有偏差,不过已经不错了。

其他参考:

解决方法:pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path

超轻量级中文ocr,支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M

https://github.com/DayBreak-u/chineseocr_lite

超详细解决pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in yo...



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有