实战 您所在的位置:网站首页 文档文字倾斜 实战

实战

2023-10-08 20:46| 来源: 网络整理| 查看: 265

导读

本文主要介绍使用OpenCV对扫描文本矫正的应用实例及详细实现步骤。

背景介绍

在使用打印机或扫描仪扫描文档时,由于摆放位置差异难免造成扫描文档的倾斜。本文将使用OpenCV将倾斜的文档矫正水平并去除黑边。

实现步骤

本文只针对包含大部分文字的文档做倾斜矫正,思路来源是大部分文字倾斜后同一行的也在同一条直线,通过拟合直线计算文本倾斜角度,然后旋转来实现文本倾斜矫正。

详细步骤:

① 加载倾斜图像

② 灰度转换+腐蚀+膨胀

③ Canny边缘检测 + 霍夫线变换检测直线

④ 计算直线角度中值作为最终的旋转角度,旋转图像

注意不建议用最值或平均值,因为霍夫线变换有可能拟合到异常角度直线,最值或均值会导致最终角度偏大或偏小,使矫正结果偏差较大。

为什么使用均值?大家可以结合中值滤波的概念来理解。

举例来说:霍夫线变换找到了10条直线,角度分别为:0°,5°,25°,26°,26°,28°,28°,30°,100°,150°。如果去最大值angle=150°,最小值angle=0°,平均值angle=41.8°,中值angle=27°,明显中值结果更准确,更符合直线拟合角度的统计特性,因为拟合直线结果中大部分直线拟合是准确的,这部分角度会集中在一起。当然,使用直方图统计,计算出现频率最多的角度范围更准确,大家可以自行尝试。

⑤ 去除边角黑边(使用漫水填充或轮廓删选方式)

⑥ 换两张图片测试

Python-OpenCV实现源码:

链接:https://pan.baidu.com/s/1fja5mvGjuw3X4eMtjiSX0g

提取码:5lon



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有