visionpro软件的OCRMaxTool参数详解 您所在的位置:网站首页 ocr工具使用方法 visionpro软件的OCRMaxTool参数详解

visionpro软件的OCRMaxTool参数详解

2023-09-11 05:43| 来源: 网络整理| 查看: 265

OCRMax工具编辑控件为CogOCRMaxTool工具提供了图形用户界面,您可以使用该界面来读取8位灰度图像中的单个字符串。 下图显示了对字符串进行分类后的OCRMax工具编辑控件:

在这里插入图片描述 编辑控件提供以下功能:

1.左上方的控制按钮行提供对最常用操作的访问。

2.一组功能选项卡使您可以构建OCRMax字体,设置分段参数,并可以选择指定要验证的全部或部分字符串。

3.图像显示窗口显示获取的图像和结果图形。

要将编辑控件包含在自定义视觉应用程序中,必须首先将其添加到Visual Studio .NET开发环境中。 有关更多信息,请参见将编辑控件添加到Visual Studio主题。

Tune Tab

使用“ Tune”选项卡构建OCRMax字体,并使用该工具支持的自动调整功能来自动确定最佳的分割参数,以识别连续图像中的字符。 下图显示了一个“ Tune”选项卡示例:

在这里插入图片描述 使用“ Tune”选项卡构建字体并自动调整分段参数是可选的。 您可以使用“字体”选项卡来构建字体,但是请注意,“字体”选项卡不提供自动调整支持,您必须使用“Segment tab”选项卡来手动设置细分参数。

提取线(extract line)

允许OCRMax工具检查感兴趣的区域,并尝试使用当前的分割参数集将区域分割为正确的字符符号。

运行时提取 (extract on run)

允许该工具每次运行时都对感兴趣区域执行细分。

预期文字 (expected text)

输入包含当前图像感兴趣区域的字符串。

自动分段 (auto-Segment)

使用“预期文本”中的字符作为参数对感兴趣的区域执行分割。

添加和调整 (add& tune)

将当前在感兴趣区域中标识的字符添加到此OCRMax工具的字体中,然后根据当前图像的特征设置分割参数。康耐视建议使用5到15张图像来自动调整分割参数。

tune data

显示当前用于分段参数自动调整的所有调整记录。有关更多信息,请参见使用调音数据一节。

Segment Tab

使用细分选项卡可以手动选择最佳参数,以将字符与背景分开,以及将字符彼此分开。 康耐视建议使用“调整”选项卡中支持的自动调整功能,并允许该工具自动确定那些细分设置。 有关为您的视觉应用程序获取的图像修改哪些参数的详细信息,请参阅选择分段参数主题。

下图显示了一个示例细分选项卡:

在这里插入图片描述

字符最小宽度 (CharacterMinWidth)

字符必须具有的字符标记矩形的最小宽度(以像素为单位)才能被报告

字符最大宽度 (CharacterMaxWidth)

字符标记矩形的最大允许宽度,以像素为单位。大于此值的字符将被拆分为不太宽的部分

极性 (Polarity)

输入图像中字符的极性。如果极性未知,则将自动确定极性

字符最小高度 (CharacterMinHeight)

要报告的字符必须具有的字符标记矩形的最小高度(以像素为单位)

字符最大高度 (CharacterMaxHeight)

字符标记矩形的最大允许高度,以像素为单位。该值有两种使用方式。首先,在找到整条线时使用此值,例如拒绝垂直相邻的噪声和/或垂直相邻字符的其他行。第二,高度超过此值的单个字符将被修剪以满足该高度。

SpaceInsertMode

插入模式,指定如何处理将空格字符插入其他字符之间的间隙

SpaceMinWidth

空格字符的最小宽度,以像素为单位

SpaceMaxWidth

空格字符的最大宽度,以像素为单位。

CharacterMinAspect

字符的最小允许宽高比,其中宽高比定义为整个字符行的高度除以字符标记矩形的宽度。纵横比小于此值(即宽度太大)的字符将被拆分为不太宽的部分。

归一化模式 (Normalizationmode)

用于规范输入图像的方法。选择正确的值可以减少工具的执行时间。

CharacterMinNumPels

要报告的字符必须具有的前景(即文本)像素的最小数量

分析模式 (AnalysisMode)

是执行最小分析还是标准分析。最小分析根据此标签中设置的参数执行简单的细分,而标准分析则对整个行进行分析,包括字符间距,以确定最佳分割。

最小字符间隙 (MinIntercharacterGap)

两个字符之间可能出现的最小间距(以像素为单位)。如果两个片段之间的间隔小于此片段,则除非组合字符太宽(由CharacterMaxWidth和/或CharacterMinAspect指定),否则必须将它们视为同一字符的一部分。间隔是从一个字符的标记矩形的右边缘到下一个字符的标记矩形的左边缘测量的。

MaxIntracharacterGap

单个字符内可能出现的最大间隙尺寸(以像素为单位),即使是损坏的字符也是如此。字符间的间隙可能会出现,例如,在点矩阵打印中连续的点列之间,或在两个因刮擦而损坏的实心字符之间。大于此值的任何间隙将始终被解释为两个单独字符之间的间隔,而小于或等于此值的间隙可以被视为两个单独字符之间的间隔或单个字符内的间隔。

节距 (pitchMetric)

用于指定字符间距的度量。注意,间距是相邻字符上(大约)相应点之间的距离,而不是从一个字符的结尾到下一个字符的开头的距离(称为“字符间距”)。还应注意,指定音高度量并不一定意味着所测得的音高值将保持恒定。

音高类型 (pitchtype)

各个音高值如何变化?音高值是按照音高度量标准指定的。

宽度类型 (widthtype)

字体中字符的宽度应如何变化。请注意,字符宽度是标记矩形(例如,墨水的边界框)的宽度,而不是单元矩形(通常包括标记矩形周围的填充)的宽度。

最小间距 (MinPitch)

可能出现在两个字符之间的最小间距(以像素为单位),其中间距是由间距度量指定的。如果两个片段之间的间距小于此片段,则除非组合字符太宽(如CharacterMaxWidth和/或CharacterMinAspect所指定),否则必须将它们视为同一字符的一部分。

角度半范围 (AngleHalfRange)

角度搜索范围的一半(弧度)。

偏斜半范围 (SkewHalfRange)

倾斜搜索范围的一半(弧度)。

太空得分模式 (SpaceScoreMode)

分数模式,指定如何处理空格字符的分数。

前景阈值片段 (ForeqroundThresholdFrac)

范围为[0,1]的修饰符,用于计算归一化图像中的二值化阈值,该值在前景和背景之间进行二值化。

UseStrokeWidthFilter

是否从标准化图像中删除所有看起来与图像其余部分具有相同笔画宽度的东西。例如,如果字符似乎通过细小的噪声条纹相互连接,这将很有用。但是,如果笔划宽度不一致,则使用笔划宽度过滤器可能会错误地删除实字符。

忽略边界片段 (IngoreBorderFragments)

是否完全忽略接触ROI边界的任何片段。对于非文本功能(例如可能包含在ROI中的标签边缘),忽略此类片段可能很有用。

CharacterMinNumPels

要报告的字符必须具有的前景(即文本)像素的最小数量。

CharacterFragmentMinXOverlap

两个字符片段必须在x方向上相互重叠的最小分数,以便将两个片段视为同一字符的一部分。

CharacterFragmentContrastThreshold

相对于二值化阈值,片段必须具有的最小对比度(在归一化图像灰度级中),以便考虑可能包含在字符中。

CharacterFragmentMaxDistanceToMainLine

获取/设置范围为[0,1]的修饰符,这是一个片段在字符主行之外可以具有的最大距离,以估计行高的百分比表示。

CharacterFragmentMergeMode

获取/设置用于确定在Group阶段是否将两个片段合并为一个字符的模式。

Font Tab

使用“字体”选项卡构建OCR字体。 OCRMax工具是基于图像的字体工具,需要您从样本图像中构建OCR字体。 下图显示了一个示例字体选项卡:

在这里插入图片描述 在将字符添加到OCR字体之前,必须正确分割示例图像中的字符。 使用“音调”选项卡确定正确的细分参数。 如上图所示,这些字符已正确分割,可以添加到OCR字体中。

执行以下步骤,将分段图像中的字符添加到OCR字体:

1.单击提取字符。

2.在提取的字符下方的文本行中输入每个字符的名称。

3.单击添加选定的或全部添加以将字符添加到您的OCR字体。该工具可让您拥有任意字符的多个实例。 在您训练它来定位在已知实例中可能看起来已损坏的角色的情况下,使用多个实例可以补偿该工具,但是具有相同角色的多个实例会增加该工具的执行时间。

使用“加载”和“保存”按钮分别加载现有的OCR字体文件或保存当前文件。启用“运行时训练”可使该工具在每次执行该工具时训练OCR字体文件,或者禁用此选项并使用“训练”来使用当前字符实例集训练OCR字体。

Run Params Tab

使用“运行参数”选项卡设置运行参数。 下图显示了样本“运行参数”选项卡:

在这里插入图片描述 接受阈值 (AcceptThreshold) 接受门槛有关何时提高或降低接受阈值的说明,请参阅OCRMax工具主题。

置信度阈值 (ConfidenceThreshold)

置信度阈值有关何时升高或降低置信度阈值的描述,请参阅OCRMax工具主题。

CogOCRMaxClassifierAlgorithmConstants

用于分类的算法。基本选项可用于现有应用程序。 BasicFast选项是默认选项,适用于大多数应用程序。

未知字符标记 (UnknownCharacterMarker)

一个字符串,将用于标识此工具生成的结果字符串中的未知字符代码。

超时 (timeout)

获取或设置此工具使用的超时值(以毫秒为单位)。

UseXScaleFilter

是否使用x比例滤镜。X尺度过滤器范围的低值,用于跳过其校正的训练图像的X大小(即宽度)超出此处指定范围的候选类别/实例。 x比例尺过滤范围的高值,用于跳过其校正的训练图像的y尺寸(即宽度)超出此处指定范围的候选类别/实例。

UseYScaleFilter

是否使用y比例过滤器。y缩放过滤器范围的低值,用于跳过其校正的训练图像的y尺寸(即高度)超出此处指定范围的候选类/实例。 y缩放过滤器范围的高值,用于跳过其校正的训练图像的y尺寸(即高度)超出此处指定范围的候选类/实例。

Region Tab

使用“区域”选项卡可以细化字符串感兴趣区域的类型和大小。 下图显示了默认的“区域”选项卡:

在这里插入图片描述

地区 (region) 获取或设置可选区域,该区域确定工具在哪里寻找文本。

使用其他参数可以在运行时设置输入图像的选定空间,并为该区域指定精确大小。 所有相关字符结果均以所选空间为单位指定。

Fielding Tab

如“ OCRMax工具”部分中所述,使用“字段”选项卡使用该工具的可选字段功能。 下图显示了一个示例“字段”选项卡:

在这里插入图片描述

有关字段的完整说明,请参见主题OCRMax工具,有关其使用示例,请参阅主题使用OCRMax工具。

字段字符串 (FieldString)

获取或设置指定期望字符的字符串。该字符串可以选择包含与字段定义别名相对应的字符。

字段定义(FieldingDefinitions)

获取或设置此OCRMax工具的字段定义集合。存在许多预定义的别名供您启用,也可以定义自己的定义。

忽略无域空间 (ignoreUnfieldedSpaces)

获取或设置是否忽略/跳过输入字符串中的空格,其中那些字符设置的相应字段设置不允许空格。默认为true。

混淆度量 (ConfusionMetric)

设置调遣过程将如何确定混乱。从中选择:

1.OnlyFieldedCharacters:字符的置信度得分是通过将其总体得分与字体中与该位置匹配的所有其他字符的总体得分相比较而得出的。

2.AllCharactersInFont:字符的置信度得分是通过将其总体得分与字体中所有其他字符的总体得分相比较得出的。

可变长度

设置字段操作是否以可变长度模式运行。 如果未设置,则该工具以定长模式运行。 固定长度模式要求分类器结果完全匹配字段字符串,而可变长度允许匹配字段字符串的部分子集。 为变长字符串指定以下参数:

最小长度 最大长度 FirstIndexMax LastIndexMin

Graphics Tab

使用“图形”选项卡选择该工具将在LastRun.InputImage缓冲区中显示的工具图形。 下图显示了默认的“图形”选项卡:

在这里插入图片描述

显示结果图形 在LastRun.InputImage中显示每个分类字符的标记矩形和标签。

显示输入图像

确定是否将输入图像记录为诊断记录的一部分,以及将图像复制到记录还是作为参考保存在记录中。

显示地区

支付LastRun.InputImage中的感兴趣区域。

显示整流线图像

显示感兴趣区域内图像的区域,并去除任何旋转和倾斜,以及每个分类字符的标记矩形和字符名称。

主线

显示最初由分割过程检测到并假定包含大多数字符像素的仿射矩形。

显示归一化整流线图像

在图像归一化后,显示感兴趣区域内的区域,并去除所有旋转和偏斜,并为每个分类字符标记矩形和字符名称。

主线展开

显示通过分割过程最初检测到并放大以合并部分包含的片段的仿射矩形。

显示归一化整流二值化线图像

在图像归一化后,显示感兴趣区域内的二值化区域,并消除任何旋转和倾斜,并为每个分类字符标记矩形和字符名称。

图形选项卡还支持一组图形选项,这些选项显示分段过程的结果:

初始片段

在拒绝任何片段或将其拆分/合并为其他片段之前,请显示片段的初始集合。

拒绝碎片

显示由于不满足分段程序参数中设置的一个或多个限制而被立即拒绝的片段。

最终片段

初始片段处理完成后显示字符片段; 然后将最终的字符片段分组为字符。

初始字符

显示初始字符,这些字符是将最终片段分组或分割为字符的结果。

拒绝字符

显示最初形成后被拒绝的任何字符 最终角色 显示最终的字符分组。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有