中文街景店铺检测和识别数据集 | 您所在的位置:网站首页 › 中文文本检测 › 中文街景店铺检测和识别数据集 |
中文 Photo OCR
街景数据集ICDAR-ReCTS中文街景数据集CTWShopSign(中英文)
Baseline-scene text detectionCTPNTextBoxes++EASTConceptual Text Region Network: Cognition-Inspired Accurate Scene Text Detection
Baseline-scene text recognitionCRNNSliding CNN
Baseline-scene text detection and recognitionMask Textspotter
非受控场景的文字检测
国内外在中文场景图像文字识别的研究极少。究其原因,一是汉字类别庞大,在照片中进行文字识别的难度较大;二是中文场景图像数据集的缺乏。
一个场景文本识别系统通常由两个主要部分组成:场景文本检测器和识别器。前者以边界框的形式对图像中的字符/文本进行检测,而后者从边界框中裁剪的图像中识别文本(字符序列)。但也有一些尝试旨在以“端到端”的方式直接输出文本,即在单个神经网络(过程)中无缝集成场景文本检测和识别。 对于场景文本识别系统来说,端到端并不是强制性的,因为在某些情况下,场景文本检测器预测的边界框中检测到的图像块可能太模糊或太小而无法识别。然而,“端到端”方法的优点可能是内部反馈以及检测和识别模块之间的无缝交互。 街景数据集SVT、ICDR2013、ICDAR2015、COCO-Text、SynthText很少有包含中文文字/字符的图片。 中文数据集的主要有CTW、RCTW、ICPR 2018 MYWI(in 2017&2018)。RCTW (a.k.a CTW-12k)是ICDAR-2017 competition dataset for scene text detection and recognition,其包含12263张标注数据集。ICPR 2018 MYWI主要包含了网络图像的文本检测,不符合街景要求。 ICDAR-ReCTS美团本次公开的数据,由遍布全国的市场人员所拍摄的众多门脸招牌图片组成,共25000张。每张图片是由完全独立的不同个人,采用不同设备,在不同地点,不同时间和不同环境下所拍摄的不同商家。该数据集以中文文字为主,也包含一定数量的英文和数字,英文和数字的占比介于 10% 和 30% 之间。标注内容比较完备,每张图片均标注了单个字符的位置和文本,以及各字符串的位置和文本。是难得的用于研发和评估中文识别技术的数据集。其中,20000张图片用于训练,2000张用于验证,3000张用于测试。
注意:未公开数据集,联系邮箱获取 相关论文及资料: arxiv: ShopSign: a Diverse Scene Text Dataset of Chinese Shop Signs in Street Views. TITS-ShopSign: Street View Text Recognition With Deep Learning for Urban Scene Understanding in Intelligent Transportation Systems. Github: sample images and detailed descriptions. Google Drive: 1265 sample. TextBoxes、CTPN是水平文本检测的代表方法。 TextBoxes++、EAST是针对多方向文本检测的解决方案 CTPNarxiv: Detecting text in natural image with connectionist text proposal network.. TextBoxes++arxiv: Textboxes++: A single-shot oriented scene text detector. EASTarxiv: EAST: an efficient and accurate scene text detector. Conceptual Text Region Network: Cognition-Inspired Accurate Scene Text Detection
arxiv: An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition. Sliding CNNarxiv: Scene text recognition with sliding convolutional character models. Baseline-scene text detection and recognition Mask Textspotterarxiv: Mask textspotter: An end-to-end trainable neural network for spotting text with arbitrary shapes. . 非受控场景的文字检测
|
CopyRight 2018-2019 实验室设备网 版权所有 |