机器学习之手写数字图片数据处理及识别

您所在的位置：网站首页 › 手写识别是什么技术 › 机器学习之手写数字图片数据处理及识别

机器学习之手写数字图片数据处理及识别

2024-07-16 18:14:45| 来源: 网络整理| 查看: 265

目录标题背景实现过程简说图片预处理构建模型代码部分

背景

1.手写数字识别技术的含义手写数字识别(Handwritten Digit Recognition)是光学字符识别技术的一个分支，是模式识别学科的一个传统研究领域。主要研究如何利用电子计算机自动辨认手写在纸张上的阿拉伯数字。手写数字识别分为脱机手写数字识别和联机手写数字识别。本文主要讨论脱机手写数字的识别。随着信息化的发展，手写数字识别的应用日益广泛，研究高识别率、零误识率和低拒识率的高速识别算法具有重要意义。

2.手写数字识别技术的理论价值

由于手写数字识别本身的特点，对它的研究有重要的理论价值：

(1)阿拉伯数字是唯一被世界各国通用的符号，对手写体数字识别的研究基本上与文化背景无关，各地的研究工作者基于同一平台开展工作，有利于研究的比较和探讨。

（2) 手写数字识别应用广泛，如邮政编码自动识别，税表系统和银行支票自动处理等。这些工作以前需要大量的手工录入，投入的人力物力较多，劳动强度较大。手写数字识别的研究适应了无纸化办公的需要，能大大提高工作效率。

⑶由于数字类别只有 10 个，较其他字符识别率较高，可用于验证新的理论和做深入的分析研究。许多机器学习和模式识别领域的新理论和算法都是先用手写数字识别进行检验，验证理论的有效性，然后才应用到更复杂的领域当中。这方面的典型例子就是人工神经网络和支持向量机(Support Vector Machine)。

⑷手写数字的识别方法很容易推广到其它一些相关问题，如对英文之类拼音文字的识别。事实上，很多学者就是把数字和英文字母的识别放在一起研究的。

3.数字识别技术的难点

数字的类别只有 10 种，笔划简单，其识别问题似乎不是很困难。但事实上，一些测试结果表明，数字的正确识别率并不如印刷体汉字识别率高，甚至也不如联机手写体汉字识别率高，而只仅仅优于脱机手写体汉字识别。这其中的主要原因是：

⑴数字笔划简单，其笔划差别相对较小，字形相差不大，使得准确区分某些数字相当困难；

⑵数字虽然只有 10 种，且笔划简单，但同一数字写法千差万别，全世界各个国家各个地区的人都在用，其书写上带有明显的区域特性，很难做出可以兼顾世界各种写法的、识别率极高的通用性数字识别系统。

虽然目前国内外对脱机手写数字识别的研究已经取得了很大的成就，但是仍然存在两大难点：

一是识别精度需要达到更高的水平。手写数字识别没有上下文，数据中的每一个数据都至关重要。而数字识别经常涉及金融、财会领域，其严格性更是不言而喻。因此，国内外众多的学者都在为提高手写数字的识别率，降低误识率而努力。

二是识别的速度要达到很高的水平。数字识别的输入通常是很大量的数据，而高精度与高速度是相互矛盾的，因此对识别算法提出了更高的要求。

实现过程简说

首先，我们拿到了两个文件夹。

一个文件夹里的图片同来训练出一个分类器/模型另一个文件夹的图片对训练出的分类器/模型性能进行评估

图片预处理读取图片并打开图片灰度化，将其降噪转化为黑白两色保存新得到的图片创建数组存入图片和标签

图片预处理我没有采用二值化的方法，因为我的数字图片比较清晰吧，我觉得对于这些数字没有必要，根据实际情况吧，但二值化对于后面的预测还是有点点影响的

构建模型

算法选择以下列举三个算法代码都会实现（但选其中一个就可以了）

KNN算法逻辑回归算法卷积神经网络

构建模型，训练，对模型进行评分

代码部分

image_process.py

from PIL import Image import numpy as np import os, re import matplotlib.pylab as plt def get_img_names(path): file_names = os.listdir(path) img_names = [] for i in file_names: if re.findall('\d_\d+\.png', i) != []: img_names.append(i) return img_names def get_img_data(path): data = [] # 特征数据（图像数组） labels = [] # 目标(标签)数据 img = get_img_names(path) # print(img) img = np.array(img) # print(img.shape) n = int(img.shape[0] / 10) + 1 # 得到每个数字的图片数 for i in range(10): for j in range(1, n): img = Image.open(path + "%d_%d.png" % (i, j)) # 打开图片 # print(img) # img = img.resize((32, 32)) # 将图片化为32*32的 img = img.convert('RGBA') # "L"为灰度化 raw_data = img.load() # 得到图片的像素值 # 将其降噪并转化为黑白两色 for y in range(img.size[1]): for x in range(img.size[0]): if raw_data[x, y][0]

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

机器学习之手写数字图片数据处理及识别

机器学习之手写数字图片数据处理及识别

今日新闻

点击排行

推荐新闻

图片新闻

专题文章