使用朴素贝叶斯模型对邮件进行分类

您所在的位置：网站首页 › 使用朴素贝叶斯算法实现中文邮件分类 › 使用朴素贝叶斯模型对邮件进行分类

使用朴素贝叶斯模型对邮件进行分类

2024-07-13 20:08:34| 来源: 网络整理| 查看: 265

使用朴素贝叶斯模型对邮件进行分类原创

云҉淡҉风҉轻҉ 2021-07-21 16:13:56 ©著作权

文章标签 python 文章分类 Python 编程语言

©著作权归作者所有：来自51CTO博客作者云҉淡҉风҉轻҉的原创作品，请联系作者获取转载授权，否则将追究法律责任使用朴素贝叶斯模型对邮件进行分类https://blog.51cto.com/u_15309669/3154722 1.特征向量每一个有效词汇在邮件中出现的次数(使用一维列表方法) word 词汇出现的次数一维列表.count(word) 2.将列表转换为数组形式 array(参数) 创建垃圾邮件，正常邮件训练集 array(列表对象或表达式) 3.使用朴素贝叶斯算法 model = MultinomialNB() 4.进行训练模型 model.fit model.fit(array数组,array数组) 5.对指定 topWords 数据使用函数 map(lambda x:words.count(x),topWords) 6.预测数据 model.predict ,返回值为 0 或 1 result = model.predict(array数组.reshape(1,-1))[0] 7.查看在不同区间的概率 model.predict_proba(array数组.reshape(1,-1)) 8.条件语句，预测的结果便于区分 1 为垃圾邮件，0 为正常邮件 return "垃圾邮件" if result == 1 else "正常邮件" 程序： # 全部训练集中出现次数最多的前 600 个单词 topWords = getTopWords(600) vectors = [ ] for words in allWords: temp = list(map(lambda x:words.count(x),topWords)) # 获取前600个单词的出现的个数 vectors.append(temp) vectors = array(vectors) # 对训练集中的数据给定一个标签 # 0.txt~99.txt 为垃圾邮件,0 # 100~140 为有效邮件,1 labels = array([1] * 100 + [0] * 41) # 创建模型 model = MultinomialNB() model.fit(vectors,labels) # 训练样本数和标签 def predict(txtFile): words = getWordsFromFile(txtFile) # 获取有效字符 currentVector = array(tuple( lambda x:words.count(x),topWords )) # 查看有效词汇个数 result = model.predict(currentVector.reshape(1,-1))[0] # 查看预测的概率 print(model.predict_proba(currentVector.reshape(1,-1))) return "垃圾邮件" if result == 1 else "正常邮件"

2020-04-11

如果觉得文章不错，可以分享给其他人哟~ 赞收藏评论分享微博 QQ 微信

上一篇：获取全部 txt 文本中出现次数最多的前N个词汇

下一篇：函数进阶1

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

使用朴素贝叶斯模型对邮件进行分类

使用朴素贝叶斯模型对邮件进行分类

今日新闻

点击排行

推荐新闻

图片新闻

专题文章