R语言:朴素贝叶斯算法实现对中文垃圾邮件的分类 | 您所在的位置:网站首页 › r语言朴素贝叶斯分类约会配对 › R语言:朴素贝叶斯算法实现对中文垃圾邮件的分类 |
在开始进行文本分类之前我们需要了解一下数据的基本情况以便我们理清数据处理的思路,这是非常重要的一步,对数据结构有了清晰的认识才能够事半功倍。数据获取:https://trec.nist.gov/data/spam.html,下载2006垃圾邮件语料库,其中的trec06c文件为本文中使用的数据 首先,我们导入一份邮件,来看看这份数据文件内的中文邮件长什么样子。 setwd("~/Desktop/R/python/email/trec06c") email_exm |
CopyRight 2018-2019 实验室设备网 版权所有 |