python词云制作展示 您所在的位置:网站首页 我和我的家乡第一出品方 python词云制作展示

python词云制作展示

2024-07-09 09:32| 来源: 网络整理| 查看: 265

之前是给大家展示了如何从豆瓣电影的网站上爬取电影评论信息,现在我们将展示如何基于‘豆瓣电影评论数据’绘制词云图。过程也不是很复杂,主要是帮助刚接触的朋友了解一下这块儿。 首先,我们将上次所获取的《我和我的家乡》这部电影的短评数据信息存放到一个txt文件中, 在这里插入图片描述 即将这部分数据存放到MeAndmyHomeland.txt文件中,写入txt文件后大致是这种呈现形式, 在这里插入图片描述 我就直接贴代码了,

# -- coding: utf-8 -- import matplotlib.pyplot as plt import jieba from wordcloud import WordCloud,STOPWORDS reviews=open(r'MeAndmyHomeland.txt','r').read() #读取影评数据 default_mode=jieba.cut(reviews) text=" ".join(default_mode) # wordcloud_mask=numpy.array(Image.open('home.png')) #设置词云背景图 stopwords=set(STOPWORDS) stopwords.add("said") wc=WordCloud( font_path=r'/Users/Shared/fonts/wqy-microhei.ttc', width=1500, height=1200, # max_font_size=30, random_state=50, #设置字体的配色方案 background_color='white', # max_words=2000, mask=wordcloud_mask, #设置词云图的背景图 stopwords=stopwords ) wc.generate_from_text(text) #生成词云 wc.to_file(r'home_wordcloud.png') #将词云图保存在本地 plt.figure('review')#设置python中图像展示框的名称 plt.imshow(wc,interpolation='bilinear') plt.axis("off") plt.show()

如果大家没有安装ieba库和wordcloud库,需要提前安装一下,可以在电脑的cmd窗口(windows系统电脑)或者mac中终端(mac系统电脑)使用pip3即python的包管理工具进行所需库的安装,安装命令为

pip3 install jieba pip3 install word cloud

说明:此处我的python版本是3.x, 所以其对应的包(库)管理工具就是pip3。 此外,我还想说明一下程序中所使用到的几个python库。 jieba:“结巴”中文分词, 可以将中文的句子进行单词分割,多种分词模式,支持繁体、自定义词典。 WordCloud:通常和 jieba 结合使用,将分好的单词以图片的方式展示出来,根据单词出现的次数使单词突出。 STOPWORDS:停用词,‘对停用词进行过滤’是文本分析中一个预处理方法。它的功能是过滤分词结果中的噪声(例如:的、是、啊等)。因为这些词没有什么意义,而且还可能会影响文本分析的结果,所以使用‘停用词过滤’的方法。 运行程序我们则可以看到运行后的‘词云效果’图, 在这里插入图片描述 除此之外,在项目的包中还会多一个名称为‘home_wordcloud.png’的词云图片,与上述代码中的‘wc.to_file(r'home_wordcloud.png') #将词云图保存在本地’代码相对应,正是这行代码使得词云图片可以保存在本地。 如果大家在运行此‘词云生成’程序时有任何的问题,欢迎大家在评论区交流讨论! 图片名称



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有