python词云制作展示

2024-07-09 09:32| 来源: 网络整理| 查看: 265

之前是给大家展示了如何从豆瓣电影的网站上爬取电影评论信息，现在我们将展示如何基于‘豆瓣电影评论数据’绘制词云图。过程也不是很复杂，主要是帮助刚接触的朋友了解一下这块儿。首先，我们将上次所获取的《我和我的家乡》这部电影的短评数据信息存放到一个txt文件中，在这里插入图片描述即将这部分数据存放到MeAndmyHomeland.txt文件中，写入txt文件后大致是这种呈现形式，我就直接贴代码了，

# -- coding: utf-8 -- import matplotlib.pyplot as plt import jieba from wordcloud import WordCloud,STOPWORDS reviews=open(r'MeAndmyHomeland.txt','r').read() #读取影评数据 default_mode=jieba.cut(reviews) text=" ".join(default_mode) # wordcloud_mask=numpy.array(Image.open('home.png')) #设置词云背景图 stopwords=set(STOPWORDS) stopwords.add("said") wc=WordCloud( font_path=r'/Users/Shared/fonts/wqy-microhei.ttc', width=1500, height=1200, # max_font_size=30, random_state=50, #设置字体的配色方案 background_color='white', # max_words=2000, mask=wordcloud_mask, #设置词云图的背景图 stopwords=stopwords ) wc.generate_from_text(text) #生成词云 wc.to_file(r'home_wordcloud.png') #将词云图保存在本地 plt.figure('review')#设置python中图像展示框的名称 plt.imshow(wc,interpolation='bilinear') plt.axis("off") plt.show()

如果大家没有安装ieba库和wordcloud库，需要提前安装一下，可以在电脑的cmd窗口(windows系统电脑)或者mac中终端(mac系统电脑)使用pip3即python的包管理工具进行所需库的安装，安装命令为

pip3 install jieba pip3 install word cloud

说明：此处我的python版本是3.x, 所以其对应的包(库)管理工具就是pip3。此外，我还想说明一下程序中所使用到的几个python库。 jieba：“结巴”中文分词, 可以将中文的句子进行单词分割，多种分词模式，支持繁体、自定义词典。 WordCloud：通常和 jieba 结合使用，将分好的单词以图片的方式展示出来，根据单词出现的次数使单词突出。 STOPWORDS：停用词，‘对停用词进行过滤’是文本分析中一个预处理方法。它的功能是过滤分词结果中的噪声（例如：的、是、啊等)。因为这些词没有什么意义，而且还可能会影响文本分析的结果，所以使用‘停用词过滤’的方法。运行程序我们则可以看到运行后的‘词云效果’图，在这里插入图片描述除此之外，在项目的包中还会多一个名称为‘home_wordcloud.png’的词云图片，与上述代码中的‘wc.to_file(r'home_wordcloud.png') #将词云图保存在本地’代码相对应，正是这行代码使得词云图片可以保存在本地。如果大家在运行此‘词云生成’程序时有任何的问题，欢迎大家在评论区交流讨论！图片名称

【本文地址】

公司简介

联系我们