博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
做大数据分析的怎么可以不会这个?
阅读量:6706 次
发布时间:2019-06-25

本文共 1038 字,大约阅读时间需要 3 分钟。

  hot3.png

在这里插入图片描述 Overview: 0 引言 1 环境 2 模块准备 3 实现思路 4 小试牛刀 5 中试牛刀 6 总结

0 引言

词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文章的主旨。

1 环境

操作系统:Windows

Python版本:3.7.2

2 模块准备

本文涉及到的Python第三方模块,共计四个:分词模块jieba,文字云模块wordcloud,画图模块matplotlib,用来处理背景图片的模块scipy。这些模块均可通过pip方式进行安装: 在这里插入图片描述

模块的导入: 在这里插入图片描述

3 实现思路

准备好一份自己需要分析的文本材料,这里选用的是19年两会新鲜出炉的政府工作报告。我们首先得通过jieba模块对文本材料进行分词处理,然后对处理后的材料使用wordcloud文字云模块生成相应的词云图片即可。

当然了你可以选择一个背景图片,并以此为基础生成特定的云图,这时就用到了上面提到的另外两个模块scipy和matplotlib。

好了,思路有了,那就开始实践吧~

4 小试牛刀

小试牛刀章节教你仅用9行代码,来生成一个词云图,先欣赏下最终的效果图。

4.1 效果图

在这里插入图片描述

4.2 代码实现

制作云图的思路,上文已作说明,这些就不再赘述了,直接看代码,代码中已添加详细注释说明。 在这里插入图片描述 除去注释、导入模块占用的两行,剩下仅7行的代码,你来说说Python强大不?

小试牛刀不够牛?上面做出的云图不够完美?那就继续看下去,这里来实现一个定制图案的云图。

5 中试牛刀

我们这里有一张祖国地图,是否可以定制生成一个祖国版图样式的词云图呢? 在这里插入图片描述 答案是肯定的,只因为Python太强大,实现思路直接看代码。

5.1 代码实现

在这里插入图片描述在这里插入图片描述

5.2 效果图

在这里插入图片描述

6 总结

是不是又被强大的Python给震撼了?如引言所述,通过生成词云图,对文章中出现频率较高的“关键词”予以视觉化的展现,帮助读者快速领略文章的主旨,既方便又高效!

不过呢,不要高兴地太早,这里给大家暗暗地埋了几颗雷,词云图功能强大实用自不必说,但是若想正常的用起来,除了上面提到的在安装wordcloud模块时会遇到麻烦之外,还有更多的麻烦在等着大家。请关注后续Python排错集的系列文章。

关注公众号「Python专栏」,后台回复:zsxq09,获取本文全套代码

Python专栏二维码

转载于:https://my.oschina.net/u/1778027/blog/3032107

你可能感兴趣的文章
Oracle oledb 打包并集成到程序安装包(VC ADO訪问Oracle)
查看>>
Android Studio 中删除项目和项目找回------ Project Structure的使用
查看>>
ios开发动物园管理 继承多态的实现
查看>>
本地aar文件引用
查看>>
OpenID Connect 是什么?
查看>>
Zookeeper概念学习系列之zookeeper是什么?
查看>>
[转]Python中函数的值传递和引用传递
查看>>
SQL Server-数据库架构和对象、定义数据完整性
查看>>
mothur reverse.seqs 将序列反向互补
查看>>
mybatis一对多关联查询——(九)
查看>>
.NET Core 2.0和ASP.NET Core 2.0正式版抢先体验
查看>>
JAVA中string.replace()和string.replaceAll()的区别及用法
查看>>
mysql的时间函数整理
查看>>
raspberry pi 树莓派作为比特比矿机
查看>>
亲历H5移动端游戏微信支付接入及那些坑(四)——参考文档
查看>>
25个Linux相关的网站【转】
查看>>
ILMerge-GUI的使用
查看>>
小tips:JS中this操作执行像(object.getName = object.getName)()操作改变了this
查看>>
C语言的Socket编程例子(TCP和UDP)
查看>>
数组初始化
查看>>