wordcloud库常规方法
w = wordcloud.WordCloud()
方法 | 描述 | 例子 |
---|---|---|
w.generate(txt) | 向wordcloud对象w中加载文本txt | >>>w.generate("Python and WordCloud") |
w.to_file(filename) | 将词云输出为图像文件,.png或.jpg格式 | >>>w.to_file("outfile.png") |
应用实例:
import wordcloud
w = wordcloud.WordCloud() #配置对象参数
w.generate("wordcloud by Python") #加载词云文本
w.to_file("pywordcloud.png") #输出词云文件
- 分隔: 以空格分隔单词
- 统计: 单词出现次数并过滤
- 字体: 根据统计配置字号
- 布局: 颜色环境尺寸
配置对象参数
w = wordcloud.WordCloud(<参数>)
参数 | 描述 | 例子 |
---|---|---|
width | 指定词云对象生成图片的宽度,默认400像素 | >>>w=wordcloud.WordCloud(width=600) |
height | 指定词云对象生成图片的高度,默认200像素 | >>>w=wordcloud.WordCloud(height=400) |
min_font_size | 指定词云中字体的最小字号,默认4号 | >>>w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定词云中字体的最大字号,根据高度自动调节 | >>>w=wordcloud.WordCloud(max_font_size=20) |
font_step | 指定词云中字体字号的步进间隔,默认为1 | >>>w=wordcloud.WordCloud(font_step=2) |
font_path | 指定文件字体的路径,默认None | >>>w=wordcloud.WordCloud(font_path="msyh.ttc") |
max_words | 指定词云显示的最大单词数量,默认200 | >>>w=wordcloud.WordCloud(font_step=2) |
stop_words | 指定词云的排除词列表,即不显示的单词列表 | >>>w=wordcloud.WordCloud(stop_words={"Python"}) |
mask | 指定词云形状,默认为长方形,需要应用imread()函数 | >>>from scipy.misc import imread >>>mk=imread("pic.png") >>>w=wordcloud.WordCloud(mask=mk) |
background_color | 指定词云图片的背景颜色,默认为黑色 | >>>w=wordcloud.WordCloud(background_color="white") |
应用实例:
- 英文(以空格分隔单词)
import wordcloud
txt = "life is short, you need python"
w = wordcloud.WordCloud(background_color = "white")
w.generate(txt)
w.to_file("pywcloud.png")
- 中文(中文需要先分词并组成空格分隔字符串)
import jieba
import wordcloud
txt = "程序设计语言是计算机能够理解和识别用户操作意图的一种交互体系,它按照特定规则组织计算机指令,使计算机能够自动进行各种运算处理。 "
w = wordcloud.WordCloud( width=1000,\
font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")