自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。因此,自然语言处理是与人机交互的领域有关的。
在自然语言处理面临很多挑战,包括自然语言理解,因此,自然语言处理涉及人机交互的面积。在NLP诸多挑战涉及自然语言理解,即计算机源于人为或自然语言输入的意思,和其他涉及到自然语言生成。
本文作为自然语言处理的一部分,做出好看的词云图一共有七步,下面随我一起边欣赏、边实践。
一、导入标准库
conda install jieba
conda install wordcloud
conda install PIL #安装生成词云的依赖包和运行环境
import matplotlib.pyplot as plt #数学绘图库import jieba #jieba分词库from wordcloud import WordCloud,ImageColorGenerator #词云库from PIL import Image #图像处理标准库import numpy as np #数据科学计算的核心库
二、读取文本数据
text = open(r'C:\Users\Administrator\Desktop\词云图\词云.txt',"r",encoding="utf-8").read() #读入txt文本数据print(text)
三、使用jieba分词,将汉语按照语言结构分开
lyrics = jieba.cut(text) #使用jieba分词txt = "/".join(lyrics)print(txt)
四、自定义背景图
image = Image.open(r'C:\\Users\\27342\\Desktop\\图片.jpg') #初始化自定义背景图graph = np.array(image) #图像数据化
五、产生词云图
wc = WordCloud(font_path = r"C:\\Users\\27342\\Desktop\\微软雅黑.ttf",background_color='white',max_font_size=80,mask=graph)wc.generate(txt) #导入字体
六、设置文字颜色、背景图颜色
import matplotlib.pyplot as plt #数学绘图库import jieba #jieba分词库from wordcloud import WordCloud,ImageColorGenerator #词云库from PIL import Image #图像处理标准库import numpy as np #数据科学计算的核心库
七、显示图片
text = open(r'C:\Users\Administrator\Desktop\词云图\词云.txt',"r",encoding="utf-8").read() #读入txt文本数据print(text)
本文来源于公众号:大话数据分析