欢迎光临散文网 会员登陆 & 注册

Python3制作词云进阶

2023-07-08 18:29 作者:Jacksondzl  | 我要投稿

Hello!上一期我们生成了一个好看的词云、虽然不是很好看、但我们今天要做真正好看的词云。

1.用jieba库来分词、实现词云、不是句云:

我们上期做的词云、是以句子分的。因为wordcloud库默认是以标点符号和空格来分开各个“词”的。这对中文明显不友好、所有我们要先用jieba库分词。

先打开上期的文件

上期程序

导入jieba库。然后新建一个列表text_list、设它的初始值为jieba库分词返回的列表。

generate函数的参数只能接收字符串类型的数据、所以我们用join()来将text_list转换为字符串、列表的像之间用空格隔开、以便计算机区分。

用jieba库分词

现在来看一下我们的词云。

现在就是一个一个的词啦。

词云

2.生成有形状的词云

现在的词云都是杂乱无章的、鱼龙混杂、何必不让它像一张图片?

说好就干。新增的库:pillow(导入图片),numpy(获得图片数据)。

首先导入它们俩、用PIL.Image.open()打开一张准备的图片。

皮卡丘.png

这张图在桌面。

导入图片

再用numpy.array()获得图片数据。

再在第9行那修改mask参数、设为图片数据。

放入图片数据

再来看一下我们的词云。

嗯……你们觉得像吗?

没有对比就没有伤害

3.生成类似的颜色

现在的词云有一点“像”图片了、但颜色不像。

这需要导入wordcloud的ImageColorGenerator类。用来生成图片颜色。

生成图片颜色

将它设置在第12行的color_func参数中。

设置颜色

现在看一下词云。

乍一看、不像呢?

没有对比就没有伤害2

下一次得抠图啦!!!

Python3制作词云进阶的评论 (共 条)

分享到微博请遵守国家法律