欢迎光临散文网 会员登陆 & 注册

自然语言处理实用教程 | 文本聚类 | 2023年版

2023-09-09 17:13 作者:AI日日新  | 我要投稿

文本聚类主要用于提升数据标注的效率,首先我们有一批数据,它们在xlsx文件中保存于text列,如下图所示:

接着我们使用文本聚类工具可以为每一段句子打上标签。注意这里的标签仅仅是数字,只是表示它们比较相关,后续具体的标签名需要自己定。聚类结果如下图:

在上一张图片中,标签名是我自己定义的,原本聚类结果的标签是1。那么得到这些数据的作用是为了训练文本分类模型。文本聚类的具体代码如下:


自然语言处理实用教程 | 文本聚类 | 2023年版的评论 (共 条)

分享到微博请遵守国家法律