医疗领域3.7万实体知识图谱问答系统，顶尖科技实现从零构建！

2023-07-27 23:43 作者:汀丶人工智能 0人读过 | 我要投稿

从零构建医疗领域知识图谱的KBQA问答系统：其中7类实体，约3.7万实体，21万实体关系。

以下两张图是系统实际运行效果：

运行环境：Python3 数据库：neo4j 预训练词向量：https://github.com/Embedding/Chinese-Word-Vectors

1、搭建知识图谱：python buildgrapy.py。大概几个小时，耐心等待。 2、启动问答测试：python kbqatest.py

数据源：39健康网。包括15项信息，其中7类实体，约3.7万实体，21万实体关系。

本系统的知识图谱结构如下：

1.1 知识图谱实体类型

1.2 知识图谱实体关系类型

1.3 知识图谱疾病属性

基于特征词分类的方法来识别用户查询意图

1、本项目构建简单，通过本项目能了解KBQA的工作流程。

2、本次通过手工标记210条意图分类训练数据，并采用朴素贝叶斯算法训练得到意图分类模型。其最佳测试效果的F1值达到了96.68%。选用NB的原因是通过与SVM训练效果比较后决定的。

3、优化点：

[文章码源链接] (https://blog.csdn.net/sinat_39620217/article/details/131968727)

更多优质内容请关注：汀丶人工智能；会提供一些相关的资源和优质文章，免费获取阅读。