大数据知识图谱基于知识图谱深度学习的医疗知识问答可视化系统

2022-09-15

大数据知识图谱——基于知识图谱+深度学习的医疗知识问答可视化系统

项目简介

本项目是一个基于知识图谱和深度学习的大数据NLP医疗知识问答可视化系统。通过构建医疗领域的知识图谱,结合深度学习技术,实现了自动问答与分析服务。系统以Neo4j作为存储,使用Flask框架搭建,支持多种医疗知识的查询和问答。

项目特点

  • 知识图谱建模:使用最大向前匹配算法进行分词策略,构建医疗领域的知识图谱。
  • 深度学习模型:封装了基于BERT+LSTM+CRF的深度学习识别模型,提高问答系统的准确性。
  • 可视化系统:设计了用户友好的前端界面,支持医疗知识的可视化展示和查询。
  • 多模式匹配:采用Aho-Corasick算法进行多模式匹配,提高系统的查询效率。

项目结构

  • 数据抓取与存储:通过爬虫技术从寻医问药网等医疗网站抓取数据,并存储到MongoDB数据库中。
  • 数据清洗与处理:对抓取的数据进行清洗和处理,确保数据的准确性和完整性。
  • 知识图谱构建:基于贪心算法进行分词策略,定义实体类型、关系类型和属性类型,构建知识图谱。
  • 问答系统实现:设计基于Flask的聊天机器人AI助手,支持用户输入和系统输出记录自动存储到SQL数据库。

使用说明

  1. 环境配置:配置所需的环境(JDK、Neo4j、PyCharm、Python等)。
  2. 数据抓取:运行爬虫脚本,抓取医疗数据并存储到MongoDB。
  3. 数据处理:对抓取的数据进行清洗和处理,生成知识图谱所需的数据。
  4. 知识图谱构建:运行知识图谱构建脚本,生成医疗领域的知识图谱。
  5. 系统启动:启动Flask应用,访问前端界面进行医疗知识的查询和问答。

注意事项

  • 本项目依赖于Neo4j、MongoDB等数据库,请确保相关数据库已正确安装和配置。
  • 项目中的深度学习模型需要GPU支持,建议在具备GPU的环境下运行。

贡献

欢迎对本项目进行改进和扩展,如有任何问题或建议,请提交Issue或Pull Request。

许可证

本项目遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。

下载链接

大数据知识图谱基于知识图谱深度学习的医疗知识问答可视化系统