本发明涉及科研项目信息化,尤其涉及一种基于科研项目知识图谱的智能问答方法及系统。
背景技术:
1、在科技项目的需求征集、计划申报、合同管理、专利管理、成果奖励等业务场景下产生的大量的科研数据,往往被分散的存储在多个异构数据源中,各种信息的关联型较差。目前各类科研数据的检索利用仅仅依托标题、属性、全文进行检索,搜索不够详尽,且以关键词为基准的检索,仅对数据进行模糊匹配,搜索出的数据也不够精准,同时传统的搜索结果之间内容松散,关联性差、缺少智能性,无法查找及推荐相关联内容。因此打通多个异构数据源壁垒,构建多种科研数据的高度关联,建立基于知识图谱关联性的智能检索变得尤为迫切。
技术实现思路
1、鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于科研项目知识图谱的智能问答方法及系统。
2、根据本发明的一个方面,提供了一种基于科研项目知识图谱的智能问答方法包括:
3、导入科研项目知识图谱数据,采用图数据库存储实体、属性、关系;
4、建立自定义实体分词库、问句关键字集、问句分类及对应检索语句模板基础信息;
5、获取用户输入的问句;
6、对所述问句进行分词并标记实体词性,按照所述实体词性及所述问句关键字对所述问句进行分类;
7、针对提取出多个问句分类的情形,将所述问句分解为推荐问题并反馈给用户;
8、根据问句分类获取检索语句模板并生成可执行查询语句;
9、执行所述查询语句,将查询结果封装成答案并反馈给用户。
10、可选的,所述导入科研项目知识图谱数据,采用图数据库存储实体、属性、关系具体包括:
11、制定预定义的标准模板;
12、按照所述标准模板组装知识图谱数据,生成导入任务并记录导入日志,多次导入覆盖原有数据,导入的所述知识图谱数据采用neo4j图数据库进行存储。
13、可选的,所述建立自定义实体分词库、问句关键字集、问句分类及对应检索语句模板基础信息具体包括:
14、建立自定义实体分词库,针对所有实体进行分类,按分类分别生成自定义词典,将所述自定义词典加入hanlp自定义词典路径并更新自定义词典模型;
15、建立问句关键字集,根据所述实体分类建立关键字集,表征同一类检索对象,针对每个问句关键字集可设定多个关键字;
16、建立问句分类,根据所述实体分类和所述问句关键字集,建立问句分类,针对每种问句分类建立neo4j图数据库的cypher查询语句模板。
17、可选的,所述对所述问句进行分词并标记实体词性,按照所述实体词性及所述问句关键字对所述问句进行分类具体包括:
18、采用hanlp对问句进行分词得到分词词组,从分词词组提取所有实体词性得到实体分类;
19、检查实体分类数量,若包含多种实体分类,则反馈用户对问句进行精简;
20、根据已知的实体分类,进一步将问句和问句关键字集进行匹配,若匹配到问句关键字,则生成对应问句分类,若未匹配到问句关键字,则默认检索实体的基本信息。
21、可选的,所述针对提取出多个问句分类的情形,将所述问句分解为推荐问题并反馈给用户具体包括:
22、检查问句分类的数量,如果问句分类含有多种,根据每种分类分别设定推荐问句,将多个推荐问句封装成答案反馈给用户。
23、可选的,所述根据问句分类获取检索语句模板并生成可执行查询语句具体包括:
24、根据问句分类获取对应neo4j图数据库的cypher查询语句模板,替换模板中各项参数生成可执行的查询语句。
25、可选的,所述执行所述查询语句,将查询结果封装成答案并反馈给用户具体包括:
26、获取neo4j数据库连接,执行检索语句,逐条获取检索结果,按检索结果条数,采用不同格式将检索结果封装成答案,将答案反馈给用户。
27、本发明还提供了一种基于科研项目知识图谱的智能问答系统,所述问答系统包括:
28、知识图谱管理模块,用于对科研项目知识图谱进行管理维护,实现科研项目知识图谱的导入、导出、编辑、以及可视化展示;
29、基础信息配置模块,用于配置智能问答处理模块采用的各项基础数据,包括自定义实体词库的生成及更新,问句关键词集的创建及关键词编辑,问句分类的创建,以及问句分类对应的图数据库查询语句模板的创建、编辑;
30、智能问答模块,用于提供可视化的用户访问界面,采用窗口对话形式实现用户提问及系统答复;
31、智能问答处理模块,用于实现智能问答的处理过程,包括获取用户问句,对问句进行分类,针对多分类问句进行处理反馈,封装检索语句,执行数据库检索并封装答案,最终将答案反馈给用户;
32、数据展示模块,提供可视化的信息展示界面,针对检索到的科研项目数据,按照不同的实体类型分别进行详细信息展示。
33、本发明提供的一种基于科研项目知识图谱的智能问答方法包括:导入科研项目知识图谱数据,采用图数据库存储实体、属性、关系;建立自定义实体分词库、问句关键字集、问句分类及对应检索语句模板基础信息;获取用户输入的问句;对所述问句进行分词并标记实体词性,按照所述实体词性及所述问句关键字对所述问句进行分类;针对提取出多个问句分类的情形,将所述问句分解为推荐问题并反馈给用户;根据问句分类获取检索语句模板并生成可执行查询语句;执行所述查询语句,将查询结果封装成答案并反馈给用户。,实现用户问题的智能化解答,提高解答的效率和准确度。
34、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
1.一种基于科研项目知识图谱的智能问答方法,其特征在于,所述智能回答方法包括:
2.根据权利要求1所述的一种基于科研项目知识图谱的智能问答方法,其特征在于,所述导入科研项目知识图谱数据,采用图数据库存储实体、属性、关系具体包括:
3.根据权利要求1所述的一种基于科研项目知识图谱的智能问答方法,其特征在于,所述建立自定义实体分词库、问句关键字集、问句分类及对应检索语句模板基础信息具体包括:
4.根据权利要求1所述的一种基于科研项目知识图谱的智能问答方法,其特征在于,所述对所述问句进行分词并标记实体词性,按照所述实体词性及所述问句关键字对所述问句进行分类具体包括:
5.根据权利要求1所述的一种基于科研项目知识图谱的智能问答方法,其特征在于,所述针对提取出多个问句分类的情形,将所述问句分解为推荐问题并反馈给用户具体包括:
6.根据权利要求1所述的一种基于科研项目知识图谱的智能问答方法,其特征在于,所述根据问句分类获取检索语句模板并生成可执行查询语句具体包括:
7.根据权利要求1所述的一种基于科研项目知识图谱的智能问答方法,其特征在于,所述执行所述查询语句,将查询结果封装成答案并反馈给用户具体包括:
8.一种基于科研项目知识图谱的智能问答系统,其特征在于,所述问答系统包括: