本发明涉及智能检索,更具体地说,它涉及一种基于医学大数据的智能检索系统。
背景技术:
1、目前,在急诊医学中,各类创伤疾病是一个非常复杂的涉及多个学科协同的临床实践,因此,基于经典医疗案例救治过程而形成的案例库,具有非常重要的急诊临床指导意义和科研价值,目前,大多数医学临床问题是靠医生的经验所答,没有确切科学的答案,而且最关键的是“没有答案或者仅有部分答案”这种情况可能占大多数。因此,为了强调应将医生的临床经验与现有的最可靠的临床研究证据以及病人的期望进行完善结合,从而指导医疗实践,循证医学孕育而生。
2、目前现有的主流信息检索技术是基于关键字匹配方法进行检索,而由于医学文本的多样性和复杂性,文本关键字检索和匹配过程中如果不考虑用户输入文本的语义,会导致用户在没有明确检索目标的情况下难以找到符合相关描述的参考案例,需要深入了解检索系统的操作细节或医学领域的专业术语,提高了专业性的要求。
技术实现思路
1、针对现有技术存在的不足,本发明的目的在于提供一种基于医学大数据的智能检索系统,根据用户输入的关键词或短语,快速生成相关联的检索建议,帮助用户完善检索需求,避免遗漏重要信息;检索结果融合了医学领域的标准数据以及行业权威专家的学术经验,确保用户获取的信息既符合行业标准又具有学术价值。
2、为实现上述目的,本发明提供了如下技术方案:
3、一种基于医学大数据的智能检索系统,包括用户端、人机交互接口、检索模块、资源模块以及处理模块;所述检索模块输入端与人机交互接口通过信号线通信连接,且其输出端与资源模块通过信号线通信连接;所述资源模块输出端与处理模块通过信号线通信连接;所述资源模块包括权威学术经验平台、医学科研数据库以及设别管理系统;用户通过用户端经人机交互接口接入,通过处理模块在权威学术经验平台以及医学科研数据库中提取关键词,处理模块经过分析、统计、查询、信息挖掘、趋势分析和辅助决策支持功能,形成与关键词相关的临床问题分析图,用户通过选择所需的临床案例相关文献,系统自动关联符合标准的meta分析题目关键词,并对关键词进行补充,最终得出选择。
4、本发明进一步设置为:还包括录入模块、迭代模块以及互联网平台;所述录入模块与权威学术经验平台通过通信连接;所述医学科研数据库与互联网平台通过迭代模块通信连接。
5、本发明进一步设置为:所述处理模块包括自然语言处理单元;所述自然语言处理单元采用全切分技术,找出句子中所有的词,计算每个词组合成一句话的概率,选择概率最大的词组合作为切分结果。
6、本发明进一步设置为:所述处理模块还包括碎片化加工单元;所述碎片化加工包括元数据自动标注、正文xml自动标注、自动目录链接、乱码检测和校正、自动排版、自动图像处理、自动识别。
7、本发明进一步设置为:所述处理模块还包括文本相似性分析单元;所述文本相似性分析采用了基于多阶指纹比对矩阵的相似检索算法:对文本进行预处理形成统一格式;将统一格式文本使用simhash算法进行编码,形成64位二进制的多阶指纹特征值;计算原文本的特征值与比对文本特征值之间的海明距离,选取海明距离小于阈值3的文本进行二次计算;将原文本与比对文本进行分词并两两构建比对矩阵,计算文本相似度和相似内容并标记输出;对文本相似度和相似度内容计算方法进行优化,该优化方法开启多线程采用并行计算。
8、本发明进一步设置为:所述处理模块还包括数据挖掘单元;所述数据挖掘是数据库知识发现中的一个步骤,从大量的模糊的数据集合中提取人们感兴趣的知识和信息。
9、本发明进一步设置为:所述处理模块还包括决策支撑单元;所述决策支撑单元用以辅助确定目标、拟定方案、分析评价以及模拟验证工作,通过人机交互方式,由决策人员提供各种不同方案的参量并选择方案。
10、本发明进一步设置为:所述决策支撑单元进程步骤如下:
11、t1、发现问题并形成决策目标,包括建立决策模型、拟定方案和确定效果度量,这是决策活动的起点;
12、t2、用概率定量地描述每个关键词所产生的各种病例的可能性;
13、t3、决策人员对各种结局进行定量评价,一般用效用值来定量表示,效用值是有关决策人员根据科研数据、权威经验因素,对各种结局的价值所作的定量估计;
14、t4、综合分析各方面信息,以最后决定方案的取舍,对方案作灵敏度分析,研究原始数据发生变化时对最优解的影响,决定对方案有较大影响的参量范围。
15、本发明的优点是:
16、1、本发明的智能检索系统根据用户输入的关键词或短语,快速生成相关联的检索建议,帮助用户完善检索需求,避免遗漏重要信息;检索结果融合了医学领域的标准数据以及行业权威专家的学术经验,确保用户获取的信息既符合行业标准又具有学术价值;
17、2、本发明的智能检索系统具备自学习和自迭代能力,能够根据用户的反馈不断优化检索算法,提升检索结果的准确性和质量,保持与医学科研领域最新发展的同步,通过以上优势,本申请中的智能检索系统将为医学科研工作者提供更便捷、高效的信息检索服务,助力他们更快地获取到所需的研究资料。
1.一种基于医学大数据的智能检索系统,其特征在于:
2.根据权利要求1所述的一种基于医学大数据的智能检索系统,其特征在于:还包括录入模块、迭代模块以及互联网平台;所述录入模块与权威学术经验平台通过通信连接;所述医学科研数据库与互联网平台通过迭代模块通信连接。
3.根据权利要求2所述的一种基于医学大数据的智能检索系统,其特征在于:所述处理模块包括自然语言处理单元;所述自然语言处理单元采用全切分技术,找出句子中所有的词,计算每个词组合成一句话的概率,选择概率最大的词组合作为切分结果。
4.根据权利要求3所述的一种基于医学大数据的智能检索系统,其特征在于:所述处理模块还包括碎片化加工单元;所述碎片化加工包括元数据自动标注、正文xml自动标注、自动目录链接、乱码检测和校正、自动排版、自动图像处理、自动识别。
5.根据权利要求4所述的一种基于医学大数据的智能检索系统,其特征在于:所述处理模块还包括文本相似性分析单元;所述文本相似性分析采用了基于多阶指纹比对矩阵的相似检索算法:对文本进行预处理形成统一格式;将统一格式文本使用simhash算法进行编码,形成64位二进制的多阶指纹特征值;计算原文本的特征值与比对文本特征值之间的海明距离,选取海明距离小于阈值3的文本进行二次计算;将原文本与比对文本进行分词并两两构建比对矩阵,计算文本相似度和相似内容并标记输出;对文本相似度和相似度内容计算方法进行优化,该优化方法开启多线程采用并行计算。
6.根据权利要求5所述的一种基于医学大数据的智能检索系统,其特征在于:所述处理模块还包括数据挖掘单元;所述数据挖掘是数据库知识发现中的一个步骤,从大量的模糊的数据集合中提取人们感兴趣的知识和信息。
7.根据权利要求6所述的一种基于医学大数据的智能检索系统,其特征在于:所述处理模块还包括决策支撑单元;所述决策支撑单元用以辅助确定目标、拟定方案、分析评价以及模拟验证工作,通过人机交互方式,由决策人员提供各种不同方案的参量并选择方案。
8.根据权利要求7所述的一种基于医学大数据的智能检索系统,其特征在于,所述决策支撑单元进程步骤如下: