面向多步推理问题的智能解答方法、系统、装置与介质

xiaoxiao8月前  51


本发明涉及多步推理问题的自动化求解,尤其涉及一种面向多步推理问题的智能解答方法、系统、装置与介质。


背景技术:

1、多步推理(multi-step reasoning)问题的自动化求解是实现通用型人工智能的一个重要任务,其主要目的是使机器理解需要通过多步逻辑过程来求解的自然语言描述的题目内容,并且推理获得正确的答案。这一过程要求机器从问题中获取关键信息,理解问题逻辑,并像人一样完成推理步骤的规划和实现。因此,多步推理问题自动求解能力被视为通用型人工智能的一项核心标志,也是人工智能的各种应用领域中一个非常重要的研究方向。

2、目前,对于多步推理问题的自动求解主要有以下方法:

3、(1)基于端到端直接推理出答案的方法。

4、基于端到端直接推理出答案的方法主要使用语义解析、记忆网络、图神经网络等方式将问题文本转化为一些结构化的表示(例如语义解析树),再利用这些结构化表示中蕴含的语义信息直接预测出正确的答案。

5、(2)基于问题分解的方法。

6、基于问题分解的方法考虑到单步直接求解原问题的复杂性,将原问题分解为多个简单的子问题,分别求解这些子问题即可获得原问题的答案。这些问题分解的方法主要包括基于规则的分解方法和序列到序列生成的分解方法。其中,基于规则的分解方法依赖于人工构建的一些规则或模式,将原问题映射成具有一定逻辑结构的一系列子问题;序列到序列生成的分解方法通常将原问题输入给神经网络模型,让模型输出分解后的子问题序列。

7、(3)基于大模型思维链的方法。

8、基于大模型思维链的方法利用大模型的强大推理能力来直接解决多步推理问题,并加入自然语言描述的思维链作为问题推理的中间过程来进一步引导解题。思维链可以是人工手动构建的,也可以是大模型自动生成的。引入思维链能增强大模型的多步推理能力,同时也使得复杂的多步推理过程变得更加具有可解释性。

9、在上述自动化求解方法中,基于大模型思维链的方法在许多多步推理任务上超越了其他方法,展现出了强大的理解能力和逻辑推理能力。然而,经过研究发现这类方法在实际生成推理过程时会产生一系列的问题:(a)模型生成的推理过程经常缺失推理步骤或生成错误的推理步骤;(b)模型生成的推理过程可能会包含事实性错误;(c)这些方法对于生成的推理过程缺少评估,因此不合理的推理过程往往会导致模型产生错误的答案。因此,通过实验和观察,基于大模型思维链的方法与类人水平的人工智能仍具有一定的距离,因为它们不能规划出合理的推理步骤,避免常见的事实性错误,以及实时地评估自己生成的内容中存在的问题。

10、有鉴于此,特提出本发明。


技术实现思路

1、本发明的目的是提供一种面向多步推理问题的智能解答方法、系统、装置与介质,可以提升多步推理问题上的求解能力,在实现强人工智能方面有较强的实用性价值。

2、本发明的目的是通过以下技术方案实现的:

3、一种面向多步推理问题的智能解答方法,包括:

4、使用知识融合机制从外部知识库抽取与输入的问题相关的文本内容作为背景信息,并与输入的问题的文本拼接,形成知识增强的问题文本;

5、从所述知识增强的问题文本中捕捉与推理逻辑相关的信息,并以此将问题分解为若干个顺序化的子问题;

6、按照子问题的顺序并结合知识增强的问题文本生成对应的解释内容再进行评估,结合评估结果获得对应的解释步骤,综合所有解释步骤形成多步思维链,并预测出输入的问题对应的正确答案。

7、一种面向多步推理问题的智能解答系统,包括:

8、知识融合单元,用于使用知识融合机制从外部知识库抽取与输入的问题相关的文本内容作为背景信息,并与输入的问题的文本拼接,形成知识增强的问题文本;

9、步骤分解单元,用于从所述知识增强的问题文本中捕捉与推理逻辑相关的信息,并以此将问题分解为若干个顺序化的子问题;

10、解释生成单元,用于按照子问题的顺序并结合知识增强的问题文本生成对应的解释内容再进行评估,结合评估结果获得对应的解释步骤,综合所有解释步骤形成多步思维链,并预测出输入的问题对应的正确答案。

11、一种面向多步推理问题的智能解答装置,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

12、其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述的方法。

13、一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述的方法。

14、由上述本发明提供的技术方案可以看出,设计了一种多步推理问题解题框架,通过分步的方式来生成解释步骤,作为一种多步思维链来启发模型推理,了增强多步推理能力,在实现强人工智能方面有较强的实用性价值;而且本发明在多步推理问题解题框架中建立了知识融合机制和相关性评估机制,有助于提高生成的推理过程的逻辑合理性和事实准确性,从而提升解题的准确性;同时,知识融合机制引入的外部知识可以为许多问答相关的机器学习任务提供额外信息;相关性评估机制对于解题步骤的评价可以辅助教育平台为解答过程做出合理的评估和反馈,可以基于此提供更加个性化的在线导学服务。



技术特征:

1.一种面向多步推理问题的智能解答方法,其特征在于,包括:

2.根据权利要求1所述的一种面向多步推理问题的智能解答方法,其特征在于,所述从所述知识增强的问题文本中捕捉与推理逻辑相关的信息,并以此将问题分解为若干个顺序化的子问题包括:

3.根据权利要求2所述的一种面向多步推理问题的智能解答方法,其特征在于,步骤分解阶段通过推理类型分类器与下一个子问题生成器共同完成;其中,推理类型分类器基于变换神经网络架构实现,用于从所述知识增强的问题文本中捕捉与问题的推理逻辑相关的信息,并提供给下一个子问题生成器;下一个子问题生成器结合推理类型分类器提供的信息,以及知识增强的问题文本与之前生成的所有子问题,生成下一个子问题。

4.根据权利要求3所述的一种面向多步推理问题的智能解答方法,其特征在于,所述推理类型分类器在多步推理的数据集上进行预训练,预训练时,推理类型分类器包括:文本编码器与推理类型预测器,文本编码器生成数据集中问题文本的语义向量表征,推理类型预测器根据语义向量表征预测问题文本对应的推理类型,之后,预测的问题文本对应的推理类型与数据集中的推理类型标签优化推理类型分类器;

5.根据权利要求3或4所述的一种面向多步推理问题的智能解答方法,其特征在于,所述下一个子问题生成器的输入为知识增强的问题文本与之前生成的子问题,并且,使用前缀微调的方法从推理类型分类器提供的信息中提取出前缀向量对作为输入;下一个子问题生成器采用序列到序列的生成式模型架构,并在多步推理数据集上进行预训练;所述序列到序列的生成式模型架构包括编码器与解码器,所述编码器的输入包括知识增强的问题文本与之前生成的子问题,以及前缀向量,所述解码器的输入包括:编码器的输出与前缀向量,输出下一个子问题。

6.根据权利要求1所述的一种面向多步推理问题的智能解答方法,其特征在于,所述按照子问题的顺序并结合知识增强的问题文本生成对应的解释内容再进行评估,结合评估结果获得对应的解释步骤包括:

7.根据权利要求6所述的一种面向多步推理问题的智能解答方法,其特征在于,还包括:

8.一种面向多步推理问题的智能解答系统,其特征在于,包括:

9.一种面向多步推理问题的智能解答装置,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

10.一种可读存储介质,存储有计算机程序,其特征在于,当计算机程序被处理器执行时实现如权利要求1~7任一项所述的方法。


技术总结
本发明公开了一种面向多步推理问题的智能解答方法、系统、装置与介质,它们是一一对应的方案,方案总:设计了一种多步推理问题解题框架,通过分步的方式来生成解释步骤,作为一种多步思维链来启发模型推理,了增强多步推理能力,在实现强人工智能方面有较强的实用性价值;而且本发明在多步推理问题解题框架中建立了知识融合机制和相关性评估机制,有助于提高生成的推理过程的逻辑合理性和事实准确性,从而提升解题的准确性;同时,知识融合机制引入的外部知识可以为许多问答相关的机器学习任务提供额外信息;相关性评估机制对于解题步骤的评价可以辅助教育平台为解答过程做出合理的评估和反馈,可以基于此提供更加个性化的在线导学服务。

技术研发人员:黄振亚,刘淇,薛尚子,陈恩红,林鑫,刘嘉聿
受保护的技术使用者:中国科学技术大学
技术研发日:
技术公布日:2024/9/23

最新回复(0)