问答数据处理方法及装置、智能机器人的制作方法

xiaoxiao2021-2-28  188

问答数据处理方法及装置、智能机器人的制作方法
【技术领域】
[0001]本发明涉及应答机器人技术领域,具体地说,涉及问答数据处理方法及装置、智能机器人。
【背景技术】
[0002]问答机器人系统是人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向,其能够采用准确、简洁的自然语言来回答用户采用自然语言提出的问题,从而满足人们对快速、准确地获取信息的需求。
[0003]目前,问答机器人系统在提供标准化问答服务方面,其技术正在趋于成熟。但随着用户对于问答机器人系统的期望也随之提高,不仅需要得到标准化的问答服务,更需要问答机器人系统能够根据用户的性格偏好、年龄性别职业、语言行为习惯等特性给出更人性化和个性化的服务,而现有问答机器人系统无法提供用户个性化的问答服务。
[0004]基于上述情况,亟需一种能够提供用户个性化问答服务的问答数据处理方法。

【发明内容】

[0005]为解决上述问题,本发明提供了一种问答数据处理方法,其包括:
[0006]语义解析步骤,对获取到的用户输入的请求信息进行语义解析,得到用户当前意图信息,所述用户当前意图信息包括用户当前行为数据和用户当前参数;
[0007]个性化数据库匹配步骤,利用与所述用户相对应的个性化数据库对所述用户当前意图信息进行匹配,判断所述个性化数据库中是否存在匹配内容,如存在,则将得到的匹配内容与所述用户当前意图信息关联后输出。
[0008]根据本发明的一个实施例,在所述语义解析步骤中,利用预设语义解析引擎,通过正则表达式、句式匹配、语法分析和/或关键词分析对所述请求信息进行语义解析。
[0009 ]根据本发明的一个实施例,所述方法还包括:
[0010]通用数据库匹配步骤,当所述个性化数据库中不存在与所述用户当前意图信息相匹配的内容时,利用通用数据库对所述用户当前意图信息进行匹配,并将所述通用数据库中的匹配内容与所述用户当前意图信息关联后输出。
[0011]根据本发明的一个实施例,所述个性化数据库中存储的数据包括以下所列项中的至少一项:
[0012]用户属性、用户行为习惯和用户知识特征。
[0013]根据本发明的一个实施例,在所述个性化数据库匹配步骤前,所述方法还包括:
[0014]个性化数据库关联步骤,根据获取到的所述用户的身份信息,确定与所述用户相对应的个性化数据库。
[0015]根据本发明的一个实施例,所述方法还包括:
[0016]个性化数据库更新步骤,根据所述用户输入的信息,更新所述个性化数据库。
[0017]本发明还提供了一种问答数据处理装置,所述装置包括:
[0018]语义解析模块,其用于对所述用户输入的请求信息进行语义解析以得到用户当前意图信息,所述用户当前意图信息包括用户当前行为数据和用户当前参数;
[0019]个性化数据库匹配模块,其用于利用与所述用户相对应的个性化数据库对所述用户当前意图信息进行匹配,判断所述个性化数据库中是否存在匹配内容,如存在,则将得到的匹配内容与所述用户当前意图信息关联后输出。
[0020]根据本发明的一个实施例,所述语义解析模块配置为利用预设语义解析引擎,通过正则表达式、句式匹配、语法分析和/或关键词分析对所述请求信息进行语义解析。
[0021]根据本发明的一个实施例,所述装置还包括:
[0022]通用数据库匹配模块,其用于在所述个性化数据库中不存在与所述用户当前意图信息相匹配的内容时,利用通用数据库对所述用户当前意图信息进行匹配,并将所述通用数据库中的匹配内容与所述用户当前意图信息关联后输出。
[0023]根据本发明的一个实施例,所述个性化数据库中存储的数据包括以下所列项中的至少一项:
[0024]用户属性、用户行为习惯和用户知识特征。
[0025]根据本发明的一个实施例,所述装置还包括:
[0026]个性化数据库关联模块,其用于根据获取到的所述用户的身份信息,确定与所述用户相对应的个性化数据库。
[0027]根据本发明的一个实施例,所述装置还包括:
[0028]个性化数据库更新模块,其用于根据所述用户输入的信息,更新所述个性化数据库。
[0029]本发明还提供了一种智能机器人,所述智能机器人包括如上任一项所述的问答数据处理装置。
[0030]本发明所提供的问答数据处理方法能够使得应用该方法的智能机器人具备个性化服务能力,即根据用户的特性(例如性格偏好、年龄、性别、职业、语言行为习惯以及知识特征等特性)来提供更加人性化和个性化的服务。
[0031]本发明所提供的问答数据处理方法及装置还能够实现对个性化数据库的更新。通过对个性化数据库进行更新,可以使得反馈给用户的答案更加准确,从而改善用户体检,提高智能应答系统的竞争力。
[0032]本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
【附图说明】
[0033]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要的附图做简单的介绍:
[0034]图1是根据本发明一个实施例的问答数据处理方法的流程图;
[0035]图2是根据本发明一个实施例的问答数据处理装置的结构示意图。
【具体实施方式】
[0036]以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
[0037]同时,在以下说明中,出于解释的目的而阐述了许多具体细节,以提供对本发明实施例的彻底理解。然而,对本领域的技术人员来说显而易见的是,本发明可以不用这里的具体细节或者所描述的特定方式来实施。
[0038]另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0039]针对现有问答机器人所存在的无法为用户提供个性化的问答服务的缺陷,本实施例提供了一种新的问答数据处理方法。其中,图1示出了该问答数据处理方法的流程图。
[0040]如图1所示,本实施例所提供的问答数据处理方法首先在步骤S101中对获取到的用户输入的请求信息进行语义解析,从而得到用户当前意图信息。其中,本实施例中,在步骤S101中所得到的用户当前意图信息优选地包括用户当前行为行为数据和用户当前参数。
[0041]具体地,在步骤S101中,本方法优选地利用预设语义解析引擎来对用户输入的请求信息进行语义解析。其中,在本发明的不同实施例中,该预设语义解析引擎可以采用不同的合理方式来实现,本发明不限于此。
[0042]例如在本发明的一个实施例中,在步骤S101中所使用的预设语义解析引擎可以是利用正则表达式、句式匹配、语法分析和/或关键词分析等方式进行数据处理的信息处理引擎。
[0043]同时,需要指出的是,在本发明的不同实施例中,在步骤S101中所获取到的请求信息既可以是文字信息,也可以是语音信息或手势信息,抑或是上述所列信息的各种组合,本发明同样不限于此。
[0044]本实施例中,通过语义解析步骤S101,可以将用户输入的自然语言的文本或语音转换为对应的用户当前行为数据和用户当前参数。具体地,例如当用户输入的请求信息为“我要开车去天安门”时,在步骤S101中对该请求信息进行语义解析所得到的用户当前行为数据为“开车导航”,用户当前参数为“用户所在位置”以及“天安门”。这样,也就将用户习惯使用的自然语言转换成了方便计算机识别与处理的标准化语言。
[0045]当得到用户当前意图信息(包括用户当前行为数据和用户当前参数)后,本实施例所提供的方法在步骤S102中利用与该用户相对应的个性化数据库来对步骤S101中所得到的用户当前意图信息进行匹配。即 在步骤S102中,基于预设的个性化数据库来对该用户当前意图信息进行检索计算。
[0046]在步骤S103中,判断个性化数据库中是否存在与该用户当前意图信息相匹配的内容。如果存在匹配内容,则在步骤S104中将该匹配内容与当前意图信息关联后输出。
[0047]本实施例中,个性化数据库中存储有用户的个性化数据。本实施例中,预设个性化数据库中所存储的个性化数据至少包括:用户属性、用户行为习惯和用户知识特征。其中,用户属性可以是用户的年龄、性别、生日、爱好、星座以及家乡等信息,而用户习惯则可以是用户的交通出行方式、作息时间、饮食口味以及井场活动的地点等信息,而用户知识特征则可以是用户对某一开放性问题的观点等信息。例如,对于“如何看待教育改革”这一问题,该预设个性化数据库中所存储的用户知识特征可以是“非常看好素质教育”。
[0048]需要说明的是,在本发明的其他实施例中,个性化数据库中所存储的用户的个性化数据既可以仅包含以上所列项中的某一项或几项,也可以包含其他未列出的合理项,抑或是以上所列项中的某一项或几项与其他未列出的合理项的组合,本发明不限于此。
[0049]同时,还需要指出的是,在本发明的不同实施例中,个性化数据库既可以是通过用户自定义的方式构建得到的,也可以是通过对用户请求信息进行筛选分析等方式构建得到的,本发明同样不限于此。
[0050]此外,在本发明的不同实施例中,个性化数据库既可以采用结构化的方式进行数据存储,也可以采用非结构化的方式进行数据存储。而关于个性化数据库的具体数据存储方式,因其是本领域技术人员的公知技术,故在此不再赘述。
[0051]如果个性化数据库中存储有与用户当前意图信息所对应的个性化数据,那么在步骤S103中则判定个性化数据中存在与用户当前意图信息相匹配的内容,并在步骤S104中将该匹配内容与用户当前意图信息关联后输出。
[0052]具体地,假设个性化数据库中存储有用户属性“生日:1990年8月”以及用户知识特征“如何看待教育改革:非常看好素质教育”,这样如果该用户输入请求信息“你的生日是什么时候”,那么则在步骤S104中以语音或字符的形式输出答案“我的生日是1990年8月”,而如果该用户输入请求信息“如何看待教育改革”,那么则在步骤S104中相应地输出答案“我非常看好素质教育”。
[0053]此外,假设个性化数据库中存储有用户属性“车牌号:京XXXXX1”,当用户输入请求信息“我要开车去天安门”时,该方法通过匹配检索到了用户的车牌号,同时还确定出该车牌号在当日为限行牌号,因此在步骤S104中,该方法将用户的车牌号、当日车牌限行信息以及用户当前意图信息相关联,从而输出诸如“今天车牌限行,是不是改乘地铁去天安门呢”的提示。
[0054]而如果个性化数据库中并没有存储与该用户的用户当前意图信息相匹配的内容,即在步骤S103中判定个性化数据库中不存在匹配内容,则在步骤S105中利用通用数据库来对用户当前意图信息进行匹配,并将通用数据库中的匹配内容与用户当前意图信息关联后输出。
[0055]例如,当用户输入的请求信息是“你的年龄大多”时,由于个性化数据库中并未存储与该用户年龄相匹配的内容,因此在步骤S105中直接反馈通用数据库(即系统知识库)中所存储的年龄信息(例如已经30岁了)作为答案来输出给用户。
[0056]需要说明的是,由于利用通用数据库来进行数据匹配的处理过程是本领域技术人员公知的技术,因此为了更加简便地阐述本实施例所提供的智能应答的实现方法的原理以及优点,在此不再对该过程进行详细的阐述。
[0057]由于智能问答功能的服务对象可以是不同的用户,而不同的用户会对应于不同的个性化数据库,因此,在本发明的一个实施例中,在个性化数据匹配步骤S102前,还可以包括个性化数据库关联步骤。该方法在个性化数据库关联步骤中,能够从包含有多个个性化数据库的个性化数据库集合中确定出与输入请求信息的用户相对应的个性化数据库(即步骤S102中所使用到的个性化数据库)。
[0058]具体地,在个性化数据库关联步骤中,可以利用获取到的用户的身份信息来从个性化数据库集合中确定出与该用户相对应的个性化数据库。当然,在本发明的其他实施例中,还可以利用其他合理方式来确定出与输入请求信息的用户相对应的个性化数据库,本发明不限于此。
[0059]例如在本发明的一个实施例中,还可以根据用于获取用户的请求信息的设备的设备身份标识(例如设备的MAC地址或IP地址等)来确定出所需要的个性化数据库。
[0060]需要说明的是,根据实际需要,本实施例所提供的问答数据处理方法还可以对预设个性化数据库进行更新。本实施例中,可以利用用户输入的信息,来更新个性化数据库。具体地,既可以利用收集到的用户的部分显著属性信息,也可以利用与用户进行深层交互过程中所计算和挖掘到的相关信息,来更新对应于该用户的个性化数据库,本发明不限于此。需要指出的是,此处对个性化数据库进行更新既可以是对预设个性化数据库中已有的数据进行变更(例如将30岁改为18岁),也可以是对未存储的数据进行添加。
[0061 ]通过对个性化数据库进行更新,可以使得反馈给用户的答案更加准确,从而改善用户体检,提高智能应答系统的竞争力。
[0062]从上述描述中可以看出,本发明所提供的问答数据处理方法能够使得应用该方法的智能机器人具备个性化服务能力,即根据用户的特性(例如性格偏好、年龄、性别、职业、语言行为习惯以及知识特征等特性)来提供更加人性化和个性化的服务。
[0063]本实施例还提供了一种问答数据处理装置,图2示出了该装置的结构示意图。
[0064]如图2所示,本实施例所提供的智能应答机器人系统包括:语义解析模块201、个性化数据库202、通用数据库203以及个性化数据匹配模块204。其中,语义解析模块201用于对用户输入的请求信息进行语义解析,以得到该用户的用户当前意图信息。其中,本实施例中,用户当前意图信息包括用户当前行为数据和用户当前参数。
[0065]本实施例中,语义解析模块201能够根据预设数据协议解析生成对应的用户对话场景模型,并利用该场景模型对用户输入的请求信息进行语义解析,以获得用户当前意图
?目息。
[0066]具体地,语义解析模块201优选地利用预设语义解析引擎来对用户输入的请求信息进行语义解析。其中,该预设语义解析引擎可以与上述步骤S101中所阐述的语义解析引擎相同,在此不再赘述。
[0067]同时,还需要指出的是,在本发明的不同实施例中,语义解析模块201所获取到的请求信息既可以是文字信息,也可以是语音信息或手势信息,抑或是上述所列信息的各种组合,本发明同样不限于此。
[0068]本实施例中,语义解析模块201可以将用户输入的自然语言的文本或语音转换为对应的用户行为数据和用户当前参数。
[0069]具体地,例如当用户输入的请求信息为“X餐厅离我有多远”时,语义解析模块201对该请求信息进行语义解析所得到的行为信息为“距离查询”,用户当前参数为“用户所在位置”以及“X餐厅”。这样,也就将用户习惯使用的自然语言转换成了方便计算机识别与处理的标准化语言。
[0070]当得到用户当前意图信息后,语义解析模块201便将所得到的用户当前意图信息传输给个性化数据库匹配模块204。个性化数据库匹配模块204能够利用预设的个性化数据库202对语义解析模块201传来的用户当前行为数据和用户当前参数进行匹配。其中,个性化数据库202是与该用户相对应的,其存储有该用户的个性化数据。
[0071]如果匹配成功,个性化数据库匹配模块204则将预设个性化数据库202中的匹配内容与当前意图信息关联后输出。如果个性化数据库202中不存在与用户当前意图信息相匹配的内容,该装置则利用通过数据库匹配模块205来进行数据匹配。本实施例中,通用数据库匹配模块205能够利用通用数据库203来对语义解析模块201生成的用户当前行为数据和当前参数进行匹配,并将通用数据库203中的匹配内容与用户当前意图信息关联后输出。
[0072]本实施例中,个性化数据库202中存储有用户的个性化数据。其中,预个性化数据库中所存储的个性化数据优选地包括:用户属性、用户行为习惯和用户知识特征。其中,用户属性可以是用户的年龄、性别、生日、爱好、星座以 及家乡等信息,而用户习惯则可以是用户的交通出行方式、作息时间、饮食口味以及井场活动的地点等信息,而用户知识特征则可以是用户对某一开放性问题的观点等信息。例如,对于“如何看待教育改革”这一问题,该预设个性化数据库中所存储的用户知识特征可以是“非常看好素质教育”。
[0073]需要说明的是,在本发明的其他实施例中,个性化数据库202中所存储的用户的个性化数据既可以仅包含以上所列项中的某一项或几项,也可以包含其他未列出的合理项,抑或是以上所列项中的某一项或几项与其他未列出的合理项的组合,本发明不限于此。
[0074]同时,还需要指出的是,在本发明的不同实施例中,个性化数据库202既可以是通过用户自定义的方式构建得到的,也可以是通过对用户请求信息进行筛选分析等方式构建得到的,本发明同样不限于此。
[0075]此外,在本发明的不同实施例中,个性化数据库202既可以采用结构化的方式进行数据存储,也可以采用非结构化的方式进行数据存储。而关于个性化数据库的具体数据存储方式,因其是本领域技术人员的公知技术,故在此不再赘述。
[0076]如果个性化数据库202中存储有与用户当前行为数据和用户当前参数相对应的个性化数据,那么个性化数据库匹配模块204则判定个性化数据库202中存在与用户当前行为数据和用户当前参数相匹配的内容,此时个性化数据库匹配模块204会将该匹配内容与用户当前意图信息关联并输出。
[0077]而如果个性化数据库202中并没有存储与用户当前行为数据和用户当前参数相匹配的内容,那么通用数据库匹配模块205则利用通用数据库203来对用户当前行为数据和用户当前参数进行匹配,并将相应的匹配内容与用户当前意图信息关联后输出。
[0078]例如,当用户输入的请求信息是“你的年龄大多”时,如果个性化数据库202中存储有年龄数据(例如18岁),那么个性话数据库匹配模块204会将“18岁”作为答案输出给用户。而当个性化数据库202中并未存储与该用户年龄相匹配的内容时,此时通用数据库匹配模块205将直接反回通用数据库(即系统知识库)203中所存储的年龄信息(例如30岁)来作为答案来输出给用户。
[0079]需要说明的是,由于利用通用数据库来进行数据匹配的处理过程是本领域技术人员公知的技术,因此为了更加简便地阐述本实施例所提供的问答数据处理装置的原理以及优点,在此不再对该过程进行详细的阐述。
[0080]由于智问答功能的服务对象是不同的用户,而不同的用户对应于不同的个性化数据库,因此,在本发明的一个实施例中,该问答数据处理装置还可以包括个性化数据库关联模块。个性化数据库关联模块能够从包含多个个性化数据库的个性化数据库集合中确定出与输入请求信息的用户相对应的个性化数据库(即个性化数据库202)。其中,个性化数据库匹配模块204从个性化数据库集合中确定出与该用户相对应的个性化数据库的原理以及过程可以与上述个性化数据库关联步骤相同,在此不再赘述。
[0081]需要说明的是,根据实际需要,本实施例所提供的问答数据处理装置还可以包括个性化数据库更新模块206,以实现对预设个性化数据库202的更新。其中,本实施例中,个性化数据库更新模块206可以利用用户输入的信息,来更新预设个性化数据库。
[0082]具体地,个性化数据库更新模块206既可以利用收集到的用户的部分显著属性信息,也可以利用与用户进行深层交互过程中所计算和挖掘到的相关信息,来更新对应于该用户的个性化数据库,本发明不限于此。需要指出的是,此处对预设个性化数据库进行更新既可以是对预设个性化数据库中已有的数据进行变更(例如将30岁改为18岁),也可以是对未存储的数据进行添加。
[0083]本发明还提供了一种包括如上所述的问答数据处理装置的智能机器人。
[0084]从上述描述中可以看出,本发明所提供的问答数据处理方法以及装置能够使得智能机器人具备个性化服务能力,即根据用户的特性(例如性格偏好、年龄、性别、职业、语言行为习惯以及知识特征等特性)来提供更加人性化和个性化的服务,从而改善用户体验,提高产品竞争力。
[0085]应该理解的是,本发明所公开的实施例不限于这里所公开的特定结构或处理步骤,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
[0086]说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
[0087]虽然上述示例用于说明本发明在一个或多个应用中的原理,但对于本领域的技术人员来说,在不背离本发明的原理和思想的情况下,明显可以在形式上、用法及实施的细节上作各种修改而不用付出创造性劳动。因此,本发明由所附的权利要求书来限定。
【主权项】
1.一种问答数据处理方法,其特征在于,包括: 语义解析步骤,对获取到的用户输入的请求信息进行语义解析,得到用户当前意图信息,所述用户当前意图信息包括用户当前行为数据和用户当前参数; 个性化数据库匹配步骤,利用与所述用户相对应的个性化数据库对所述用户当前意图信息进行匹配,判断所述个性化数据库中是否存在匹配内容,如存在,则将得到的匹配内容与所述用户当前意图信息关联后输出。2.如权利要求1所述的方法,其特征在于,在所述语义解析步骤中,利用预设语义解析引擎,通过正则表达式、句式匹配、语法分析和/或关键词分析对所述请求信息进行语义解析。3.如权利要求1或2所述的方法,其特征在于,所述方法还包括: 通用数据库匹配步骤,当所述个性化数据库中不存在与所述用户当前意图信息相匹配的内容时,利用通用数据库对所述用户当前意图信息进行匹配,并将所述通用数据库中的匹配内容与所述用户当前意图信息关联后输出。4.如权利要求1?3中任一项所述的方法,其特征在于,所述个性化数据库中存储的数据包括以下所列项中的至少一项: 用户属性、用户行为习惯和用户知识特征。5.如权利要求1?4中任一项所述的方法,其特征在于,所述方法还包括: 个性化数据库更新步骤,根据所述用户输入的信息,更新所述个性化数据库。6.—种问答数据处理装置,其特征在于,所述装置包括: 语义解析模块,其用于对所述用户输入的请求信息进行语义解析以得到用户当前意图信息,所述用户当前意图信息包括用户当前行为数据和用户当前参数; 个性化数据库匹配模块,其用于利用与所述用户相对应的个性化数据库对所述用户当前意图信息进行匹配,判断所述个性化数据库中是否存在匹配内容,如存在,则将得到的匹配内容与所述用户当前意图信息关联后输出。7.如权利要求6所述的装置,其特征在于,所述装置还包括: 通用数据库匹配模块,其用于在所述个性化数据库中不存在与所述用户当前意图信息相匹配的内容时,利用通用数据库对所述用户当前意图信息进行匹配,并将所述通用数据库中的匹配内容与所述用户当前意图信息关联后输出。8.如权利要求6或7所述的装置,其特征在于,所述装置还包括: 个性化数据库关联模块,其用于根据获取到的所述用户的身份信息,确定与所述用户相对应的个性化数据库。9.如权利要求6中所述的装置,其特征在于,所述装置还包括: 个性化数据库更新模块,其用于根据所述用户输入的信息,更新所述个性化数据库。10.—种智能机器人,其特征在于,所述智能机器人包括如权利要求6?9中任一项所述的问答数据处理装置。
【专利摘要】一种问答数据处理方法及装置、智能机器人,其中,该方法包括:语义解析步骤,对获取到的用户输入的请求信息进行语义解析,得到用户当前意图信息,用户当前意图信息包括用户当前行为数据和用户当前参数;个性化数据库匹配步骤,利用与用户相对应的个性化数据库对用户当前意图信息进行匹配,判断个性化数据库中是否存在匹配内容,如存在,则将得到的匹配内容与用户当前意图信息关联后输出。该方法能够根据用户的特性来提供更加人性化和个性化的服务,从而改善用户体检,提高产品竞争力。
【IPC分类】G06F17/30
【公开号】CN105488164
【申请号】CN201510857452
【发明人】杨钊
【申请人】北京光年无限科技有限公司
【公开日】2016年4月13日
【申请日】2015年11月30日

最新回复(0)