本公开涉及用于车辆的语言处理系统和方法。
背景技术:
1、为了增加乘员的便利性和意识,车辆可以配备自动驾驶车辆系统,该系统被配置为辅助乘员操作车辆和/或自主操作车辆。自动驾驶车辆系统可以使用诸如相机、雷达、lidar等传感器来检测周围环境并确定适当的动作。自动驾驶车辆系统还可以使用光学字符识别(ocr)或类似技术来识别交通标志上的文本并提取相关信息。然而,当前的自动驾驶车辆系统可能无法准确确定交通标志上文本的含义,包括对乘员的重要信息或指令以及复杂的逻辑条件或陈述。
2、因此,虽然当前的自主车辆系统和方法实现了它们的预期目的,但是仍需要一种新的且改进的用于车辆的语言处理系统和方法。
技术实现思路
1、根据若干方面,提供了一种用于车辆的语言处理方法。该方法包括接收输入文本。输入文本包括多个单词。该方法还包括确定输入文本的基于规则的动作表示,解析输入文本以产生解析文本。该方法还包括确定解析文本的基于模型的动作表示。该方法还包括至少部分地基于该基于规则的动作表示和基于模型的动作表示来确定输入文本的最终动作表示。
2、在本公开的另一方面,确定基于规则的动作表示还可以包括从输入文本提取时间条件。确定基于规则的动作表示还可以包括至少部分地基于输入文本中的否定项来生成逻辑否定条件表达式。确定基于规则的动作表示还可以包括确定基于规则的动作表示,其中,基于规则的动作表示至少包括时间条件和逻辑否定条件表达式。
3、在本公开的另一方面,从输入文本中提取时间条件还可以包括使用第一正则表达式从输入文本中提取时间。从输入文本中提取时间条件还可以包括使用第二正则表达式从输入文本中提取日期。从输入文本中提取时间条件还可以包括使用第三正则表达式从输入文本中提取持续时间。从输入文本中提取时间条件还可以包括至少部分地基于从输入文本中提取的时间、日期和持续时间来生成时间条件。
4、在本公开的另一方面,解析输入文本还可以包括确定输入文本的多个单词中每一个的词性标签。使用查找表来确定输入文本的多个单词中至少一个的词性标签。使用机器学习算法来确定输入文本的多个单词中至少一个的词性标签。
5、在本公开的另一方面,确定输入文本的多个单词中每一个的词性标签还可以包括标准化输入文本以产生标准化文本。将标准化文本的多个单词中的每一个映射到输入文本的多个单词中的相应单词。确定输入文本的多个单词中每一个的词性标签还可以包括使用查找表确定标准化文本的多个单词中的多个强制单词中每一个的标准化词性标签。确定输入文本的多个单词中每一个的词性标签还可以包括基于标准化文本的多个强制单词中的相应强制单词的标准化词性标签来确定输入文本的多个强制单词中每一个的强制词性标签。确定输入文本的多个单词中每一个的词性标签还可以包括使用机器学习算法确定输入文本的第一多个词性标签。第一多个词性标注中的每一个包括输入文本的多个单词中每一个的预测词性标签。第一多个词性标注中的每一个都具有置信度值。确定输入文本的多个单词中每一个的词性标签还可以包括至少部分地基于第一多个词性标注中每一个的置信度值以及多个强制单词来确定输入文本的多个单词中每一个的词性标签。
6、在本公开的另一方面,至少部分地基于第一多个词性标注中每一个的置信度值以及多个强制单词来确定输入文本的多个单词中每一个的词性标签还可以包括确定输入文本的第二多个词性标注。第二多个词性标注是第一多个词性标注的子集。第二多个词性标注中每一个的多个单词中的每个强制单词的预测词性标注与第二多个词性标注中每一个的多个单词中的每个强制单词的强制词性标注相同。确定输入文本的多个单词中每一个的词性标签还可以包括为输入文本的第二多个词性标注中的每一个生成依存句法分析树(dependency parse tree)。确定输入文本的多个单词中每一个的词性标签还可以包括确定输入文本的第三多个词性标记。第三多个词性标注是第二多个词性标注的子集。第三多个词性标注中每一个的多个单词中的至少一个强制单词是依存句法分析树的根节点。确定输入文本的多个单词中每一个的词性标签还可以包括基于具有最高置信度值的第三多个词性标注中的一个来确定输入文本的多个单词中每一个的词性标签。
7、在本公开的另一方面,确定解析文本的基于模型的动作表示还可以包括识别输入文本中的多个动作词。确定解析文本的基于模型的动作表示还可以包括处理多个动作词中的每一个以确定多个动作词中每一个的主语短语和宾语短语。最接近依存句法分析树的根节点的动作词被首先处理。确定解析文本的基于模型的动作表示还可以包括确定基于模型的动作表示。基于模型的动作表示至少包括多个动作词中每一个的主语短语和宾语短语。
8、在本公开的另一方面,处理多个动作词中的一个以确定主语短语和宾语短语还可以包括至少部分地基于输入文本的多个单词中每一个的词性标签来生成输入文本的成分句法分析树(constituency parse tree)。处理多个动作词中的一个以确定主语短语和宾语短语还可以包括将多个动作词中的一个与排除列表(exclusion list)进行比较。处理多个动作词中的一个以确定主语短语和宾语短语还可以包括响应于确定多个动作词中的一个不在排除列表中,使用成分句法分析树来识别多个动作词中的一个的主语短语。处理多个动作词中的一个以确定主语短语和宾语短语还可以包括响应于确定多个动作词中的一个不在排除列表中,使用成分句法分析树来识别多个动作词中的一个的宾语短语。处理多个动作词中的一个以确定主语短语和宾语短语还可以包括将多个动作词中的一个的主语短语添加到排除列表。处理多个动作词中的一个以确定主语短语和宾语短语还可以包括将多个动作词中的一个的宾语短语添加到排除列表。
9、在本公开的另一方面,标准化输入文本还可以包括对输入文本的多个单词中的每一个进行词形还原,以及将输入文本的多个单词中的每一个转换为非动名词形式。
10、在本公开的另一方面,预处理输入文本还可以包括从输入文本中移除符号和标点符号中的至少一个。预处理输入文本还可以包括识别输入文本中的至少一个异常短语。预处理输入文本还可以包括响应于识别至少一个异常短语,将输入文本划分为第一异常部分和第二异常部分。预处理输入文本还可以包括确定第一异常部分和第二异常部分的基于规则的动作表示。预处理输入文本还可以包括确定第一异常部分和第二异常部分的基于模型的动作表示。预处理输入文本还可以包括至少部分地基于第一异常部分和第二异常部分的基于规则的动作表示以及第一异常部分和第二异常部分的基于模型的动作表示来确定输入文本的最终动作表示。
11、根据若干方面,提供了一种用于车辆的语言处理系统。该系统包括感知传感器。该系统还包括与感知传感器电气通信的控制器。控制器被编程为使用感知传感器从交通标志中提取输入文本。输入文本包括多个单词。控制器还被编程为确定输入文本的基于规则的动作表示。控制器还被编程为解析输入文本以产生解析文本。控制器还被编程为确定解析文本的基于模型的动作表示。控制器还被编程为至少部分地基于该基于规则的动作表示和基于模型的动作表示来确定输入文本的最终动作表示。控制器还被编程为至少部分地基于输入文本的最终动作表示来采取动作。
12、在本公开的另一方面,为了确定基于规则的动作表示,控制器还被编程为从输入文本中提取时间条件。为了确定基于规则的动作表示,控制器还被编程为至少部分地基于输入文本中的否定项来生成逻辑否定条件表达式。为了确定基于规则的动作表示,控制器还被编程为确定基于规则的动作表示,其中,基于规则的动作表示至少包括时间条件和逻辑否定条件表达式。
13、在本公开的另一方面,为了解析输入文本,控制器还被编程为标准化输入文本以生成标准化文本。将标准化文本的多个单词中的每一个映射到输入文本的多个单词中的相应单词。为了解析输入文本,控制器还被编程为使用查找表确定标准化文本的多个单词中的多个强制单词中每一个的标准化词性标签。为了解析输入文本,控制器还被编程为基于标准化文本的多个强制单词中的相应强制单词的标准化词性标签来确定输入文本的多个强制单词中每一个的强制词性标签。为了解析输入文本,控制器还被编程为使用机器学习算法确定输入文本的第一多个词性标注。第一多个词性标注中的每一个包括输入文本的多个单词中每一个的预测词性标签。第一多个词性标注中的每一个具有置信度值。为了解析输入文本,控制器还被编程为至少部分地基于第一多个词性标注中每一个的置信度值以及多个强制单词来确定输入文本的多个单词中每一个的词性标签。
14、在本公开的另一方面,为了确定输入文本的多个单词中每一个的词性标签,控制器还被编程为确定输入文本的第二多个词性标注。第二多个词性标注是第一多个词性标注的子集。第二多个词性标注中每一个的多个单词中的每个强制单词的预测词性标注与第二多个词性标注中每一个的多个单词中的每个强制单词的强制词性标注相同。为了确定输入文本的多个单词中每一个的词性标签,控制器还被编程为针对输入文本的第二多个词性标注中的每一个生成依存句法分析树。为了确定输入文本的多个单词中每一个的词性标签,控制器还被编程为确定输入文本的第三多个词性标记。第三多个词性标注是第二多个词性标注的子集。第三多个词性标注中每一个的多个单词中的至少一个强制单词是依存句法分析树的根节点。为了确定输入文本的多个单词中每一个的词性标签,控制器还被编程为基于具有最高置信度值的第三多个词性标注中的一个来确定输入文本的多个单词中每一个的词性标签。
15、在本公开的另一方面,为了确定解析文本的基于模型的动作表示,控制器还被编程为识别输入文本中的多个动作词。为了确定解析文本的基于模型的动作表示,控制器还被编程为处理多个动作词中的每一个以确定多个动作词中每一个的主语短语和宾语短语,其中,最接近依存句法分析树的根节点的动作词被首先处理。为了确定解析文本的基于模型的动作表示,控制器还被编程为确定基于模型的动作表示。基于模型的动作表示至少包括多个动作词中每一个的主语短语和宾语短语。
16、在本公开的另一方面,为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为至少部分地基于输入文本的多个单词中每一个的词性标签来生成输入文本的成分句法分析树。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为将多个动作词中的一个与排除列表进行比较。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为响应于确定多个动作词中的一个不在排除列表中,使用成分句法分析树来识别多个动作词中的一个的主语短语。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为响应于确定多个动作词中的一个不在排除列表中,使用成分句法分析树来识别多个动作词中的一个的宾语短语。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为将多个动作词中的一个的主语短语添加到排除列表。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为将多个动作词中的一个的宾语短语添加到排除列表。
17、在本公开的另一方面,该系统还包括与控制器电气通信的显示器。为了采取行动,控制器还被编程为使用显示器向车辆乘员显示通知。该通知至少包括输入文本的最终动作表示。
18、根据若干方面,提供了一种用于车辆的语言处理系统。该系统包括感知传感器、显示器以及与感知传感器和显示器电气通信的控制器。控制器被编程为使用感知传感器从交通标志中提取输入文本。输入文本包括多个单词。控制器还被编程为从输入文本中提取时间条件。控制器还被编程为至少部分地基于输入文本中的否定项来生成逻辑否定条件表达式。控制器还被编程以确定基于规则的动作表示。基于规则的动作表示至少包括时间条件和逻辑否定条件表达式。控制器还被编程为解析输入文本以产生解析文本。控制器还被编程为识别输入文本中的多个动作词。控制器还被编程为处理多个动作词中的每一个以确定多个动作词中每一个的主语短语和宾语短语。控制器还被编程为确定基于模型的动作表示。基于模型的动作表示至少包括多个动作词中每一个的主语短语和宾语短语。控制器还被编程为至少部分地基于该基于规则的动作表示和基于模型的动作表示来确定输入文本的最终动作表示。控制器还被编程为使用显示器向车辆乘员显示通知。该通知至少包括输入文本的最终动作表示。
19、在本公开的另一方面,为了解析输入文本,控制器还被编程为标准化输入文本以生成标准化文本。将标准化文本的多个单词中的每一个映射到输入文本的多个单词中的相应单词。为了解析输入文本,控制器还被编程为使用查找表确定标准化文本的多个单词中的多个强制单词中每一个的标准化词性标签。为了解析输入文本,控制器还被编程为基于标准化文本的多个强制单词中的相应强制单词的标准化词性标签来确定输入文本的多个强制单词中每一个的强制词性标签。为了解析输入文本,控制器还被编程为使用机器学习算法确定输入文本的第一多个词性标注。第一多个词性标注中的每一个包括输入文本的多个单词中每一个的预测词性标签。第一多个词性标注中的每一个具有置信度值。为了解析输入文本,控制器还被编程为确定输入文本的第二多个词性标注。第二多个词性标注是第一多个词性标注的子集。第二多个词性标注中每一个的多个单词中的每个强制单词的预测词性标注与第二多个词性标注中每一个的多个单词中的每个强制单词的强制词性标注相同。为了解析输入文本,控制器还被编程为为输入文本的第二多个词性标注中的每一个生成依存句法分析树。为了解析输入文本,控制器还被编程为确定输入文本的第三多个词性标注。第三多个词性标注是第二多个词性标注的子集。第三多个词性标注中每一个的多个单词中的至少一个强制单词是依存句法分析树的根节点。为了解析输入文本,控制器还被编程为基于具有最高置信度值的第三多个词性标注中的一个来确定输入文本的多个单词中每一个的词性标签。
20、在本公开的另一方面,为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为至少部分地基于输入文本的多个单词中每一个的词性标签来生成输入文本的成分句法分析树。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为将多个动作词中的一个与排除列表进行比较。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为响应于确定多个动作词中的一个不在排除列表中,使用成分句法分析树来识别多个动作词中的一个的主语短语。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为响应于确定多个动作词中的一个不在排除列表中,使用成分句法分析树来识别多个动作词中的一个的宾语短语。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为将多个动作词中的一个的主语短语添加到排除列表。为了处理多个动作词中的每一个以确定主语短语和宾语短语,控制器还被编程为将多个动作词中的一个的宾语短语添加到排除列表。
21、进一步的应用领域将从本文提供的描述中变得显然。应当理解,这些描述和具体示例仅用于说明的目的,并不旨在限制本公开的范围。
1.一种用于车辆的语言处理方法,所述方法包括:
2.根据权利要求1所述的方法,其中,确定所述基于规则的动作表示还包括:
3.根据权利要求2所述的方法,其中,从所述输入文本中提取所述时间条件还包括:
4.根据权利要求1所述的方法,其中,解析所述输入文本还包括:
5.根据权利要求4所述的方法,其中,确定所述输入文本的多个单词中每一个的词性还包括:
6.根据权利要求5所述的方法,其中,至少部分地基于所述第一多个词性标注中每一个的置信度值以及所述多个强制单词来确定所述输入文本的多个单词中每一个的词性标签还包括:
7.根据权利要求6所述的方法,其中,确定所述解析文本的所述基于模型的动作表示还包括:
8.根据权利要求7所述的方法,其中,处理所述多个动作词中的一个以确定所述主语短语和所述宾语短语还包括:
9.根据权利要求4所述的方法,其中,标准化所述输入文本还包括:
10.根据权利要求1所述的方法,还包括预处理所述输入文本,其中,预处理所述输入文本还包括: