一种语音识别输入的控制方法及系统的制作方法
【技术领域】
[0001]本发明涉及智能设备语音输入控制领域,特别是一种语音识别输入的控制方法及系统,所述控制方法和系统用于实现移动终端设备控制家电运行工作。
【背景技术】
[0002]现有智能家居设备输入控制多采用触摸界面,使用中要多次点击触摸屏,逐层进入菜单,完成输入控制操作如开空调、设定温度等,当家中智能设备过多时用户先要找到对应设备再做后续操作。现有家电生产商通过手机进行语音输入,经语音识别后输入控制家电,替代现有家电常规的触屏操作,以此简化操作、提高使用上便利性,所述语音识别是一种输入语音进行识别,然后转成文字的计算机技术,通过语音识别能够实现语音输入控制各种智能家电设备,该技术在越来越多的智能家居设备上得到应用,用户必须按照指定命令进行相同的语音输入,当语音输入和指定命令不一致如命令前后或者中间夹杂一些非命令语音时,就会导致识别失败。现有语音识别输入控制存在以下缺陷:1、语音识别准确度单一,只提供默认的固定命令模板,不能满足用户多样性需求;2、命令内容固定死板,当用户使用与指定命令含义相同的同义词发出命令时,无法准确识别,语音识别输入不起作用。
【发明内容】
[0003]本发明要解决的技术问题和提出的技术任务是提供一种语音识别输入的控制方法及对应控制系统,所述语音输入能够对用户的语音输入进行正确识别,且识别准确度高。
[0004]本发明采用如下的技术方案:一种语音识别输入的控制方法,包括依序进行的以下步骤:
(1)语音输入,通过手机端输入采集语音;
(2)语音转换文字,将语音信息转换成文本信息;所述转换可以在服务器或手机上进行,并且这种转换属于现有技术(不影响专利),可以通过市场上已有的专业语言服务供应商服务获取;
(3)提取关键词,将文本信息的内容划分为关键词数组(可以选择在服务器或手机上进行);
(4)同义词替换,将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语(可以选择在服务器或手机上进行);由于现在识别的命令都有固定的格式,且识别数量有限,因此该过程可以通过在服务器上预存很多与标准命令词语匹配的同义词,然后通过运算进行筛选,选出匹配的,再将潜在命令词语替换成同义的标准命令词语;把用户口语化的词汇替换为标准普通话词汇,比如方言“打开来”替换为机器能识别的普通话“开启”,方言话“连起来”替换为机器能识别的普通话“接通,”普通话“运转起来”替换为机器能识别的普通话“开启”。
[0005](5)命令匹配,对带有标准命令词语的文本信息进行匹配得到完整的标准命令;
(6)命令发送,将标准命令通过网络发送到终端设备,控制设备完成相应动作。
[0006]本发明将语音输入转成的文本信息用同义词进行替换,得到带有标准命令词语的文本信息后换分为关键词数组,然后对其中的潜在命令用同义词进行替换,再进行命令匹配,转换得到完整的标准命令,通过网络发送给终端设备,控制设备完成相应动作,所述语音识别输入的控制方法能够对用户的语音输入进行正确识别,且识别准确度高。
[0007]作为对上述技术方案的进一步完善和补充,本发明采用如下技术措施:所述的步骤(5)命令匹配为一种计算机算法,所述的步骤(5)命令匹配为一种计算机算法,所述预设命令为含有两个以上选项的多元组,匹配时把带有标准命令的文本信息和预设命令按照所述选项依序逐一匹配对应,当前一个选项匹配完成后再进行下一选项的匹配,直至完成全部选项的匹配。进一步的,所述预设命令为三元组{操作,地点,设备}或四元组{操作,地点,设备,定时},匹配时把带有标准命令的文本信息和预设命令按照所述选项依序逐一匹配对应,当前一个选项匹配完成后再进行下一选项的匹配,直至完成全部三个或四个选项的匹配。比如对于插座,用户输入的语音经过(1)-(4)步骤后,生成相应的命令为{打开,臣卜室,插座,现在},预设的默认命令集中,针对“打开”的操作就预设了一个默认命令集合,比如[开,打开,开始,开启,电亮,接通,…],第一项命令只要包含在命令集合(默认命令+自定义命令)中则匹配完成,否则即视为匹配失败;如果第一项命令匹配完成,则继续匹配第二项命令,依次类推;当预设命令为三元组时,即有三个选项要匹配,此时完成三个选项匹配后即时对设备进行相应操作,当预设命令为四元组,即有四个选项要匹配时才对设备相应操作,如对于第四项“定时”如果用户有定时,则按用户定时的时间对设备进行相应操作。实际执行中,比如标准命令为“打开卧室灯”,用户命令为“打开卧室的灯”,经过关键词提取后得到“打开”、“卧室”、“灯”,标准命令的格式为{打开,卧室,灯},如果能够匹配一个完整的命令,则往下执行。
[0008]所述的预设命令包括默认命令和自定义命令,所述默认命令是一套预设定的规则文本,自定义命令是用户自行定义的一套可识别的规则文本,所述默认命令和自定义命令组成命令集合。默认命令可以套用固定命令模板,如空调和电视,都会由一个模版来进行命令识别。自定义命令则是根据用户不同习惯,与设备控制的动作相关联进行,具体是通过将用户的命令进行文本转换、关键词提取、去噪等动作,生成一种计算机可识别的命令格式,然后该自定义命令格式的识别过程和默认命令一致,详见本发明所述的控制方法中步骤1?6。如针对“打开”的操作已经预设了一个默认命令集合,比如[开,打开,开始,开启,电亮,接通,…],如果用户针对打开操作新增了自己的自定义指令,可以添加到该默认命令集合中去,比如针对“打开”的操作,用户新增了自定义的指令后,命令集合就可能变为[用户自定义1,用户自定义2,用户自定义3,开,打开,开始,开启,电亮,接通,…]。实践中,默认命令可以是存储在服务器上的一套预设定的规则文本,自定义命令是用户自行定义的一套服务器能够识别的规则文本,所述自定义命令可在手机端上生成然后发送到服务器。
[0009]所述的命令匹配中,自定义命令优先于默认命令,即先和自定义命令进行匹配,然后再跟默认命令进行匹配。将自定义命令优于默认命令,可以更好满足客户的个性需求。
[0010]—种语音识别输入的控制系统,包括依序相连的语音采集模块、语音转换模块、提取模块、同义词替换模块以及命令匹配模块和命令发送模块,其中语音采集模块用于采集语音信息;语音转换模块用于将语音信息转换成文本信息;提取模块用于将文本信息的内容划分为关键词数组;同义词替换模块将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语;命令匹配模块可以把带有标准命令词语的文本信息与存储的预设命令进行匹配得到完整的标准命令;命令发送模块将标准命令通过网络发送到终端设备,控制终端设备完成相应动作。其中语音采集模块设于手机上依赖现有手机进行,命令发送模块位于服务器上,其余模块可以根据需要设于手机或服务器上;所述预设命令即为默认命令,默认命令既可以放在服务器上,也可以随APP下载到手机端,自定义命令也一样,可以在手机端生成后保存在手机端,也可以上传到服务器端。
[0011]所述的语音采集模块和命令匹配模块之间还连有一个命令生成模块,所述命令生成模块的输入端接语音采集模块,输出端接命令匹配模块。命令生成模块的作用是将采集的用户语音,根据用户不同的家电设备,套用现有命令模板,生成潜在的用户命令,并上传给命令匹配模块存储成为新增的自定义命令。潜在的用户命令是指用户输入的不规则、无语法可循的语音信息经过命令生成模块处理后生成规则的、含语法语义的语音命令信息。
[0012]所述的语音采集模块和命令匹配模块之间还连有一个自动学习模块,所述自动学习模块的输入端接语音采集模块,输出端接命令匹配模块。自动学习模块的作用是将采集的语音信息解析成为用户的自定义命令后输出。语音采集模块采集用户语音后输出给自动学习模块,自动学习模块将所述语音信息解析成为用户的自定义命令,然后输出到命令匹配模块,存储起来编入预设命令。
[0013]本发明提供了一种语音识别输入的控制方法及对应控制系统,所述控制方法将语音输入转成的文本信息用同义词进行替换,得到带有标准命令词语的文本信息后换分为关键词数组,然后对其中的潜在命令用同义词进行替换,再进行命令匹配,转换得到完整的标准命令,通过网络发送给终端设备,控制设备完成相应动作,所述语音识别输入的控制方法能够对用户的语音输入进行正确识别,且识别准确度高,语音识别输入的控制系统用于实现前述控制方法。
【附图说明】
[0014]图1:本发明的控制方法步骤图。
[0015]图2:本发明的控制系统不意图。
[0016]图中:I手机、2.
服务器、3.语音采集模块、4.命令生成模块、5.自动学习模块、6.语音转换模块、7.同义词替换模块、8.命令匹配模块、9.提取模块、10.命令发送模块。
【具体实施方式】
[0017]下面结合【附图说明】和【具体实施方式】对本发明做进一步的说明。
[0018]如图1所示,一种语音识别输入的控制方法,包括依序进行的以下步骤:
(1)语音输入,通过手机端采集语音;
(2)语音转换文字,将语音信息转换成文本信息;所述转换可以在服务器或手机上进行,并且这种转换属于现有技术,可以通过市场上已有的专业语言服务供应商服务获取;
(3)提取关键词,在服务器上将文本信息的内容划分为关键词数组;
(4)同义词替换,在服务器上将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语;由于现在识别的命令都有固定的格式,且识别数量有限,因此该过程可以通过在服务器上预存很多与标准命令词语匹配的同义词,然后通过运算进行筛选,选出匹配的,再将潜在命令词语替换成同义的标准命令词语;
(5)命令匹配,在服务器上对带有标准命令词语的文本信息进行匹配得到完整的标准命令;
(6)命令发送,将服务器上的标准命令通过网络发送到终端设备,控制设备完成相应动作。
[0019]进一步的,步骤(5)命令匹配为一种计算机算法,所述预设命令为三元组{操作,地点,设备}或四元组{操作,地点,设备,定时},匹配时把带有标准命令的文本信息和预设命令按照所述选项依序逐一匹配对应,当前一个选项匹配完成后再进行下一选项的匹配,直至完成全部选项的匹配,如标准命令为“打开卧室灯”,用户命令为“打开卧室的灯”,经过关键词提取后得到“打开”、“卧室”、“灯”,标准命令的格式为{打开,{卧室,{灯}}} {打开,臣卜室,灯},由关键词数组从头开始匹配,如果能够匹配一个完整的命令,则往下执行。
[0020]所述的预设命令包括默认命令和自定义命令,所述默认命令是存储在服务器上的一套预设定的规则文本,自定义命令是用户自行定义的一套服务器能够识别的规则文本,所述文本可在手机端上生成然后发送到服务器,所述默认命令和自定义命令组成命令集入口 ο
[0021]步骤(5)命令匹配时,自定义命令优先于默认命令,带有标准命令词语的文本信息先和预设命令中的自定义命令进行匹配,匹配不成功的再和默认命令进行匹配。
[0022]如图2所示,一种语音识别输入控制系统,包括依序相连的语音采集模块3、语音转换模块6、提取模块9、同义词替换模块7以及命令匹配模块8和命令发送模块10,其中语音采集模块3用于采集语音信息;语音转换模块6用于将语音信息转换成文本信息;提取模块9用于将文本信息的内容划分为关键词数组;同义词替换模块7将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语;命令匹配模块8对带有标准命令词语的文本信息与预设命令进行匹配得到完整的标准命令;命令发送模块2将标准命令通过网络发送到终端设备,控制终端设备完成相应动作。其中语音采集模块3可以通过常见手机1完成,命令发送模块10设于服务器2上,手机和服务器可以通过通讯网络进行信息交互传输,服务器2可以通过无线网络输出控制各种家电等终端设备,命令生成模块4与自动学习模块5都设在手机1上,语音转换模块6、提取模块9、同义词替换模块7以及命令匹配模块8、命令发送模块10都可以设在手机1上或服务器2上,通过手机和服务器之间的通讯连接,各个模块之间可以完成信息传输。
[0023]进一步的,所述的语音采集模块3和命令匹配模块8之间还连有一个命令生成模块4,所述命令生成模块的输入端接语音采集模块,输出端接命令匹配模块8,所述命令生成模块的作用是根据用户不同的家电设备,将用户输入的不规则、无语法可循的语音信息经过命令生成模块处理后生成规则的、含语法语义的语音命令信息,套用现有命令模板生成潜在的用户命令,并上传给命令匹配模块存储成为新增的自定义命令。
[0024]所述的语音采集模块3和命令匹配模块8之间还连有一个自动学习模块5,所述自动学习模块5的输入端接语音采集模块3,输出端接命令匹配模块8,所述自动学习模块的作用是将采集的语音信息解析成为用户的自定义命令后输出。语音采集模块采集用户语音后输出给自动学习模块,自动学习模块将所述语音信息解析成为用户的自定义命令,然后输出到命令匹配模块,存储起来编入预设命令。此外,所述各个模块之间的连接,当连接的模块都在手机端或服务器端上时为电连接,当连接的模块分别在手机端和服务器端上时为借助通讯网络的无线连接。
【主权项】
1.一种语音识别输入的控制方法,包括依序进行的以下步骤: (1)语音输入,通过手机端输入采集语音; (2)语音转换文字,将语音信息转换成文本信息; (3)提取关键词,将文本信息的内容划分为关键词数组; (4)同义词替换,将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语; (5)命令匹配,对带有标准命令词语的文本信息与预设命令进行匹配得到完整的标准命令; (6 )命令发送,将标准命令通过网络发送到终端设备,控制终端设备完成相应动作。2.根据权利要求1所述的一种语音识别输入的控制方法,其特征是所述的步骤(5)命令匹配为一种计算机算法,所述预设命令为含有两个以上选项的多元组,匹配时把带有标准命令的文本信息和预设命令按照所述选项依序逐一匹配对应,当前一个选项匹配完成后再进行下一选项的匹配,直至完成全部选项的匹配。3.根据权利要求2所述的一种语音识别输入的控制方法,其特征是所述的多元组为三元组{操作,地点,设备}或四元组{操作,地点,设备,定时},匹配时把带有标准命令的文本信息和预设命令按照所述选项依序逐一匹配对应,当前一个选项匹配完成后再进行下一选项的匹配,直至完成全部三个或四个选项的匹配。4.根据权利要求1或2或3所述的一种语音识别输入的控制方法,其特征是所述的预设命令包括默认命令和自定义命令,所述默认命令是一套预设定的规则文本,自定义命令是用户自行定义的一套可识别的规则文本,所述默认命令和自定义命令组成命令集合。5.根据权利要求4所述的一种语音识别输入的控制方法,其特征是所述的命令匹配中,自定义命令优先于默认命令,带有标准命令词语的文本信息先和预设命令中的自定义命令进行匹配,匹配不成功的再和默认命令进行匹配。6.—种实现权利要求1所述方法的语音识别输入控制系统,包括依序相连的语音采集模块(3)、语音转换模块(6)、提取模块(9)、同义词替换模块(7)以及命令匹配模块(8)和命令发送模块(10),其中语音采集模块(3)用于采集语音信息;语音转换模块(6)用于将语音信息转换成文本信息;提取模块(9)用于将文本信息的内容划分为关键词数组;同义词替换模块(7)将关键词数组中的潜在命令词语用同义词进行替换,换成标准的命令词语;命令匹配模块(8)把带有标准命令词语的文本信息与存储的预设命令进行匹配得到完整的标准命令;命令发送模块(10)将标准命令通过网络发送到终端设备,控制终端设备完成相应动作。7.根据权利要求6所述的语音识别输入控制系统,其特征是所述的语音采集模块(3)和命令匹配模块(8)之间还连有一个命令生成模块(4),所述命令生成模块的输入端接语音采集模块,输出端接命令匹配模块(8)。8.根据权利要求6或7所述的语音识别输入控制系统,其特征是所述的语音采集模块(3)和命令匹配模块(8)之间还连有一个自动学习模块(5),所述自动学习模块(5)的输入端接语音采集模块(3),输出端接命令匹配模块(8)。
【专利摘要】本发明涉及计算机语音识别领域,特别是一种语音识别输入的控制方法及系统。现有语音识别输入控制存在以下缺陷:语音识别准确度单一,只有默认固定命令模板,不能满足用户多样性需求;命令内容固定死板,用同义词发出命令时,无法识别,导致语音识别输入失败。本发明提供了一种语音识别输入的控制方法及对应控制系统,将语音输入转成的文本信息用同义词进行替换,得到带有标准命令词语的文本信息后换分为关键词数组,然后对其中的潜在命令用同义词进行替换,再进行命令匹配,转换得到完整的标准命令,发送给终端设备,控制设备完成相应动作,所述语音识别输入的控制方法能够对用户的语音输入进行正确识别,且识别准确度高。
【IPC分类】G10L15/22, G06F17/27
【公开号】CN105488032
【申请号】CN201511031454
【发明人】吴超, 贺思思
【申请人】杭州智蚁科技有限公司
【公开日】2016年4月13日
【申请日】2015年12月31日