一种信息处理方法及电子设备的制造方法

xiaoxiao2020-10-23  11

一种信息处理方法及电子设备的制造方法
【技术领域】
[0001]本发明涉及计算机技术领域,特别涉及一种信息处理方法及电子设备。
【背景技术】
[0002]随着科学技术的不断发展,电子技术也得到了飞速的发展,电子产品的种类也越来越多,人们也享受到了科技发展带来的各种便利。现在人们可以通过各种类型的电子设备享受随着科技发展带来的舒适生活。比如,手机等电子设备已经成为人们生活中一个不可或缺的部分,人们可以通过手机等电子设备以打电话、发短信等等方式加强与其他人之间的联系。
[0003]对一个用户输入的一个固定语音信息,电子设备都会生成一个向量来对该语音信息进行描述。例如用户A通过语音输入“你好北京”,则电子设备可以生成一个向量来描述用户A的语音特征,用户A每输入一次“你好北京”,电子设备都会生成一个向量,将电子设备第一次根据用户A输入的“你好北京”生成的向量称为训练向量(training vector)。
[0004]目前,对于用户A输入的一个语音信息,例如“你好北京”,在生成一个测试向量后会将该训练向量进行存储,之后凡是用户通过语音输入“你好北京”,电子设备都会利用之前存储的训练向量与该语音信息进行匹配。而对于同一个人来说,其在不同阶段的声音特征可能是不同的,一个人从小到大,声音处于不断的变化中,一般来说,几个月之前的声音和几个月之后的声音都无法达到完全相同。显然,如果一直使用最初的训练向量对用户的声音进行匹配,则在某些情况下,由于用户的声音发生了变化,训练向量会出现误差,很可能会出现训练向量无法完成匹配的情况。

【发明内容】

[0005]本发明实施例提供一种信息处理方法及电子设备,用于解决现有技术中训练向量因出现误差而无法完成语音匹配的技术问题。
[0006]一种信息处理方法,应用于电子设备,包括以下步骤:
[0007]获得第一语音信息;
[0008]根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量;
[0009]将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果;
[0010]判断所述第一特定运算结果是否满足预设条件;
[0011]当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。
[0012]较佳的,在获得第一语音信息之前,还包括:
[0013]获得第二语音信息;
[0014]根据所述第二语音信息生成所述预设训练向量;其中,所述预设训练向量为用于对所述第二语音信息的特征进行识别的向量,所述第二语音信息的文字内容与所述第一语音信息的文字内容相同。
[0015]较佳的,将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果,包括:
[0016]确定所述第一语音信息的特征信息与所述第二语音信息的特征信息是否相匹配;
[0017]当所述第一语音信息的特征信息与所述第二语音信息的特征信息相匹配时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第一特定运算,获得所述第一特定运算结果。
[0018]较佳的,当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,包括:
[0019]当所述第一特定运算结果满足所述预设条件时,判断所述测试向量的信噪比是否高于所述预设训练向量的信噪比;
[0020]当所述测试向量的信噪比高于所述预设训练向量的信噪比时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0021]较佳的,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,包括:
[0022]为所述预设训练向量分配第一权重,及为所述测试向量分配第二权重;
[0023]将所述第一权重的所述预设训练向量的特征值、及所述第二权重的所述测试向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0024]较佳的,用所述替换向量替换所述预设训练向量,包括:
[0025]判断上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长是否不小于预设时长;
[0026]当所述间隔时长不小于所述预设时长时,令所述替换向量替换所述预设训练向量。
[0027]一种电子设备,包括:
[0028]获取模块,用于获得第一语音信息;
[0029]生成模块,用于根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量;
[0030]处理模块,用于将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果;
[0031]判断模块,用于判断所述第一特定运算结果是否满足预设条件;
[0032]替换模块,用于当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。
[0033]较佳的,所述获取模块还用于获得第二语音信息;
[0034]所述生成模块还用于根据所述第二语音信息生成所述预设训练向量;其中,所述预设训练向量为用于对所述第二语音信息的特征进行识别的向量,所述第二语音信息的文字内容与所述第一语音信息的文字内容相同。
[0035]较佳的,所述处理模块具体用于:确定所述第一语音信息的特征信息与所述第二语音信息的特征信息是否相匹配;当所述第一语音信息的特征信息与所述第二语音信息的特征信息相匹配时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第一特定运算,获得所述第一特定运算结果。
[0036]较佳的,所述替换模块具体用于:当所述第一特定运算结果满足所述预设条件时,判断所述测试向量的信噪比是否高于所述预设训练向量的信噪比;当所述测试向量的信噪比高于所述预设训练向量的信噪比时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0037]较佳的,所述替换模块具体用于:为所述预设训练向量分配第一权重,及为所述测试向量分配第二权重;将所述第一权重的所述预设训练向量的特征值、及所述第二权重的所述测试向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0038]较佳的,所述替换模块具体用于用所述替换向量替换所述预设训练向量,具体为:判断上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长是否不小于预设时长;当所述间隔时长不小于所述预设时长时,令所述替换向量替换所述预设训练向量。
[0039]本发明实施例中,所述电子设备在生成所述测试向量后,可以将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,获得所述替换向量,可以利用所述替换向量替换所述预设训练向量。其中,所述预设训练向量为所述电子设备之前根据所述第一语音信息生成的向量。例如,用户通过语音输入“你好北京”,当用户第一次输入时,所述电子设备生成所述预设训练向量,当用户之后再次输入时,所述电子设备生成所述测试向量,则所述电子设备可以根据所述测试向量和所述预设训练向量得到所述替换向量,从而可以不断地根据用户变化的语音特征来得到新的向量,不局限于一直使用最初的所述预设训练向量来与所述第一语音信息进行匹配,增加匹配准确度,避免出现因预设训练向量时间过长而无法完成匹配。
[0040]并且,本发明实施例中是根据所述测试向量和所述 预设训练向量来得到所述替换向量,得到新的向量的过程较为平缓,不会有太过突兀的变化,与用户缓慢变化的声音相适应,尽量提高匹配准确度。
【附图说明】
[0041]图1为本发明实施例中信息处理方法的主要流程图;
[0042]图2为本发明实施例中电子设备的主要结构框图。
【具体实施方式】
[0043]本发明实施例中的信息处理方法可以应用于电子设备,所述方法可以包括:获得第一语音信息;根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量;将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果;判断所述特定运算结果是否满足预设条件;当所述特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。
[0044]本发明实施例中,所述电子设备在生成所述测试向量后,可以将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,获得所述替换向量,可以利用所述替换向量替换所述预设训练向量。其中,所述预设训练向量为所述电子设备之前根据所述第一语音信息生成的向量。例如,用户通过语音输入“你好北京”,当用户第一次输入时,所述电子设备生成所述预设训练向量,当用户之后再次输入时,所述电子设备生成所述测试向量,则所述电子设备可以根据所述测试向量和所述预设训练向量得到所述替换向量,从而可以不断地根据用户变化的语音特征来得到新的向量,不局限于一直使用最初的所述预设训练向量来与所述第一语音信息进行匹配,增加匹配准确度,避免出现因预设训练向量时间过长而无法完成匹配。
[0045]并且,本发明实施例中是根据所述测试向量和所述预设训练向量来得到所述替换向量,得到新的向量的过程较为平缓,不会有太过突兀的变化,与用户缓慢变化的声音相适应,尽量提高匹配准确度。
[0046]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0047]本发明实施例中,所述电子设备可以是PC (个人计算机)、笔记本、PAD (平板电脑)、手机、智能电视等等不同的电子设备,本发明对此不作限制。
[0048]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0049]下面结合附图对本发明优选的实施方式进行详细说明。
[0050]请参见图1,本发明实施例提供一种信息处理方法,所述方法可以应用于电子设备,所述方法的主要流程描述如下。
[0051]步骤101:获得第一语首?目息。
[0052]当用户输入所述第一语音信息时,所述电子设备可以获得所述第一语音信息。例如,所述电子设备可以具有音频输入单元,用户可以通过所述音频输入单元向所述电子设备输入所述第一语音信息。例如所述音频输入单兀为麦克。
[0053]较佳的,本发明实施例中,在获得所述第一语音信息之前,还可以包括:获得第二语音信息;根据所述第二语音信息生成预设训练向量;其中,所述预设训练向量为用于对所述第二语音信息的特征进行识别的向量,所述第二语音信息的文字内容与所述第一语音信息的文字内容相同,且所述第二语音信息的输入用户与所述第一语音信息的输入用户为同一用户。
[0054]例如,用户A在第一时刻,首次向所述电子设备中输入“我爱地坛”这一语音信息,则该语音信息为所述第二语音信息,所述电子设备根据所述第二语音信息生成所述预设训练向量。在所述第一时刻之后的第二时刻,所述用户A再次向所述电子设备中输入“我爱地坛”这一语音信息,此时该语音信息为所述第一语音信息,所述电子设备根据所述第一语音信息生成所述测试向量。可以看到,所述第一语音信息和所述第二语音信息为同一用户在不同时刻向所述电子设备中输入的内容相同的语音信息。
[0055]步骤102:根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量。
[0056]所述电子设备在获得所述第一语音信息后,可以根据所述第一语音信息生成所述测试向量,根据所述测试向量可以对所述第一语音信息进行识别,不仅可以识别所述第一语音信息的语义,还可以识别所述第一语音信息的声音特征。
[0057]步骤103:将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果。
[0058]对于一个语音信息来说,可以将其分为多个帧,每一帧都可以用特定维数的向量来表示,例如可以是12维向量、24维向量,等等,本发明对此不作限制。当然,对于一个语音信息来说,其中的每一巾贞都用相同维数的向量来表不。
[0059]对于每一帧语音来说,其用一个特定维数的向量来表示该帧的特征值。则,对于其中一帧语音来说,将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,可以是求所述测试向量的特征值与预设训练向量的特征值之间的距离。
[0060]步骤104:判断所述第一特定运算结果是否满足预设条件。
[0061]在获得所述第一特定运算结果后,可以判断所述第一特定运算结果是否满足所述预设条件。
[0062]例如,针对其中的一帧,求12维的测试向量与12维的预设训练向量之间的距离,得到一个运算结果,则对每一帧都可以得到一个运算结果,得到的所有运算结果构成所述第一运算结果。
[0063]本发明实施例中,例如可以将得到的所有运算结果进行累加,累加后得到的结果为所述第一特定运算结果,之后再判断所述第一特定运算结果是否满足所述预设条件。
[0064]所述预设条件可以表述为:所述第一特定运算结果对应的距离小于预设距离。则,如果所述第一特定运算结果对应的距离小于所述预设距离,就可以确定所述第一特定运算结果满足所述预设条件。
[0065]较佳的,本发明实施例中,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第一特定运算,获得所述第一特定运算结果,可以包括:确定所述第一语音信息的特征信息与所述第二语音信息的特征信息是否相匹配;当所述第一语音信息的特征信息与所述第二语音信息的特征信息相匹配时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第一特定运算,获得所述第一特定运算结果。
[0066]S卩,在得到所述测试向量后,可以首先判断所述测试向量的特征信息与所述预设训练向量的特征信息是否匹配,相当于根据声纹特征判断所述测试向量对应的所述第一语音信息和所述预设训练向量对应的所述第二语音信息的输入用户是否为同一用户,及通过语义判断所述第一语音信息的内容与所述第二语音信息的内容是否完全相同。如果判断确定所述第一语音信息所述第二语音信息的输入用户为同一用户,及所述第一语音信息的内容与所述第二语音信息的内容完全相同,则可以确定所述第一语音信息的特征信息与所述第二语音信息的特征信息相匹配。
[0067]步骤105:当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。
[0068]如果所述第一特定运算结果满足所述预设条件,则所述电子设备可以获得一个新的向量,即所述替换向量。
[0069]较佳的,本发明实施例中,当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据获得的第二特定运算 结果获得所述替换向量,可以包括:当所述第一特定运算结果满足所述预设条件时,判断所述测试向量的信噪比是否高于所述预设训练向量的信噪比;当所述测试向量的信噪比高于所述预设训练向量的信噪比时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0070]如果所述测试向量的信噪比是否高于所述预设训练向量的信噪比,说明所述测试向量优于所述预设训练向量,则生成的所述替换向量的质量会优于所述预设训练向量,替换才会更有意义。
[0071]较佳的,本发明实施例中,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据获得的第二特定运算结果获得所述替换向量,可以包括:为所述预设训练向量分配第一权重,及为所述测试向量分配第二权重;将所述第一权重的所述预设训练向量的特征值、及所述第二权重的所述测试向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0072]较佳的,本发明实施例中,用所述替换向量替换所述预设训练向量,可以包括:判断上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长是否不小于预设时长;当所述间隔时长不小于所述预设时长时,令所述替换向量替换所述预设训练向量。
[0073]本发明实施例中,由于人声的变化过程很缓慢,因此替换过程无需过于频繁,如果替换的过于频繁,一是会增加电子设备的负担,另外也可能反而比人的真正声音变化快,也给匹配造成一定难度。因此,本发明实施例中,最好的替换周期是I个月左右,这样能尽量保证与人声的变化相适应,不会因为变化过快而造成匹配困难。
[0074]本发明实施例中,并不是简单的以新得到的所述测试向量来替换所述预设训练向量,而是将所述测试向量与所述预设训练向量进行运算,根据得到的所述替换向量来替换所述预设训练向量,这样得到的所述替换向量是在所述预设训练向量的基础上得到的,不会使变化过于突兀,更加符合人声缓慢变化的特点。
[0075]以下通过一个具体的实施例来介绍本发明实施例中的信息处理方法。需要说明的是,下面的实施例只是给出了一个可能的例子,其中的数字都不代表真实数字,本领域技术人员明确理论过程即可。
[0076]假设所述电子设备中预先存储有所述预设训练向量,所述预设训练向量中包含了 100帧语音,每一帧语音我们用12个数字表示这帧语音的一个特征值,即12维向量。例如针对其中的一帧语音,我们用如下12维向量来表征:
[0077]288430
[0078]-104493
[0079]-90663
[0080]-434320
[0081]-101736
[0082]72605
[0083]-193068
[0084]-63643
[0085]-115829
[0086]-19981
[0087]-65669
[0088]-43204
[0089]同时,所述电子设备还可以记录与所述预设训练向量对应的SNR (信噪比)值,比如为38.17。
[0090]对每一帧语音来说,其12维向量都是经过一系列数学运算得到,可以将该运算称作ΑΑΑ0,入口数据是一帧语音的PCM data (脉冲编码调制数据),那么对于一帧语音来说,其特征值=AAA (PCM)
[0091]之后,所述电子设备获得了所述测试向量,所述测试向量也包括100帧语音,经过同样的运算ΑΑΑ0,得到100个特征值。例如对于一帧语音来说,其特征值为一个12维向量,例如一个12维向量表示如下:
[0092]288430
[0093]-104493
[0094]-90663
[0095]-434320
[0096]-101736
[0097]72605
[0098]-193068
[0099]-63643
[0100]-115829
[0101]-19981
[0102]-65669
[0103]-43204
[0104]在得到所述测试向量后,通过一匹配算法,确定所述预设训练向量的特征信息与所述测试向量的特征信息是否匹配。例如本实施例中确定所述预设训练向量的特征信息与所述测试向量的特征信息相匹配。
[0105]假设所述预设训练向量的第η帧的12维向量表示为Α0,Al...All,所述测试向量的第η帧的12维向量表示为Β0,B1...Β11,可以计算所述测试向量和所述预设训练向量的欧氏距离:
[0106]sqrt ((AO-BO)2+ (Al-Bl)2+ (A2—B2)2+ (A3—B3)2+…+ (Al 1—B11)2) =D (I)
[0107]其中,sqrt表示开平方,D表示所述测试向量和所述预设训练向量的欧氏距离。当然,也可以计算其他距离,本实施例只是以欧式距离来举例说明。
[0108]因为共有100帧语音,则共可以得到100个欧式距离值,累加这100个欧氏距离值,判断累加总和是否小于预定距离值。如果累加总和小于所述预定距离值,就可以认为所述测试向量与所述预设训练向量比较接近。
[0109]对于每一帧语音来说,其具有一个能量值,例如100帧语音的能量值可以分别表示为E0,E1,E2,E3。。。E99。举个例子来说,En=34。可以根据如下公式求所述测试向量的SNR。
[0110]SNR=0.37*((E0+E1+E2...+E99)/100 (2)
[0111]较佳的,判断所述测试向量的SNR是否高于所述预设训练向量的SNR,如果所述测试向量的SNR高于所述预设训练向量的SNR,则确定可以获得所述替换向量。
[0112]将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,例如:
[0113]对于其中的第η帧:
[0114]CO=0.9*Α0+0.1*Β0
[0115]Cl=0.9*Α1+0.1*Β1
[0116]C2=0.9*Α2+0.1*Β2
[0117]........................
[0118]Cll=0.9*Α11+0.1*Β11
[0119]其中,CO,C1,C2?".C11,表示所述替换向量的第η帧的12维向量,0.9是为所述预设训练向量分配的所述第一权重,0.1表示为所述测试向量分配的所述第二权重。共可以得到100个12维向量,则可以根据新的100个12维向量得到所述替换向量。
[0120]其中,具体为所述预设训练向量和所述测试向量分别分配多少权重,可以根据实际经验确定。一般来说,所述第一权重需要大于所述第二权重。
[0121]较佳的,当所述第一权重为0.9、所述第二权重为0.1时,得到的效果较好。
[0122]在得到所述替换向量后,可以判断上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长是否不小于所述预设时长,如果上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长不小于所述预设时长,则可以令所述替换向量替换所述预设训练向量,如果上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长小于所述预设时长,则可以先存储所述替换向量,等到上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长不小于所述预设时长时,再令所述替换向量替换所述预设训练向量。
[0123]请参见图2,基于同一发明构思,本发明实施例提供一种电子设备,所述电子设备可以包括获取模块201、生成模块202、处理模块203、判断模块204和替换模块205。
[0124]获取模块201可以用于获得第一语音信息。
[0125]生成模块202可以用于根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量。
[0126]处理模块203 可以用于将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果。
[0127]判断模块204可以用于判断所述第一特定运算结果是否满足预设条件。
[0128]替换模块205可以用于当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。
[0129]较佳的,本发明实施例中,获取模块201还可以用于获得第二语音信息;生成模块202还可以用于根据所述第二语音信息生成所述预设训练向量;其中,所述预设训练向量为用于对所述第二语音信息的特征进行识别的向量,所述第二语音信息的文字内容与所述第一语音信息的文字内容相同。
[0130]较佳的,本发明实施例中,处理模块203具体可以用于:确定所述第一语音信息的特征信息与所述第二语音信息的特征信息是否相匹配;当所述第一语音信息的特征信息与所述第二语音信息的特征信息相匹配时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第一特定运算,获得所述第一特定运算结果。
[0131]较佳的,本发明实施例中,替换模块205具体可以用于当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,具体为:当所述第一特定运算结果满足所述预设条件时,判断所述测试向量的信噪比是否高于所述预设训练向量的信噪比;当所述测试向量的信噪比高于所述预设训练向量的信噪比时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0132]较佳的,本发明实施例中,替换模块205具体可以用于将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,具体为:为所述预设训练向量分配第一权重,及为所述测试向量分配第二权重;将所述第一权重的所述预设训练向量的特征值、及所述第二权重的所述测试向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0133]较佳的,本发明实施例中,替换模块205具体可以用于用所述替换向量替换所述预设训练向量,具体为:判断上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长是否不小于预设时长;当所述间隔时长不小于所述预设时长时,令所述替换向量替换所述预设训练向量。
[0134]本发明实施例中的信息处理方法可以应用于电子设备,所述方法可以包括:获得第一语音信息;根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量;将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果;判断所述特定运算结果是否满足预设条件;当所述特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。
[0135]本发明实施例中,所述电子设备在生成所述测试向量后,可以将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,获得所述替换向量,可以利用所述替换向量替换所述预设训练向量。其中,所述预设训练向量为所述电子设备之前根据所述第一语音信息生成的向量。例如,用户通过语音输入“你好北京”,当用户第一次输入时,所述电子设备生成所述预设训练向量,当用户之后再次输入时,所述电子设备生成所述测试向量,则所述电子设备可以根据所述测试向量和所述预设训练向量得到所述替换向量,从而可以不断地根据用户变化的语音特征来得到新的向量,不局限于一直使用最初的所述预设训练向量来与所述第一语音信息进行匹配,增加匹配准确度,避免出现因预设训练向量时间过长而无法完成匹配。
[0136]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0137]在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0138]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0139]另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0140]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM, Read-Only Memory)、随机存取存储器(RAM, Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0141]具体来讲,本申请实施例中的一种信息处理方法对应的计算机程序指令可以被存储在光盘,硬盘,U盘等存储介质上,当存储介质中的与一种信息处理方法对应的计算机程序指令被一电子设备读取或被执行时,包括如下步骤:
[0142]获得第一语音信息;
[0143]根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量;
[0144]将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果;
[0145]判断所述第一特定运算结果是否满足预设条件;
[0146]当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。
[0147]可选的,所述存储介质中存储的与步骤:获得第一语音信息,对应的计算机指令在具体被执行之前,还包括:
[0148]获得第二语音信息;
[0149]根据所述第二语音信息生成所述预设训练向量;其中,所述预设训练向量为用于对所述第二语音信息的特征进行识别的向量,所述第二语音信息的文字内容与所述第一语音信息的文字内容相同。
[0150]可选的,所述存储介质中存储的与步骤:将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果,对应的计算机指令在具体被执行过程中,具体包括:
[0151]确定所述第一语音信息的特征信息与所述第二语音信息的特征信息是否相匹配;
[0152]当所述第一语音信息的特征信息与所述第二语音信息的特征信息相匹配时,将所述测试向量的特征值与所述 预设训练向量的特征值进行所述第一特定运算,获得所述第一特定运算结果。
[0153]可选的,所述存储介质中存储的与步骤:当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,对应的计算机指令在具体被执行过程中,具体包括:
[0154]当所述第一特定运算结果满足所述预设条件时,判断所述测试向量的信噪比是否高于所述预设训练向量的信噪比;
[0155]当所述测试向量的信噪比高于所述预设训练向量的信噪比时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0156]可选的,所述存储介质中存储的在与步骤:将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,对应的计算机指令在被执行的过程中,具体包括:
[0157]为所述预设训练向量分配第一权重,及为所述测试向量分配第二权重;
[0158]将所述第一权重的所述预设训练向量的特征值、及所述第二权重的所述测试向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。
[0159]可选的,所述存储介质中存储的在与步骤:用所述替换向量替换所述预设训练向量,对应的计算机指令在被执行的过程中,具体包括:
[0160]判断上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长是否不小于预设时长;
[0161]当所述间隔时长不小于所述预设时长时,令所述替换向量替换所述预设训练向量。
[0162]以上所述,以上实施例仅用以对本申请的技术方案进行了详细介绍,但以上实施例的说明只是用于帮助理解本发明的方法及其核心思想,不应理解为对本发明的限制。本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
【主权项】
1.一种信息处理方法,应用于电子设备,包括以下步骤: 获得第一语首?目息; 根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量; 将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果; 判断所述第一特定运算结果是否满足预设条件; 当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。2.如权利要求1所述的方法,其特征在于,在获得第一语音信息之前,还包括: 获得第二语首?目息; 根据所述第二语音信息生成所述预设训练向量;其中,所述预设训练向量为用于对所述第二语音信息的特征进行识别的向量,所述第二语音信息的文字内容与所述第一语音信息的文字内容相同。3.如权利要求1所述的方法,其特征在于,将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果,包括: 确定所述第一语音信息的特征信息与所述第二语音信息的特征信息是否相匹配; 当所述第一语音信息的特征信息与所述第二语音信息的特征信息相匹配时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第一特定运算,获得所述第一特定运算结果。4.如权利要求1所述的方法,其特征在于,当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,包括: 当所述第一特定运算结果满足所述预设条件时,判断所述测试向量的信噪比是否高于所述预设训练向量的信噪比; 当所述测试向量的信噪比高于所述预设训练向量的信噪比时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。5.如权利要求1所述的方法,其特征在于,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,包括: 为所述预设训练向量分配第一权重,及为所述测试向量分配第二权重; 将所述第一权重的所述预设训练向量的特征值、及所述第二权重的所述测试向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。6.如权利要求1所述的方法,其特征在于,用所述替换向量替换所述预设训练向量,包括: 判断上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长是否不小于预设时长; 当所述间隔时长不小于所述预设时长时,令所述替换向量替换所述预设训练向量。7.—种电子设备,包括: 获取模块,用于获得第一语音信息; 生成模块,用于根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量; 处理模块,用于将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果; 判断模块,用于判断所述第一特定运算结果是否满足预设条件; 替换模块,用于当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。8.如权利要求7所述的电子设备,其特征在于,所述获取模块还用于获得第二语音信息; 所述生成模块还用于根据所述第二语音信息生成所述预设训练向量;其中,所述预设训练向量为用于对所述第二语音信息的特征进行识别的向量,所述第二语音信息的文字内容与所述第一语音信息的文字内容相同。9.如权利要求7所述的电子设备,其特征在于,所述处理模块具体用于:确定所述第一语音信息的特征信息与所述第二语音信息的特征信息是否相匹配;当所述第一语音信息的特征信息与所述第二语音信息的特征信息相匹配时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第一特定运算,获得所述第一特定运算结果。10.如权利要求7所述的电子设备,其特征在于,所述替换模块具体用于:当所述第一特定运算结果满足所述预设条件时,判断所述测试向量的信噪比是否高于所述预设训练向量的信噪比;当所述测试向量的信噪比高于所述预设训练向量的信噪比时,将所述测试向量的特征值与所述预设训练向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。11.如权利要求7所述的电子设备,其特征在于,所述替换模块具体用于:为所述预设训练向量分配第一权重,及为所述测试向量分配第二权重;将所述第一权重的所述预设训练向量的特征值、及所述第二权重的所述测试向量的特征值进行所述第二特定运算,根据所述第二特定运算结果获得所述替换向量。12.如权利要求7所述的电子设备,其特征在于,所述替换模块具体用于用所述替换向量替换所述预设训练向量,具体为:判断上次替换所述预设训练向量的时刻与当前时刻之间的间隔时长是否不小于预设时长;当所述间隔时长不小于所述预设时长时,令所述替换向量替换所述预设训练向量。
【专利摘要】本发明公开了一种信息处理方法,用于较好地完成语音匹配。所述方法包括:获得第一语音信息;根据所述第一语音信息生成测试向量;所述测试向量为用于对所述第一语音信息的特征进行识别的向量;将所述测试向量的特征值与预设训练向量的特征值进行第一特定运算,获得第一特定运算结果;判断所述第一特定运算结果是否满足预设条件;当所述第一特定运算结果满足所述预设条件时,将所述测试向量的特征值与所述预设训练向量的特征值进行第二特定运算,根据获得的第二特定运算结果获得一替换向量,并用所述替换向量替换所述预设训练向量。本发明还公开了相应的电子设备。
【IPC分类】G10L15/06, G10L25/48
【公开号】CN104900230
【申请号】CN201410074880
【发明人】屠嘉晋, 章丹峰
【申请人】联想(北京)有限公司
【公开日】2015年9月9日
【申请日】2014年3月3日

最新回复(0)