直播内容分类方法及装置的制造方法

xiaoxiao2021-2-28 254

直播内容分类方法及装置的制造方法
【技术领域】
[0001]本发明涉及网络技术领域，特别涉及一种直播内容分类方法及装置。
【背景技术】
[0002]随着网络技术的发展，网上直播的应用越来越广泛，很多直播用户会在频道中进行直播，而其他用户可以进入频道，观看直播用户直播的内容。由于不同直播用户直播的内容不同，为了方便对多个直播用户进行统一管理，可以根据每个直播用户直播的内容，确定每个直播用户的直播内容类型。
[0003]直播服务器可以提供多个内容类型，供直播用户选择，直播用户可以根据自己直播的内容，从多个内容类型中选择与直播的内容匹配的内容类型，作为自己的直播内容类型。而每个观众用户可以根据每个直播用户的直播内容类型选择感兴趣的直播用户。例如，直播用户的直播内容为演唱的歌曲，则直播用户可以将自己的直播内容类型确定为“天籁之音”类型或者“K歌达人”类型，则观众用户选择“天籁之音”类型或者“K歌达人”类型后，SP可观看该直播用户的直播内容。
[0004]在实现本发明的过程中，发明人发现现有技术至少存在以下问题:
[0005]需要直播用户手动选择直播内容类型，操作繁琐。而且，由于直播用户的直播内容可能会发生变化，变化后的直播内容可能会不符合预先选择的直播内容类型，导致分类不准确。

【发明内容】

[0006]为克服相关技术中存在的问题，本公开提供一种直播内容分类方法及装置。所述技术方案如下:
[0007]根据本公开实施例的第一方面，提供一种直播内容分类方法，所述方法包括:
[0008]在直播用户进行直播的过程中，获取所述直播用户的声音信息；
[0009]对所述声音信息进行特征提取，得到所述声音信息的内容特征信息；
[0010]根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型。
[0011]在另一实施例中，所述对所述声音信息进行特征提取，得到所述声音信息的内容特征信息，包括:
[0012]将所述声音信息转换为所述文本信息；
[0013]对所述文本信息进行特征提取，得到文本内容特征信息，所述文本内容特征信息包括至少一个关键词。
[0014]在另一实施例中，所述根据所述内容特征信息与每个内容类型的预设特征信息之间的匹配度，确定所述直播用户的直播内容类型，包括:
[0015]获取每个内容类型的预设文本内容特征信息，每个内容类型的预设文本内容特征信息包括至少一个关键词；
[0016]计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度；
[0017]按照匹配度从大到小的顺序，选取预设数目的匹配度；
[0018]将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0019]在另一实施例中，所述对所述声音信息进行特征提取，得到所述声音信息的内容特征信息，包括:
[0020]采用预设特征提取算法，对所述声音信息进行特征提取，得到所述声音信息的声音内容特征信息。
[0021]在另一实施例中，所述根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的内容类型，包括:
[0022]获取每个内容类型的预设声音内容特征信息；
[0023]计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度；
[0024]按照匹配度从大到小的顺序，选取预设数目的匹配度；
[0025]将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0026]在另一实施例中，所述对所述声音信息进行特征提取，得到所述声音信息的内容特征信息，包括:
[0027]获取所述声音信息中包含的用户声音信息，对所述用户声音信息进行特征提取，得到第一内容特征信息;或者，
[0028]获取所述声音信息中包含的环境声音信息，对所述环境声音信息进行特征提取，得到第二内容特征信息。
[0029]在另一实施例中，所述内容特征信息包括文本内容特征信息和声音内容特征信息;
[0030]所述根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型，包括:
[0031]获取每个内容类型的预设文本内容特征信息和预设声音内容特征信息；
[0032]计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，并计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度；
[0033]按照计算得到的匹配度从大到小的顺序，选取预设数目的匹配度；
[0034]将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0035]在另一实施例中，所述根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型之后，所述方法还包括:
[0036]建立所述直播用户的身份标识与所述确定的直播内容类型之间的对应关系。
[0037]在另一实施例中，所述方法还包括:
[0038]接收观众用户发送的查询请求，所述查询请求包括指定直播内容类型；
[0039 ]根据已建立的每个直播用户的身份标识与直播内容类型之间的对应关系，查询所述指定直播内容类型对应的身份标识；
[0040]向所述观众用户发送查询到的身份标识。[0041 ]根据本公开实施例的第二方面，提供一种直播内容分类装置，包括装置包括:
[0042]获取模块，用于在直播用户进行直播的过程中，获取所述直播用户的声音信息；
[0043]特征提取模块，用于对所述声音信息进行特征提取，得到所述声音信息的内容特征信息；
[0044]确定模块，用于根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型。
[0045]在另一实施例中，所述特征提取模块还用于将所述声音信息转换为所述文本信息，对所述文本信息进行特征提取，得到文本内容特征信息，所述文本内容特征信息包括至少一个关键词。
[0046]在另一实施例中，所述确定模块还用于获取每个内容类型的预设文本内容特征信息，每个内容类型的预设文本内容特征信息包括至少一个关键词，计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，按照匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0047]在另一实施例中，所述特征提取模块还用于采用预设特征提取算法，对所述声音信息进行特征提取，得到所述声音信息的声音内容特征信息。
[0048]在另一实施例中，所述特征提取模块还用于获取每个内容类型的预设声音内容特征信息，计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度，按照匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0049]在另一实施例中，所述特征提取模块还用于获取所述声音信息中包含的用户声音信息，对所述用户声音信息进行特征提取，得到第一内容特征信息，或者，获取所述声音信息中包含的环境声音信息，对所述环境声音信息进行特征提取，得到第二内容特征信息。
[0050]在另一实施例中，所述内容特征信息包括文本内容特征信息和声音内容特征信息;
[0051]所述确定模块还用于获取每个内容类型的预设文本内容特征信息和预设声音内容特征信息，计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，并计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度，按照计算得到的匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0052]在另一实施例中，所述装置还包括:
[0053]建立模块，用于建立所述直播用户的身份标识与所述确定的直播内容类型之间的对应关系。
[0054]在另一实施例中，所述装置还包括:
[0055]接收模块，用于接收观众用户发送的查询请求，所述查询请求包括指定直播内容类型；
[0056]查询模块，用于根据已建立的每个直播用户的身份标识与直播内容类型之间的对应关系，查询所述指定直播内容类型对应的身份标识；
[0057]发送模块，用于向所述观众用户发送查询到的身份标识。
[0058]本发明实施例提供的技术方案带来的有益效果是:
[0059]本发明实施例提供的方法及装置，通过在直播用户进行直播的过程中，获取直播用户的声音信息，对该声音信息进行特征提取，得到该声音信息的内容特征信息，根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的直播内容类型，在直播用户的直播内容发生变化时，也能够通过获取直播过程中的声音信息，确定与变化后的直播内容匹配的直播内容类型，无需直播用户预先手动选择直播内容类型，简化了直播用户的操作，也避免了变化后的直播内容与用户预先手动选择的直播内容类型不符的情况，提高了直播内容的分类准确性。
[0060]应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
【附图说明】
[0061]为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0062]图1是根据一示例性实施例示出的一种直播内容分类方法的流程图；
[0063]图2是根据另一示例性实施例示出的一种直播内容分类方法的流程图；
[0064]图3是根据一示例性实施例示出的一种直播内容分类装置的框图；
[0065]图4是根据另一示例性实施例示出的一种直播内容分类装置的框图；
[0066]图5是根据又一示例性实施例示出的一种直播内容分类装置的框图；
[0067]图6是根据又一示例性实施例示出的一种直播内容分类装置的框图。
【具体实施方式】
[0068]为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。
[0069]图1是本发明实施例提供的一种直播内容分类方法流程图，本发明实施例的执行主体为服务器，参见图1，该直播内容分类方法可以包括:
[0070]101、在直播用户进行直播的过程中，获取该直播用户的声音信息。
[0071]102、对该声音信息进行特征提取，得到该声音信息的内容特征信息。
[0072]103、根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的直播内容类型。
[0073]本发明实施例提供的方法，通过在直播用户进行直播的过程中，获取直播用户的声音信息，对该声音信息进行特征提取，得到该声音信息的内容特征信息，根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的直播内容类型，在直播用户的直播内容发生变化时，也能够通过获取直播过程中的声音信息，确定与变化后的直播内容匹配的直播内容类型，无需直播用户预先手动选择直播内容类型，简化了直播用户的操作，也避免了变化后的直播内容与用户预先手动选择的直播内容类型不符的情况，提高了直播内容的分类准确性。
[0074]可选地，对该声音信息进行特征提取，得到该声音信息的内容特征信息，包括:
[0075]将该声音信息转换为该文本信息；
[0076]对该文本信息进行特征提取，得到文本内容特征信息，该文本内容特征信息包括至少一个关键词。
[0077]可选地，根据该内容特征信息与每个内容类型的预设特征信息之间的匹配度，确定该直播用户的直播内容类型，包括:
[0078]获取每个内容类型的预设文本内容特征信息，每个内容类型的预设文本内容特征信息包括至少一个关键词；
[0079]计算该文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度；
[0080]按照匹配度从大到小的顺序，选取预设数目的匹配度；
[0081]将选取的匹配度所对应的内容类型确定为该直播用户的直播内容类型。
[0082]可选地，对该声音信息进行特征提取，得到该声音信息的内容特征信息，包括:
[0083]采用预设特征提取算法，对该声音信息进行特征提取，得到该声音信息的声音内容特征信息。
[0084]可选地，根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的内容类型，包括:
[0085]获取每个内容类型的预设声音内容特征信息；
[0086]计算该声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度；
[0087]按照匹配度从大到小的顺序，选取预设数目的匹配度；
[0088]将选取的匹配度所对应的内容类型确定为该直播用户的直播内容类型。
[0089]可选地，对该声音信息进行特征提取，得到该声音信息的内容特征信息，包括:
[0090]获取该声音信息中包含的用户声音信息，对该用户声音信息进行特征提取，得到第一内容特征信息;或者，
[0091]获取该声音信息中包含的环境声音信息，对该环境声音信息进行特征提取，得到第二内容特征信息。
[0092]可选地，该内容特征信息包括文本内容特征信息和声音内容特征信息；
[0093]根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的直播内容类型，包括:
[0094]获取每个内容类型的预设文本内容特征信息和预设声音内容特征信息；
[0095]计算该文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，并计算该声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度；
[0096]按照计算得到的匹配度从大到小的顺序，选取预设数目的匹配度；
[0097]将选取的匹配度所对应的内容类型确定为该直播用户的直播内容类型。
[0098]可选地，根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的直播内容类型之后，该方法还包括:
[0099]建立该直播用户的身份标识与该确定的直播内容类型之间的对应关系。
[0100]可选地，该方法还包括:
[0101]接收观众用户发送的查询请求，该查询请求包括指定直播内容类型；
[0102]根据已建立的每个直播用户的身份标识与直播内容类型之间的对应关系，查询该指定直播内容类型对应的身份标识；
[0103]向该观众用户发送查询到的身份标识。
[0104]上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再
--赘述。
[0105]图2是本发明实施例提供的一种直播内容分类方法流程图，本发明实施例的执行主体为服务器，参见图2，该直播内容分类方法可以包括:
[0106]201、在直播用户进行直播的过程中，获取该直播用户的声音信息。
[0107]本发明实施例中，该服务器可以创建一个或多个频道，任一用户可以作为直播用户，在频道中进行直播，其他用户可以作为观众用户，在该频道中观看直播用户的直播内容。在直播用户进行直播的过程中，直播用户当前使用的终端获取直播用户的声音信息，向服务器发送该声音信息，服务器接收该声音信息，并在频道中进行直播。
[0108]在直播过程中，直播用户的直播内容可能会发生变化，则为了保证在直播内容发生变化时能够准确地确定变化后的直播内容对应的内容类型，服务器在直播过程中获取直播用户的声音信息，以便根据声音信息确定当前直播内容匹配的直播内容类型。
[0109]可选地，服务器在获取声音信息时，可以从终端发送的声音信息中，截取预设时长的声音信息。其中，预设时长可以为1分钟、3分钟、5分钟等，本发明实施例对该预设时长不做限定。
[0110]另外，该服务器还可以周期性地获取该声音信息，该获取周期可以为1分钟、5分钟、10分钟等，本发明实施例对该声音信息的获取周期也不做限定。
[0111]例如，该预设时长为10秒，该获取周期为1分钟，服务器每隔1分钟截取10秒时长的声音信息，以此循环截取多段声音信息。
[0112]其中，声音信息包括用户声音信息和环境声音信息，该服务器获取到声音信息时，可以同时获取到用户声音信息和环境声音信息。用户声音信息用于指示直播用户说话的声音，而环境声音信息用于指示除直播用户声音以外的背景声音，如伴奏声音等，本发明实施例对此不做限定。
[0113]202、对该声音信息进行特征提取，得到该声音信息的内容特征信息。
[0114]具体地，服务器获取直播用户的声音信息后，对该声音信息进行特征提取，得到该声音信息的内容特征信息，该内容特征信息用于表示直播用户的直播内容。
[0115]本发明实施例中，采用不同的特征提取方式，可以获取到不同类型的内容特征信息。也即是，步骤202可以包括以下步骤2021-2023中的任一项:
[0116]2021、将该声音信息转换为该文本信息，对该文本信息进行特征提取，得到文本内容特征信息。
[0117]其中，该文本内容特征信息包括至少一个关键词，用于表示文本信息所指示内容的特征。
[0118]具体地，服务器获取到直播用户的声音信息后，根据语音识别算法，将声音信息转换为文本信息，采用预设分词算法对该文本信息进行分词处理，得到文本信息中的关键词，作为文本内容特征信息。
[0119]2022、采用预设特征提取算法，对该声音信息进行特征提取，得到该声音信息的声音内容特征信息。
[0120]本发明实施例中，服务器获取声音信息后，可以采用预设特征提取算法，对该声音信息进行特征提取，将提取到的特征信息作为声音内容特征信息，该声音内容特征信息用于表示声音信息所指示内容的特征。
[0121]进一步地，由于声音信息中包含不同种类的声音信息，则该服务器可以采用不同的预设特征提取算法，对该声音信息进行特征提取，得到不同种类的声音内容特征信息。例如，提取到的声音内容特征信息可以包括音调特征、音强特征、音色特征、频率特征、幅度特征和相位特征等，本发明实施例对此不做限定。
[0122]其中，该预设特征提取算法用于提取该声音信息的特征信息，可以为PCA(Principal Component Analysis，主分量分析法)、FDA(Linear Discriminant Analysis,线性判别分析法)、ICA(Independent Component Analysis，独立分量分析法)等，本发明实施例对该预设特征提取算法不做限定。
[0123]2023、将该声音信息转换为该文本信息，对该文本信息进行特征提取，得到文本内容特征信息，并采用预设特征提取算法，对该声音信息进行特征提取，得到该声音信息的声音内容特征信息。
[0124]步骤2023的具体过程与步骤2021、2022类似，在此不再赘述。
[0125]203、计算该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，按照计算得到的匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为该直播用户的内容类型。
[0126]具体地，为了在直播过程中确定与直播内容匹配的内容类型，该服务器可以预先确定每个内容类型的预设内容特征信息。内容类型可以包括:天籁之音、青春偶像、幽默搞笑、K歌达人、乐器达人、情感聊吧、游戏直播、视频播放和在线教育等类型，根据天籁之音、青春偶像、幽默搞笑、K歌达人等内容类型，可以预先确定预设天籁之音内容特征信息、预设青春偶像内容特征信息、预设幽默搞笑内容特征信息和预设κ歌达人内容特征信息等。
[0127]当根据直播用户的声音信息获取到内容特征信息后，可以获取每个内容类型的预设内容特征信息，将获取到的内容特征信息与每个内容类型的预设内容特征信息进行匹配，计算该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度。
[0128]其中，内容特征信息与预设内容特征信息之间的匹配度用于表示该内容特征信息与该预设内容特征信息的相似程度，对于每个内容类型的预设内容特征信息来说，若该内容特征信息与该预设内容特征信息的匹配度越高，表示该内容特征信息与该预设内容特征信息越相似，则该声音信息属于该预设内容特征信息对应的内容类型的可能性也越高。
[0129]在计算内容特征信息与每个内容类型的预设内容特征信息之间的匹配度后，按照匹配度从大到小的顺序进行排列，按照排列顺序选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为该直播用户的内容类型。
[0130]本发明实施例中，对于不同类型的内容特征信息，根据该内容特征信息确定该直播用户的内容类型的具体过程也不同。基于上述步骤2021-2023，根据该内容特征信息确定该直播用户的内容类型的过程可以包括以下步骤2031-2033中的至少一项:
[0131]2031、获取每个内容类型的预设文本内容特征信息，计算该文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，按照匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为该直播用户的直播内容类型。
[0132]基于上述步骤2021，服务器可以预先确定每个内容类型的预设文本内容特征信息，每个内容类型的预设文本内容特征信息包括至少一个关键词。例如，该内容类型可以为“幽默”、“情感”、“游戏”、“教育”等，如果内容类型为“教育”，则与“教育”对应的预设文本内容特征信息可以包括“英语教学”、“第一课”、“问题”等关键词。
[0133]当获取到声音信息的文本内容特征信息后，该服务器可以获取每个内容类型的预设文本内容特征信息，根据该文本内容特征信息中的关键词以及每个内容类型的预设文本内容特征信息中的关键词，计算该文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，并将计算得到的匹配度按照从大到小的顺序进行排列，按照排列顺序选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为该直播用户的内容类型。
[0134]具体地，计算该文本内容特征信息与某一个内容类型的预设文本内容特征信息之间的匹配度时，该服务器可以从该文本内容特征信息中的关键词中，选取与该内容类型对应的任一关键词相似的关键词，确定所选取的关键词的数目，作为该文本内容特征信息与该内容类型的预设文本内容特征信息之间的匹配度。或者，将所选取的关键词的数目与该内容类型对应的关键词的总数目之间的比例作为该文本内容特征信息与该内容类型的预设文本内容特征信息之间的匹配度。
[0135]进一步地，内容特征信息中包含的关键词可以为高频关键词或者普通关键词，则在计算匹配度时，该服务器可以将高频关键词和普通关键词区分开来，分别计算对应的匹配度。
[0136]具体地，该服务器预先设置高频词库和普通词库，并根据预先设置的高频词汇和普通词库，确定该文本内容特征信息中的高频关键词和普通关键词，从高频关键词中，选取与内容类型对应的任一关键词相似的关键词，确定所选取的关键词的数目，作为高频匹配度，从普通关键词中，选取与内容类型对应的任一关键词相似的关键词，确定所选取的关键词的数目，作为普通匹配度。此时，为了增加高频关键词对计算的匹配度的影响，该服务器可以根据第一权重对高频匹配度进行加权，得到加权高频匹配度，并根据第二权重对普通匹配度进行加权，得到加权普通匹配度，并计算加权高频匹配度与加权普通匹配度之和，作为该文本内容特征信息与该内容类型的预设文本内容特征信息之间的匹配度。其中，该第一权重大于该第二权重，可以由服务器预先确定。
[0137]例如，文本内容特征信息包括高频关键词A，普通关键词B、预设文本内容特征信息包括关键词A、B、C、D，第一权重为1.5，第二权重为1，则高频关键词A与预设文本内容特征信息中的关键词匹配，高频匹配度为1，且普通关键词B与预设文本内容特征信息中的关键词匹配，普通匹配度为1，根据第一权重和第二权重分别进行加权后，可以计算出加权高频匹配度为1.5，加权普通匹配度为1，则该文本内容特征信息与该预设文本内容特征信息之间的匹配度为2.5。
[0138]2032、获取每个内容类型的预设声音内容特征信息，计算该声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度，按照匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为该直播用户的直播内容类型。
[0139]基于上述步骤2022，服务器可以预先确定每个内容类型的预设声音内容特征信息，其中，服务器可以根据“男声”、“女声”、“童声”、“成年声音”、“沙哑声音”、“清悦声音”、“乐器类别”、“歌曲伴奏”、“劲爆音乐节奏”、“民谣音乐节奏”和“伤感音乐节奏”等多个内容类型，确定每个内容类型的预设声音内容特征信息。
[0140]2033、获取每个内容类型的预设文本内容特征信息和预设声音内容特征信息，每个内容类型的预设文本内容特征信息包括至少一个关键词，计算该文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，并计算该声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度，按照计算得到的匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为该直播用户的直播内容类型。
[0141]本步骤2033与上述步骤2031、步骤2032类似，对此不再赘述。
[0142]可选地，由于声音信息中包括用户声音信息和环境声音信息，因此在获取声音信息的内容特征信息时，获取声音信息中包含的用户声音信息，对用户声音信息进行特征提取，得到第一内容特征信息，获取声音信息中包含的环境声音信息，对环境声音信息进行特征提取，得到第二内容特征信息，根据第一内容特征信息和第二内容特征信息，确定直播用户的内容类型。
[0143]具体地，该服务器可以将用户声音信息转换为第一文本信息，对第一文本信息进行特征提取，得到第一文本内容特征信息，并且采用预设特征提取算法，对用户声音信息进行特征提取，得到第一声音内容特征信息;还可以将环境声音信息转换为第二文本信息，对第二文本信息进行特征提取，得到第二文本内容特征信息，并且采用预设特征提取算法，对环境声音信息进行特征提取，得到第二环境内容特征信息。
[0144]为了便于对多个内容类型的预设内容特征信息进行管理，可以将每个内容类型的预设内容特征信息存储于内容数据库中，例如将所有内容类型的预设内容特征信息存储于同一内容数据库，或者将不同内容类型的预设内容特征信息存储于不同的内容数据库，本发明实施例对此不做限定。进一步地，每个内容类型的预设内容特征信息可以包括预设文本内容特征信息和预设声音内容特征信息，这两种内容特征信息可以存储于同一内容数据库，也可以存储于不同的内容数据库，本发明实施例对此不做限定。
[0145]其中，该内容数据库可以为MySQL(关联数据管理系统)、0racle(关系数据管理系统)等，本发明实施例对该内容数据库的类型不做限定。
[0146]可选地，划分确定的多个内容类型中，有些内容类型之间互斥，不能兼容，而有些内容类型之间可以相互兼容。例如，“男声”和“女声”互斥，某一段声音信息只可能为“男声”或者“女声”，而不能同时为“男声”和“女声”。“女声”和“成年声音”可以兼容，一段声音信息为“女声”时，也可以为“成年声音”。
[0147]为了便于进行准确地分类，该服务器可以将多个内容类型中互斥的内容类型划分为一组，不同组中的内容类型可以相互兼容。例如，将“男声”和“女声”分为一组，“童声”和“成年声音”分为一组，“沙哑声音”和“清悦声音”分为一组，“劲爆音乐节奏”、“民谣音乐节奏”和“伤感音乐节奏”、分为一组，本发明实施例对此不做限定。
[0148]在进行分类时，该服务器仅会从每组中确定与声音信息匹配的一个内容类型。例如，对于每组来说，计算出该声音信息的内容特征信息与该组中每个内容类型的预设内容特征信息之间的匹配度之后，将每组中的最大匹配度对应的内容类型确定为该直播用户的内容类型。
[0149]例如，一个直播用户为成年女性，该直播用户声音沙哑，则该直播用户的直播内容为演唱的民谣歌曲时，确定的直播内容类型即为“女声”、“成年声音”、“沙哑声音”、“民谣音乐节奏”四种。
[0150]204、建立该直播用户的身份标识与该确定的直播内容类型之间的对应关系。
[0151]具体地，确定该直播用户的直播内容类型之后，该服务器可以获取该直播用户的身份标识，建立该直播用户的身份标识与该直播用户的直播内容类型之间的对应关系。
[0152]其中，该直播用户的身份标识用于表示该直播用户，可以是该直播用户的名称、账号，本实施例对此不做限定。
[0153]进一步地，当直播用户的直播内容发生变化时，服务器可以根据该直播用户的声音信息重新确定内容类型，如果确定的内容类型与该直播用户的原内容类型不同，该服务器可以在该对应关系中，将该直播用户的身份标识对应的原内容类型替换为重新确定的内容类型，实现对应关系的更新，从而实现对内容类型的更新。
[0154]上述步骤201-204仅是以确定一个直播用户的内容类型为例，而实际应用中，该服务器可以对不同直播用户分别执行步骤201-203，确定不同直播用户的内容类型，并建立每个直播用户的身份标识与确定的内容类型之间的对应关系，从而实现了对多个直播用户的直播内容分类。
[0155]后续在多个直播用户的直播过程中，观众用户可以根据感兴趣的内容查询到匹配的直播用户。
[0156]可选地，观众用户在使用的终端触发对指定内容类型的查询请求，服务器接收该观众用户发送的查询请求，根据已建立的每个直播用户的身份标识与直播内容类型之间的对应关系，查询该指定直播内容类型对应的身份标识，向该观众用户发送查询到的身份标识，观众用户即可从服务器发送的身份标识中，选择某一个身份标识，从而进入对应直播用户所在的频道，观看该直播用户的直播内容。
[0157]其中，该指定内容类型可以根据观众用户输入的搜索关键词确定，也即是，观众用户可以在该服务器提供的搜索页面中输入搜索关键词，并点击搜索按键触发该查询请求，则该服务器即可将该搜索关键词作为指定内容类型，返回与搜索关键词匹配的身份标识。
[0158]另外，该服务器可以为每个频道分配频道标识，该频道标识可以为频道序号、频道名称等，并根据当前在每个频道内进行直播的直播用户的身份标识，建立身份标识与频道标识之间的对应关系。那么，在观众用户查询指定内容类型对应的身份标识时，该服务器即可获取与该身份标识对应的频道标识，发送给观众用户，以便观众用户根据该频道标识进入对应直播用户所在的频道。
[0159]本发明实施例提供的方法，通过在直播用户进行直播的过程中，获取直播用户的声音信息，对该声音信息进行特征提取，得到该声音信息的内容特征信息，根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的直播内容类型，在直播用户的直播内容发生变化时，也能够通过获取直播过程中的声音信息，确定与变化后的直播内容匹配的直播内容类型，无需直播用户预先手动选择直播内容类型，简化了直播用户的操作，也避免了变化后的直播内容与用户预先手动选择的直播内容类型不符的情况，提高了直播内容的分类准确性。确定的直播内容类型能够准确反映当前的直播内容，观众用户根据直播内容类型可以准确查找到感兴趣的直播内容，提高了查找效率，提高了观众用户的粘度。
[0160]进一步地，通过建立直播用户的身份标识与该确定的直播内容类型之间的对应关系，观众用户可以快速查询到符合指定直播内容类型的直播用户，提高了查询效率。
[0161]图3是根据一示例性实施例示出的一种直播内容分类装置的框图，该直播内容分类装置可以用于服务器中，执行如图1或者图2中由服务器所执行的方法的全部或者部分步骤。如图3所示，该直播内容分类装置包括:获取模块301、特征提取模块302和确定模块303。
[0162]所述获取模块301，用于在直播用户进行直播的过程中，获取所述直播用户的声音信息；
[0163]所述特征提取模块302，用于对所述声音信息进行特征提取，得到所述声音信息的内容特征信息；
[0164]所述确定模块303，用于根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型。
[0165]本发明实施例提供的装置，通过在直播用户进行直播的过程中，获取直播用户的声音信息，对该声音信息进行特征提取，得到该声音信息的内容特征信息，根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的直播内容类型，在直播用户的直播内容发生变化时，也能够通过获取直播过程中的声音信息，确定与变化后的直播内容匹配的直播内容类型，无需直播用户预先手动选择直播内容类型，简化了直播用户的操作，也避免了变化后的直播内容与用户预先手动选择的直播内容类型不符的情况，提高了直播内容的分类准确性。
[0166]在另一实施例中，所述特征提取模块302还用于将所述声音信息转换为所述文本信息，对所述文本信息进行特征提取，得到文本内容特征信息，所述文本内容特征信息包括至少一个关键词。
[0167]在另一实施例中，其特征在于，所述确定模块303还用于获取每个内容类型的预设文本内容特征信息，每个内容类型的预设文本内容特征信息包括至少一个关键词，计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，按照匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0168]在另一实施例中，所述特征提取模块302还用于采用预设特征提取算法，对所述声音信息进行特征提取，得到所述声音信息的声音内容特征信息。
[0169]在另一实施例中，所述特征提取模块302还用于获取每个内容类型的预设声音内容特征信息，计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度，按照匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0170]在另一实施例中，所述特征提取模块302还用于获取所述声音信息中包含的用户声音信息，对所述用户声音信息进行特征提取，得到第一内容特征信息，或者，获取所述声音信息中包含的环境声音信息，对所述环境声音信息进行特征提取，得到第二内容特征信息。
[0171]在另一实施例中，所述内容特征信息包括文本内容特征信息和声音内容特征信息;
[0172]所述确定模块303还用于获取每个内容类型的预设文本内容特征信息和预设声音内容特征信息，计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，并计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度，按照计算得到的匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。
[0173]参见图4，在另一实施例中，所述装置还包括:建立模块304。
[0174]所述建立模块304，用于建立所述直播用户的身份标识与所述确定的直播内容类型之间的对应关系。
[0175]参见图5，在另一实施例中，所述装置还包括:接收模块305、查询模块306和发送模块307。
[0176]所述接收模块305，用于接收观众用户发送的查询请求，所述查询请求包括指定直播内容类型；
[0177]所述查询模块306，用于根据已建立的每个直播用户的身份标识与直播内容类型之间的对应关系，查询所述指定直播内容类型对应的身份标识；
[0178]所述发送模块307，用于向所述观众用户发送查询到的身份标识。
[017 9]图6是根据另一示例性实施例示出的一种直播内容分类装置的框图。例如，装置600可以被提供为一服务器。参照图6，装置600包括处理组件602，其进一步包括一个或多个处理器，以及由存储器604所代表的存储器资源，用于存储可由处理组件602的执行的指令，例如应用程序。存储器604中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件602被配置为执行指令，以执行上述直播内容分类方法。
[0180]装置600还可以包括一个电源组件606被配置为执行装置600的电源管理，一个有线或无线网络接口 608被配置为将装置600连接到网络，和一个输入输出(I/O)接口 610。装置600可以操作基于存储在存储器604的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM 或类似。
[0181]关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中执行了详细描述，此处将不做详细阐述说明。
[0182]本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0183]应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
【主权项】
1.一种直播内容分类方法，其特征在于，所述方法包括: 在直播用户进行直播的过程中，获取所述直播用户的声音信息；对所述声音信息进行特征提取，得到所述声音信息的内容特征信息；根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型。2.根据权利要求1所述的方法，其特征在于，所述对所述声音信息进行特征提取，得到所述声音信息的内容特征信息，包括: 将所述声音信息转换为所述文本信息；对所述文本信息进行特征提取，得到文本内容特征信息，所述文本内容特征信息包括至少一个关键词。3.根据权利要求2所述的方法，其特征在于，所述根据所述内容特征信息与每个内容类型的预设特征信息之间的匹配度，确定所述直播用户的直播内容类型，包括: 获取每个内容类型的预设文本内容特征信息，每个内容类型的预设文本内容特征信息包括至少一个关键词；计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度；按照匹配度从大到小的顺序，选取预设数目的匹配度；将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。4.根据权利要求1所述的方法，其特征在于，所述对所述声音信息进行特征提取，得到所述声音信息的内容特征信息，包括: 采用预设特征提取算法，对所述声音信息进行特征提取，得到所述声音信息的声音内容特征信息。5.根据权利要求4所述的方法，其特征在于，所述根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的内容类型，包括: 获取每个内容类型的预设声音内容特征信息；计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度；按照匹配度从大到小的顺序，选取预设数目的匹配度；将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。6.根据权利要求1所述的方法，其特征在于，所述对所述声音信息进行特征提取，得到所述声音信息的内容特征信息，包括: 获取所述声音信息中包含的用户声音信息，对所述用户声音信息进行特征提取，得到第一内容特征信息;或者，获取所述声音信息中包含的环境声音信息，对所述环境声音信息进行特征提取，得到第二内容特征信息。7.根据权利要求1所述的方法，其特征在于，所述内容特征信息包括文本内容特征信息和声音内容特征信息；所述根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型，包括: 获取每个内容类型的预设文本内容特征信息和预设声音内容特征信息；计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，并计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度；按照计算得到的匹配度从大到小的顺序，选取预设数目的匹配度；将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。8.根据权利要求1所述的方法，其特征在于，所述根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型之后，所述方法还包括: 建立所述直播用户的身份标识与所述确定的直播内容类型之间的对应关系。9.根据权利要求8所述的方法，其特征在于，所述方法还包括: 接收观众用户发送的查询请求，所述查询请求包括指定直播内容类型；根据已建立的每个直播用户的身份标识与直播内容类型之间的对应关系，查询所述指定直播内容类型对应的身份标识；向所述观众用户发送查询到的身份标识。10.一种直播内容分类装置，其特征在于，所述装置包括: 获取模块，用于在直播用户进行直播的过程中，获取所述直播用户的声音信息；特征提取模块，用于对所述声音信息进行特征提取，得到所述声音信息的内容特征信息; 确定模块，用于根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型。11.根据权利要求10所述的装置，其特征在于，所述特征提取模块还用于将所述声音信息转换为所述文本信息，对所述文本信息进行特征提取，得到文本内容特征信息，所述文本内容特征信息包括至少一个关键词。12.根据权利要求11所述的装置，其特征在于，所述确定模块还用于获取每个内容类型的预设文本内容特征信息，每个内容类型的预设文本内容特征信息包括至少一个关键词，计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，按照匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。13.根据权利要求10所述的装置，其特征在于，所述特征提取模块还用于采用预设特征提取算法，对所述声音信息进行特征提取，得到所述声音信息的声音内容特征信息。14.根据权利要求13所述的装置，其特征在于，所述特征提取模块还用于获取每个内容类型的预设声音内容特征信息，计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度，按照匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。15.根据权利要求10所述的装置，其特征在于，所述特征提取模块还用于获取所述声音信息中包含的用户声音信息，对所述用户声音信息进行特征提取，得到第一内容特征信息，或者，获取所述声音信息中包含的环境声音信息，对所述环境声音信息进行特征提取，得到第二内容特征信息。16.根据权利要求10所述的装置，其特征在于，所述内容特征信息包括文本内容特征信息和声音内容特征信息；所述确定模块还用于获取每个内容类型的预设文本内容特征信息和预设声音内容特征信息，计算所述文本内容特征信息与每个内容类型的预设文本内容特征信息之间的匹配度，并计算所述声音内容特征信息与每个内容类型的预设声音内容特征信息之间的匹配度，按照计算得到的匹配度从大到小的顺序，选取预设数目的匹配度，将选取的匹配度所对应的内容类型确定为所述直播用户的直播内容类型。17.根据权利要求10所述的装置，其特征在于，所述装置还包括: 建立模块，用于建立所述直播用户的身份标识与所述确定的直播内容类型之间的对应关系。18.根据权利要求17所述的装置，其特征在于，所述装置还包括: 接收模块，用于接收观众用户发送的查询请求，所述查询请求包括指定直播内容类型；查询模块，用于根据已建立的每个直播用户的身份标识与直播内容类型之间的对应关系，查询所述指定直播内容类型对应的身份标识；发送模块，用于向所述观众用户发送查询到的身份标识。
【专利摘要】本发明公开了一种直播内容分类方法及装置，属于网络技术领域。所述方法包括：获取所述直播用户的声音信息；对所述声音信息进行特征提取，得到所述声音信息的内容特征信息；根据所述内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定所述直播用户的直播内容类型。本发明通过获取直播用户的声音信息，对该声音信息进行特征提取，得到该声音信息的内容特征信息，根据该内容特征信息与每个内容类型的预设内容特征信息之间的匹配度，确定该直播用户的直播内容类型，无需直播用户预先手动选择直播内容类型，简化了直播用户的操作，也避免了变化后的直播内容与用户预先手动选择的直播内容类型不符的情况，提高了直播内容的分类准确性。
【IPC分类】G06F17/30
【公开号】CN105488135
【申请号】CN201510831054
【发明人】韦传毅
【申请人】广州酷狗计算机科技有限公司
【公开日】2016年4月13日
【申请日】2015年11月25日

技术

最新回复(0)