本技术涉及计算机,具体涉及机器学习领域,尤其涉及一种数据推荐处理方法、装置、设备、介质及程序产品。
背景技术:
1、在互联网快速发展的时代,人们可以根据需要通过手机、个人电脑、平板电脑等智能设备来获取各种各样的资讯,然而随着内容生产的门槛降低,各类多媒体数据(如新闻资讯、图像、音频、视频或商品等)的上传量以指数级的速度快速增长,如何让用户接收有价值的信息已成为数据推荐领域所要考虑的重要问题。
2、目前,在为用户进行数据推荐时,均是以提高用户的内容交互评价参数(例如,点击率、转发率、分享率等)为目的而设计的,倾向于迎合用户的偏好,不断地为用户推荐其感兴趣的多媒体数据,这样,虽在一定程度上满足了用户的信息需求,但有时也会过于迎合用户的偏好,以至于为用户筑起了一间信息茧房(指人们关注的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像蚕茧一般的“茧房”中的现象),即用户喜欢什么,就向用户推荐什么,容易让用户的视野受限,信息接收面收窄。
技术实现思路
1、本技术实施例提供一种数据推荐处理方法、装置、设备、介质及程序产品,可结合更多对象特征进行数据推荐。
2、一方面,本技术实施例提供了一种数据推荐处理方法,该方法包括:
3、获取待推荐的目标对象的目标特征数据集合和目标对象的关联对象的关联特征数据集合,目标特征数据集合中包括:对象属性特征数据和第一对象行为特征数据;
4、通过对象端模型的属性特征模块得到对象属性特征数据的属性向量表示,并通过对象端模型的行为特征模块得到第一对象行为特征数据的行为向量表示;
5、通过对象端模型的注意力模块得到对象属性特征数据和关联特征数据集合对应的联合向量表示;
6、通过对象端模型的融合模块对属性向量表示、行为向量表示以及联合向量表示进行融合处理,得到目标对象的对象向量表示;
7、根据目标对象的对象向量表示,从内容数据库中获取多媒体推荐数据。
8、一方面,本技术实施例提供了一种数据推荐处理装置,该装置包括:
9、获取单元,用于获取待推荐的目标对象的目标特征数据集合和目标对象的关联对象的关联特征数据集合,目标特征数据集合中包括:对象属性特征数据和第一对象行为特征数据;
10、处理单元,用于通过对象端模型的属性特征模块得到对象属性特征数据的属性向量表示,并通过对象端模型的行为特征模块得到第一对象行为特征数据的行为向量表示;
11、处理单元,还用于通过对象端模型的注意力模块得到对象属性特征数据和关联特征数据集合对应的联合向量表示;
12、处理单元,还用于通过对象端模型的融合模块对属性向量表示、行为向量表示以及联合向量表示进行融合处理,得到目标对象的对象向量表示;
13、处理单元,还用于根据目标对象的对象向量表示,从内容数据库中获取多媒体推荐数据。
14、在一个实施例中,内容数据库存储有多个多媒体数据,每个多媒体数据通过服务端模型生成有对应的多媒体向量表示,从内容数据库中获取到的多媒体推荐数据的多媒体向量表示与目标对象的对象向量表示匹配;
15、服务端模型和对象端模型是通过联合训练得到的,在联合训练阶段采用的损失函数所计算的损失参数包括:通过训练中的对象端模型得到的训练对象的对象向量表示、通过训练中的服务端模型得到的多媒体训练数据的多媒体向量表示、以及根据训练对象对多媒体训练数据的反馈处理确定的监督标签。
16、在一个实施例中,获取单元具体用于:获取目标多媒体数据的多媒体特征数据集合,多媒体特征数据集合包括:位置特征数据和多个模态的内容特征数据;
17、处理单元具体用于:基于各内容特征数据和位置特征数据生成多个模态的模态向量表示,并将多个模态的模态向量表示进行融合处理,以得到多模态融合向量表示;通过服务端模型的变换器得到多模态融合向量表示对应的多模态变换向量表示;通过服务端模型的多层感知器对多模态变换向量表示进行编码处理,得到目标多媒体数据的多媒体向量表示;目标多媒体数据是多个多媒体数据中的任意一个。
18、在一个实施例中,处理单元用于获取目标多媒体数据的多个模态的内容特征数据时,具体用于:对目标多媒体数据包括的视频流数据进行抽帧处理,根据抽帧处理得到的图像帧确定图像模态的内容特征数据;对抽帧处理得到的图像帧进行文字识别处理,得到文本信息,并根据文本信息和目标多媒体数据的多媒体属性维度信息,确定文本模态的内容特征数据;根据图像模态的内容特征数据和文本模态的内容特征数据,确定目标多媒体数据的多个模态的内容特征数据。
19、在一个实施例中,处理单元具体用于:通过上下行内容接口服务将内容生产端产生的多媒体数据以及多媒体数据的多媒体属性维度信息存储至内容数据库中;通过调度服务调度内容处理系统进行内容处理,其中,进行的内容处理包括以下任意一个步骤或者两个步骤:调度审核系统对多媒体数据进行审核处理、调度审核系统对多媒体数据的多媒体属性维度信息进行审核处理、调度机器处理系统对多媒体数据进行预处理;其中,审核系统是通过上下行内容接口服务来获取多媒体数据和/或多媒体数据的多媒体属性维度信息的;机器处理系统是通过上下行内容接口服务来获取多媒体数据和/或多媒体数据的多媒体属性维度信息的。
20、在一个实施例中,处理单元用于调度机器处理系统对多媒体数据进行预处理时,具体用于:通过服务端模型生成各个提交的多媒体数据的多媒体向量表示;根据各个提交的多媒体数据的多媒体向量表示进行匹配处理,得到匹配结果,匹配结果表示了各个提交的多媒体数据中任意两个多媒体数据之间的相似度;根据各个提交的多媒体数据中任意两个多媒体数据之间的相似度对提交的多媒体数据进行去重处理;其中,在通过服务端模型生成各个提交的多媒体数据的多媒体向量表示时,服务端模型的输入包括:各个提交的多媒体数据的文本内容属性特征数据和对各个提交的多媒体数据进行抽帧处理得到的图像帧,且文本内容属性特征数据包括从内容数据库中读取的多媒体属性维度信息和从抽帧处理得到的图像帧中读取的文本信息。
21、在一个实施例中,对象端模型包括向量映射层,属性特征模块包括多层感知器,处理单元用于通过对象端模型的属性特征模块得到对象属性特征数据的属性向量表示时,具体用于:将通过对象端模型的向量映射层对对象属性特征数据进行映射处理得到的属性映射向量表示作为属性特征模块的输入;通过属性特征模块的多层感知器对属性映射向量表示进行编码处理,得到对象属性特征数据的属性向量表示。
22、在一个实施例中,对象端模型包括向量映射层,处理单元用于通过对象端模型的行为特征模块得到第一对象行为特征数据的行为向量表示时,具体用于:将通过对象端模型的向量映射层得到的第一对象行为特征数据的多个行为映射向量表示作为对象端模型的行为特征模块的输入,第一对象行为特征数据包括按照消费时间排序的多个多媒体消费数据;通过对象端模型的行为特征模块对多个行为映射向量表示进行处理,得到第一对象行为特征数据的行为向量表示;其中,对象端模型的行为特征模块是根据消费时间满足时限条件的多个多媒体消费数据得到第一对象行为特征数据的行为向量表示;或者,对象端模型的行为特征模块是通过行为特征模块的变换器得到多个行为映射向量表示对应的多个行为变换向量表示、并通过行为特征模块的平均池化层对多个行为变换向量表示进行处理,得到第一对象行为特征数据的行为向量表示。
23、在一个实施例中,关联特征数据集合包括m个关联对象对应的m个关联特征数据,m为正整数;对象端模型包括向量映射层,注意力模块包括m个对象注意力网络、变换器和平均池化层;处理单元用于通过对象端模型的注意力模块得到对象属性特征数据和关联特征数据集合对应的联合向量表示时,具体用于:将通过对象端模型的向量映射层对对象属性特征数据进行映射处理得到的属性映射向量表示,以及通过对象端模型的向量映射层对m个关联特征数据进行映射处理得到的m个关联映射向量表示,作为注意力模块的输入;通过注意力模块的m个对象注意力网络对属性映射向量表示和m个关联映射向量表示进行处理,得到m个关联权重向量表示;通过注意力模块的变换器得到m个关联权重向量表示对应的关联变换向量表示;通过注意力模块的平均池化层对关联变换向量表示进行处理,得到联合向量表示。
24、在一个实施例中,获取单元具体用于:获取属性映射向量表示和m个关联映射向量表示中第i个关联映射向量表示之间的外积向量表示,i为小于或者等于m的正整数;
25、处理单元具体用于:将属性映射向量表示、第i个关联映射向量表示和外积向量表示进行融合,并将融合后得到的向量表示输入m个对象注意力网络中第i个对象注意力网络的激活函数层,得到第i个对象注意力网络的激活函数层的输出;将第i个对象注意力网络的激活函数层的输出作为第i个对象注意力网络的线性层的输入,由第i个对象注意力网络的线性层输出第i个关联权重向量表示。
26、在一个实施例中,对象端模型包括向量映射层,向量映射层用于对输入特征数据进行映射处理,输入特征数据包括:对象属性特征数据、第一对象行为特征数据、以及关联特征数据集合中的特征数据中的任意一种或多种;当输入特征数据属于独热类特征数据时,通过向量映射层对输入特征数据进行映射处理;当输入特征数据属于多热类特征数据时,通过向量映射层对输入特征数据进行映射处理,并对映射处理后得到的映射向量表示进行池化处理,池化处理后得到的映射向量表示的维度为设定维度。
27、在一个实施例中,获取单元具体用于:获取m个关联对象中任一关联对象的第二对象行为特征数据、以及任一关联对象和目标对象之间的关联属性特征数据,关联属性特征数据包括关联类型信息和关联次数信息;
28、处理单元具体用于:将第二对象行为特征数据和关联属性特征数据,确定为任一关联对象对应的关联特征数据。
29、一方面,本技术实施例提供了一种智能设备,该设备包括:
30、处理器,用于加载并执行计算机程序;
31、计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序被处理器执行时,实现上述数据推荐处理方法。
32、一方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行上述数据推荐处理方法。
33、一方面,本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。智能设备的处理器从计算机可读存储介质读取该计算机指令,计算机指令被处理器执行时实现上述的数据推荐处理方法。
34、本技术实施例在为目标对象进行数据推荐时,可以引入包括对象属性特征数据和第一对象行为特征数据的目标特征数据集合,进而通过对象端模型的属性特征模块捕获建模对象属性特征数据的属性向量表示,以及通过对象端模型的行为特征模块捕获建模第一对象行为特征数据的行为向量表示,参考属性向量表示和行为向量表示的目标对象侧的特征,能够反映目标对象对多媒体数据的偏好;同时,通过获取目标对象的关联对象的关联特征数据集合,并通过对象端模型的注意力模块自适应地从对象属性特征数据、关联特征数据集合中学习关联对象对多媒体数据的偏好,具体可以通过对象端模型的注意力模块输出的对象属性特征数据和关联特征数据集合对应的联合向量表示进行表征;最终通过对象端模型的融合模块对属性向量表示、行为向量表示以及联合向量表示进行融合处理,得到目标对象的对象向量表示,也就是说,该目标对象的对象向量表示可以联合表征目标对象对多媒体数据的偏好、目标对象的关联对象对多媒体数据的偏好,如此可以得到更为全面的用于表示目标对象偏好的对象向量表示,因而在根据目标对象的对象向量表示,从内容数据库中获取多媒体推荐数据时,可以实现多媒体数据的多维度召回,获取更加全面的多媒体数据提供给目标对象,从而提升数据推荐的效果。
1.一种数据推荐处理方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述内容数据库存储有多个多媒体数据,每个多媒体数据通过服务端模型生成有对应的多媒体向量表示,从内容数据库中获取到的多媒体推荐数据的多媒体向量表示与所述目标对象的对象向量表示匹配;
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
4.如权利要求3所述的方法,其特征在于,获取目标多媒体数据的多个模态的内容特征数据,包括:
5.如权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
6.如权利要求5所述的方法,其特征在于,所述调度机器处理系统对多媒体数据进行预处理,包括:
7.如权利要求1所述的方法,其特征在于,所述对象端模型包括向量映射层,所述属性特征模块包括多层感知器,所述通过对象端模型的属性特征模块得到所述对象属性特征数据的属性向量表示,包括:
8.如权利要求1所述的方法,其特征在于,所述对象端模型包括向量映射层,所述通过对象端模型的行为特征模块得到所述第一对象行为特征数据的行为向量表示,包括:
9.如权利要求1所述的方法,其特征在于,所述关联特征数据集合包括m个关联对象对应的m个关联特征数据,m为正整数;所述对象端模型包括向量映射层,所述注意力模块包括m个对象注意力网络、变换器和平均池化层;所述通过对象端模型的注意力模块得到所述对象属性特征数据和关联特征数据集合对应的联合向量表示,包括:
10.如权利要求9所述的方法,其特征在于,所述通过所述注意力模块的m个对象注意力网络对所述属性映射向量表示和所述m个关联映射向量表示进行处理,得到m个关联权重向量表示,包括:
11.如权利要求1所述的方法,其特征在于,所述对象端模型包括向量映射层,所述向量映射层用于对输入特征数据进行映射处理,所述输入特征数据包括:对象属性特征数据、第一对象行为特征数据、以及关联特征数据集合中的特征数据中的任意一种或多种;
12.如权利要求1所述的方法,其特征在于,所述关联特征数据集合包括m个关联对象对应的m个关联特征数据,所述获取所述目标对象的关联对象的关联特征数据集合,包括:
13.一种数据推荐处理装置,其特征在于,包括:
14.一种智能设备,其特征在于,包括:
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于被处理器加载并执行如权利要求1-12任一项所述的数据推荐处理方法。
16.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令被处理器执行时实现如权利要求1-12任一项所述的数据推荐处理方法。
