本发明涉及信息 ,尤其涉及一种基于意图识别的视频序列推荐模型的训练方法、装置。
背景技术:
1、随着信息时代的迅猛发展,短视频平台已经成为用户创造和分享内容的主要场所之一。在这个数字化的时代,用户在短视频平台上产生了庞大的数据量,这些数据成为了推动短视频序列推荐的宝贵资源。现有技术中,通常使用通过隐式学习的方式进行意图识别。研究者使用意图嵌入(intent embedding)技术,将用户的意图映射到一个低维向量空间,以更好地表示和理解用户的需求。
2、但是,从效果上来说,隐式意图识别的模型可能对用户行为序列中的噪声或偶然性更为敏感,从而导致对某些样本的过度拟合或误导。
技术实现思路
1、本发明提供一种基于意图识别的视频序列推荐模型的训练方法、装置,用以解决现有技术中隐式意图识别的视频推荐模型的推荐效果不准确的缺陷。
2、本发明提供一种基于意图识别的视频序列推荐模型的训练方法,包括:
3、获取样本用户行为序列;
4、基于所述样本用户行为序列和大语言模型,得到意图增强的正样本序列;
5、基于所述样本用户行为序列和所述正样本序列,对初始视频序列推荐模型进行对比学习,以得到基于意图识别的视频序列推荐模型。
6、根据本发明提供的一种基于意图识别的视频序列推荐模型的训练方法,所述基于所述样本用户行为序列和大语言模型,得到意图增强的正样本序列,包括:
7、基于任一用户的所述样本用户行为序列和大语言模型,得到个人意图增强的个人正样本序列;
8、对多个用户的所述样本用户行为序列进行聚类,采集得到群体行为序列;
9、基于所述群体行为序列和大语言模型,得到群体意图增强的群体正样本序列;
10、基于所述个人正样本序列和所述群体正样本序列,确定所述正样本序列。
11、根据本发明提供的一种基于意图识别的视频序列推荐模型的训练方法,所述基于任一用户的所述样本用户行为序列和大语言模型,得到个人意图增强的个人正样本序列,包括:
12、基于所述任一用户的所述样本用户行为序列,构建第一提示文本;
13、基于所述第一提示文本指示所述大语言模型,生成所述任一用户的个人意图;
14、基于所述个人意图、所述任一用户的所述样本用户行为序列和所述大语言模型,生成所述个人正样本序列。
15、根据本发明提供的一种基于意图识别的视频序列推荐模型的训练方法,所述基于所述群体行为序列和大语言模型,得到群体意图增强的群体正样本序列,包括:
16、基于所述群体行为序列,构建第二提示文本;
17、基于所述第二提示文本指示所述大语言模型,生成所述群体意图;
18、基于所述群体意图、所述群体行为序列和所述大语言模型,生成所述群体正样本序列。
19、根据本发明提供的一种基于意图识别的视频序列推荐模型的训练方法,所述基于所述样本用户行为序列和所述正样本序列,对初始视频序列推荐模型进行对比学习,以得到基于意图识别的视频序列推荐模型,包括:
20、基于所述样本用户行为序列和所述初始视频序列推荐模型,生成样本预测行为,并基于所述样本用户行为序列的行为标签和所述样本预测行为,构建预测损失;
21、基于所述样本用户行为序列,确定负样本序列,并基于所述负样本序列和所述正样本序列进行对比学习,构建对比学习损失;
22、基于所述预测损失和所述对比学习损失,对所述初始视频序列推荐模型进行参数迭代,以得到所述基于意图识别的视频序列推荐模型。
23、本发明还提供一种基于意图识别的视频序列推荐方法,包括:
24、获取用户的历史观看视频序列;
25、基于所述历史观看视频序列和大语言模型,确定用户的观看意图,所述观看意图包括个人意图和群体意图;
26、基于所述观看意图、所述历史观看视频序列和基于意图识别的视频序列推荐模型,预测得到用户的下一观看视频;
27、所述基于意图识别的视频序列推荐模型是基于如上述任一项所述的基于意图识别的视频序列推荐模型的训练方法得到的。
28、本发明还提供一种基于意图识别的视频序列推荐模型的训练装置,包括:
29、获取单元,获取样本用户行为序列;
30、意图增强单元,基于所述样本用户行为序列和大语言模型,得到意图增强的正样本序列;
31、比学习单元,基于所述样本用户行为序列和所述正样本序列,对初始视频序列推荐模型进行对比学习,以得到基于意图识别的视频序列推荐模型。
32、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于意图识别的视频序列推荐模型的训练方法,或,基于意图识别的视频序列推荐方法。
33、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于意图识别的视频序列推荐模型的训练方法,或,基于意图识别的视频序列推荐方法。
34、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于意图识别的视频序列推荐模型的训练方法,或,基于意图识别的视频序列推荐方法。
35、本发明提供的基于意图识别的视频序列推荐模型的训练方法、装置,通过引入基于生成式大语言模型的显示意图识别,得到样本用户行为序列的意图增强的行为序列作为正样本序列,然后基于样本用户行为序列和正样本序列对初始视频序列推荐模型进行对比学习,以得到基于意图识别的视频序列推荐模型,从而实现推荐出更符合用户意图、更个性化的视频。
1.一种基于意图识别的视频序列推荐模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的基于意图识别的视频序列推荐模型的训练方法,其特征在于,所述基于所述样本用户行为序列和大语言模型,得到意图增强的正样本序列,包括:
3.根据权利要求2所述的基于意图识别的视频序列推荐模型的训练方法,其特征在于,所述基于任一用户的所述样本用户行为序列和大语言模型,得到个人意图增强的个人正样本序列,包括:
4.根据权利要求2所述的基于意图识别的视频序列推荐模型的训练方法,其特征在于,所述基于所述群体行为序列和大语言模型,得到群体意图增强的群体正样本序列,包括:
5.根据权利要求1至4中任一项所述的基于意图识别的视频序列推荐模型的训练方法,其特征在于,所述基于所述样本用户行为序列和所述正样本序列,对初始视频序列推荐模型进行对比学习,以得到基于意图识别的视频序列推荐模型,包括:
6.一种基于意图识别的视频序列推荐方法,其特征在于,包括:
7.一种基于意图识别的视频序列推荐模型的训练装置,其特征在于,包括:
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述基于意图识别的视频序列推荐模型的训练方法,或,如权利要求6所述基于意图识别的视频序列推荐方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于意图识别的视频序列推荐模型的训练方法,或,如权利要求6所述基于意图识别的视频序列推荐方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于意图识别的视频序列推荐模型的训练方法,或,如权利要求6所述基于意图识别的视频序列推荐方法。
