本技术涉及数据处理,尤其涉及一种目标对象描述信息的输出控制方法及装置。
背景技术:
1、在企业中,不同部门或者不同岗位的员工对于同一个对象,或者同一项信息的描述是不相同的。因此为了得到合适且准确的对象的描述信息,需要员工人工咨询多个部门或者团队。比如,客户的画像信息是各行各业为客户提供精准化服务的基石。但是在一个企业内,不同部门、不同岗位或者不同业务场景下,对于同一个画像所使用的描述信息是不相同的。比如,业务部门对一个画像的描述信息是一句话,而技术部门对于该画像的描述可能是一串代码。准确画像描述信息是获取画像或以及基于画像为用户提供服务的基础,因此为企业内每个员工提供准确的画像描述信息是至关重要的。目前员工想要获取某个画像的准确的描述信息,需要咨询多个部门或团队,耗时耗力效率较低。
技术实现思路
1、本技术提供一种目标对象描述信息的输出控制方法及装置,采用预训练的语言模型自动输出针对目标对象准确的描述信息,提升目标对象的描述信息获取的效率。
2、第一方面,本技术提出了一种目标对象描述信息的输出控制方法,包括:
3、接收描述信息的标准化请求;所述描述信息用于描述目标对象,所述标准化请求携带请求执行标准化的描述信息的应用场景信息;
4、将所述应用场景信息和所述描述信息输入到预先训练好的语言模型的通用模块,输出用于标准化加工所述描述信息的词组,并将所述词组输入到所述语言模型的加工模块输出标准化后的描述信息;其中,所述语言模型是采用每个对象的描述信息组成的多个文本对训练得到的,其中任一文本对中的文本包括描述信息的历史文本和标准文本,所述任一文本对中的文本由至少两个词组加工得到。
5、基于上述方案,本技术提出通过预训练的语言模型输出合适于用户使用场景的目标对象的描述信息,相较于传统人工咨询获取描述信息的方式,本技术方案可以有效提升描述信息获取的效率。在语言模型中,根据功能划分为通用模块和加工模块,通用模块可以针对不同的应用场景输出用于标准化加工描述信息的词组,加工模块可以对词组进行加工输出标准化后的描述信息。相较于传统方案有效提升描述信息的准确性。
6、在一些实施例中,所述标准化请求还携带有账户信息;所述将所述通用模块输出的词组输入到所述语言模型的加工模块,输出标准化后的描述信息,具体包括:
7、根据所述账户信息所属的账户类别从所述加工模块包含的多个子加工模块中确定目标子加工模块;
8、将所述通用模块输出的词组输入到所述目标子加工模块,输出所述标准化后的描述信息。
9、基于上述方案,在不同应用场景下使用的标准化加工词组不同,在不同的账户类别下使用的加工方式不同。从而通过模型可以生成与使用场景和使用员工匹配度最高的定义。
10、在一些实施例中,采用如下方法训练所述语言模型:
11、获取任一描述信息在任一应用场景下的多种历史文本;其中历史文本为针对任一描述信息历史使用过文本;
12、根据所述多种历史文本分别对应的账户信息以及各账户信息所属的账户类别,对所述多种历史文本进行划分得到每个账户类别对应的历史文本;
13、采用任一账户类别对应的历史文本和所述任一账户类别对应的标准文本,对所述语言模型中包括的通用模块和所述任一账户类别对应的子加工模块进行训练。
14、在一些实施例中,在得到每个账户类别对应的历史文本之后,所述方法还包括:
15、获取每个历史文本的使用时间;
16、所述采用任一账户类别对应的历史文本和所述任一账户类别对应的标准文本,对所述语言模型中包括的通用模块和所述任一账户类别对应的子加工模块进行训练;具体包括:
17、采用任一账户类别对应的历史文本、各历史文本的使用时间以及所述任一账户类别对应的标准文本,对所述语言模型中包括的通用模块和所述任一账户类别对应的子加工模块进行训练。
18、在一些实施例中,所述采用任一账户类别对应的历史文本和所述任一账户类别对应的标准文本,对所述语言模型中包括的通用模块和所述任一账户类别对应的子加工模块进行训练;具体包括:
19、将所述任一描述信息和所述任一应用场景信息输入到所述通用模块中,得到用于标准化加工所述任一描述信息的词组,并将得到的词组输入到所述任一账户类别对应的子加工模块中得到预测文本;
20、根据所述预测文本和所述任一账户类别对应的标准文本,计算所述语言模型的损失函数值;
21、根据所述损失函数值对所述语言模型中包括的通用模块的模型参数,以及对所述任一账户类别对应的子加工模块的模型参数进行调整。
22、在一些实施例中,所述根据所述损失函数值对所述语言模型中包括的通用模块的模型参数,以及对所述任一账户类别对应的子加工模块的模型参数进行调整,具体包括:
23、根据所述损失函数值设置通用模块的第一调整权重和子加工模块的第二调整权重;
24、基于所述损失函数值和所述第一调整权重对所述通用模块的模型参数进行调整,以及基于所述损失函数值和所述第二调整权重对所述任一账户类别对应的子加工模块的模型参数进行调整。
25、基于上述方案,在基于损失函数值调整模型参数的过程中,添加了模型不同模块的调整权重。对模型的不同模块进行针对化调整,提升模型调整效率。
26、在一些实施例中,所述根据所述损失函数值设置通用模块的第一调整权重和子加工模块的第二调整权重,具体包括:
27、当所述损失函数值大于设定阈值时,设置所述第一调整权重大于所述第二调整权重;
28、当所述损失函数值不大于所述设定阈值时,设置所述第二调整权重大于所述第一调整权重。
29、基于上述方案,损失函数值较大时,说明根本上的参数出现了错误,则设置通用模块调整权重大;损失函数值较小时,说明参数较为准确,加工过程有误,则设置加工模块调整权重大。
30、第二方面,本技术提出了一种目标对象描述信息的输出控制装置,所述装置包括:
31、通信单元,用于接收描述信息的标准化请求;所述描述信息用于描述目标对象,所述标准化请求携带请求执行标准化的描述信息的应用场景信息;
32、处理单元,用于将所述应用场景信息和所述描述信息输入到预先训练好的语言模型的通用模块,输出用于标准化加工所述描述信息的词组,并将所述词组输入到所述语言模型的加工模块输出标准化后的描述信息;其中,所述语言模型是采用每个对象的描述信息组成的多个文本对训练得到的,其中任一文本对中的文本包括描述信息的历史文本和标准文本,所述任一文本对中的文本由至少两个词组加工得到。
33、在一些实施例中,所述标准化请求还携带有账户信息;所述处理单元,具体用于:
34、根据所述账户信息所属的账户类别从所述加工模块包含的多个子加工模块中确定目标子加工模块;
35、将所述通用模块输出的词组输入到所述目标子加工模块,输出所述标准化后的描述信息。
36、在一些实施例中,所述处理单元,还用于:
37、获取任一描述信息在任一应用场景下的多种历史文本;其中历史文本为针对任一描述信息历史使用过文本;
38、根据所述多种历史文本分别对应的账户信息以及各账户信息所属的账户类别,对所述多种历史文本进行划分得到每个账户类别对应的历史文本;
39、采用任一账户类别对应的历史文本和所述任一账户类别对应的标准文本,对所述语言模型中包括的通用模块和所述任一账户类别对应的子加工模块进行训练。
40、在一些实施例中,所述处理单元,还用于:
41、获取每个历史文本的使用时间;
42、在采用任一账户类别对应的历史文本和所述任一账户类别对应的标准文本,对所述语言模型中包括的通用模块和所述任一账户类别对应的子加工模块进行训练时,所述处理单元,具体用于:
43、采用任一账户类别对应的历史文本、各历史文本的使用时间以及所述任一账户类别对应的标准文本,对所述语言模型中包括的通用模块和所述任一账户类别对应的子加工模块进行训练。
44、在一些实施例中,所述处理单元,具体用于:
45、将所述任一描述信息和所述任一应用场景信息输入到所述通用模块中,得到用于标准化加工所述任一描述信息的词组,并将得到的词组输入到所述任一账户类别对应的子加工模块中得到预测文本;
46、根据所述预测文本和所述任一账户类别对应的标准文本,计算所述语言模型的损失函数值;
47、根据所述损失函数值对所述语言模型中包括的通用模块的模型参数,以及对所述任一账户类别对应的子加工模块的模型参数进行调整。
48、在一些实施例中,所述处理单元,具体用于:
49、根据所述损失函数值设置通用模块的第一调整权重和子加工模块的第二调整权重;
50、基于所述损失函数值和所述第一调整权重对所述通用模块的模型参数进行调整,以及基于所述损失函数值和所述第二调整权重对所述任一账户类别对应的子加工模块的模型参数进行调整。
51、在一些实施例中,所述处理单元,具体用于:
52、当所述损失函数值大于设定阈值时,设置所述第一调整权重大于所述第二调整权重;
53、当所述损失函数值不大于所述设定阈值时,设置所述第二调整权重大于所述第一调整权重。
54、第三方面,本技术提供一种电子设备,包括:
55、存储器,用于存储程序指令;
56、处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行第一方面中任一项所述的方法包括的步骤。
57、第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行第一方面中任一项所述的方法。
58、第五方面,本技术提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行第一方面中任一项所述的方法。
1.一种目标对象描述信息的输出控制方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述标准化请求还携带有账户信息;所述将所述词组输入到所述语言模型的加工模块输出标准化后的描述信息,具体包括:
3.根据权利要求2所述的方法,其特征在于,采用如下方法训练所述语言模型:
4.根据权利要求3所述的方法,其特征在于,在得到每个账户类别对应的历史文本之后,所述方法还包括:
5.根据权利要求3或4所述的方法,其特征在于,所述采用任一账户类别对应的历史文本和所述任一账户类别对应的标准文本,对所述语言模型中包括的通用模块和所述任一账户类别对应的子加工模块进行训练;具体包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述损失函数值对所述语言模型中包括的通用模块的模型参数,以及对所述任一账户类别对应的子加工模块的模型参数进行调整,具体包括:
7.根据权利要求6所述的方法,其特征在于,所述根据所述损失函数值设置通用模块的第一调整权重和子加工模块的第二调整权重,具体包括:
8.一种目标对象描述信息的定义装置,其特征在于,所述装置包括:
9.根据权利要求8所述的装置,其特征在于,所述标准化请求还携带有账户信息;所述处理单元,具体用于:
10.根据权利要求9所述的装置,其特征在于,所述处理单元,还用于:
11.根据权利要求10所述的装置,其特征在于,所述处理单元,还用于:
12.根据权利要求10或11所述的装置,其特征在于,所述处理单元,具体用于:
13.根据权利要求12所述的装置,其特征在于,所述处理单元,具体用于:
14.根据权利要求13所述的装置,其特征在于,所述处理单元,具体用于:
15.一种电子设备,其特征在于,包括:
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时,使所述计算机执行权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,其特征在于,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机执行上述权利要求1-7中任一项所述的方法。