地址数据处理方法、装置、电子设备及存储介质与流程

xiaoxiao1月前  25


本发明实施例涉及数据处理,尤其涉及一种地址数据处理方法、装置、电子设备及存储介质。


背景技术:

1、近年来,随着电商服务的迅速发展和普及,越来越多的用户可以获取相应的物品,在获取到物品之后,可以编辑该物品所对应的目标地址,可选的,目标地址可以为物品配送地址。由于地址多是用户自主编辑的,因此,存在一定的编辑错误,或者,在某些不合规情形下,可选的,不合规情形可以是刷单场景等,用户会编辑大量的不正确的地址,进而在后续配送过程中存在跨区配送或是配送不准确的问题,从而影响配送效率。基于此,对地址的风险管控是非常重要的。

2、目前对地址风险管控的方式主要是:构建包括多个关键字的黑名单,以在获取到地址文本后基于黑名单来确定地址文本是否存在风险,进而确定地址是否存在风险。

3、发明人在基于上述方式实施本技术方案时,发现存在如下问题:

4、需要周期性的对黑名单中的关键字进行维护,存在维护成本较高的问题,进一步的,在黑名单中的关键字不全时,无法准确对地址文本是否存在风险进行准确检测。


技术实现思路

1、本发明提供一种地址数据处理方法、装置、电子设备及存储介质,以实现结合地址文本的内容信息来确定待处理地址是否存在风险的效果。

2、第一方面,本发明实施例提供了一种地址数据处理方法,该方法包括:

3、获取与待处理地址相对应的地址文本;

4、基于预先训练得到的地址风险评估模型对所述地址文本评估处理,得到所述地址文本的风险评估结果,其中,所述风险评估结果包括所述地址文本中每个文字所对应的风险属性;

5、将所述地址文本按照区域级别进行分词,得到不同区域级别下的至少一个分词;

6、依据所述至少一个分词以及所述风险评估结果中每个文字所对应的风险属性,确定所述待处理地址的目标风险评估属性。

7、进一步的,所述方法还包括:

8、获取多个样本地址所对应的样本地址文本,其中,所述样本地址文本包括至少一个文字;

9、将所述样本地址文本输入至地址风险评估模型进行风险属性预测处理,得到所述至少一个文字所对应的预测风险属性;

10、依据所述预测风险属性以及所述样本地址文本所对应的实际风险属性,确定损失值,并依据所述损失值对所述地址风险评估模型进行参数修正。

11、进一步的,所述地址风险评估模型中包括至少一个归一化层、自注意力层以及非线性变化层,所述方法还包括:

12、确定所述样本地址文本中每个文字的文字向量,以基于各文字向量,得到所述样本地址文本的待输入向量;

13、基于所述归一化层对所述待输入向量归一化处理,得到第一处理向量;

14、基于所述自注意力层中对所述第一处理向量进行处理,得到属性矩阵;

15、基于所述归一化层以及所述非线性变化层依次对所述属性矩阵处理,得到待输出向量,并基于所述归一化层对所述待输出向量分析处理,得到所述样本地址文本的预测风险属性。

16、进一步的,所述方法还包括:

17、基于所述自注意力层中的映射矩阵对所述第一处理向量处理,得到查询向量、键值向量以及权重向量;

18、基于所述查询向量、键值向量、权重向量以及预先设置的目标函数,确定所述属性矩阵。

19、进一步的,所述地址风险评估模型中还包括位置预测模块,所述方法还包括:

20、基于所述样本地址文本中每个文字的位置信息对所述位置预测模块进行训练,以基于训练结果约束每个文字的预测风险属性。

21、进一步的,所述方法还包括:

22、将所述地址文本中每个文字转换为相应的文字向量后输入至所述地址风险评估模型中,得到每个文字在历史文字出现的条件下所对应的风险属性;

23、其中,所述历史文字为所述地址文本中当前文字之前所出现的至少一个文字。

24、进一步的,所述方法还包括:

25、依据预先设置的不同区域级别所对应的地址键码对所述地址文本分词处理,得到不同区域级别下的至少一个分词

26、进一步的,所述方法还包括:

27、确定隶属于同一区域级别下的至少一个分词;

28、根据所述至少一个分词中每个文字的风险属性,确定所述至少一个分词的待处理风险属性;

29、基于各区域级别所对应的待处理风险属性,确定所述目标风险评估属性。

30、第二方面,本发明实施例还提供了一种地址数据处理装置,该装置包括:

31、地址文本获取模块,用于获取与待处理地址相对应的地址文本;

32、评估结果确定模块,用于基于预先训练得到的地址风险评估模型对所述地址文本评估处理,得到所述地址文本的风险评估结果,其中,所述风险评估结果包括所述地址文本中每个文字所对应的风险属性;

33、分词获取模块,用于将所述地址文本按照区域级别进行分词,得到不同区域级别下的至少一个分词;

34、评估属性确定模块,用于依据所述至少一个分词以及所述风险评估结果中每个文字所对应的风险属性,确定所述待处理地址的目标风险评估属性。

35、第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:

36、一个或多个处理器;

37、存储装置,用于存储一个或多个程序,

38、当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如本发明实施例任一的地址数据处理方法。

39、第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,计算机可执行指令在由计算机处理器执行时用于执行如本发明实施例任一的地址数据处理方法。

40、本发明实施例的技术方案,通过地址风险评估模型确定地址文本中每个文字所对应的风险属性,以及,将地址文本按照区域级别进行分词,得到不同区域级别下的至少一个分词,接下来,根据至少一个分词以及风险评估结果中每个文字所对应的风险属性,确定待处理地址的目标风险评估属性,解决了基于黑名单的方式对地址文本进行关键字检测确定其是否存在风险时,存在黑名单维护成本以及误差率较高的问题,实现了将地址风险评估模型的输出结果与地址文本内容结合在一起,综合确定其是否存在风险,提高了风险确定准确性以及有效性的效果。



技术特征:

1.一种地址数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,还包括:

3.根据权利要求2所述的方法,其特征在于,所述地址风险评估模型中包括至少一个归一化层、自注意力层以及非线性变化层,所述将所述样本地址文本输入至地址风险评估模型进行风险属性预测处理,得到所述至少一个文字所对应的预测风险属性,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述自注意力层中对所述第一处理向量进行处理,得到属性矩阵,包括:

5.根据权利要求2所述的方法,其特征在于,所述地址风险评估模型中还包括位置预测模块,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于预先训练得到的地址风险评估模型对所述地址文本评估处理,得到所述地址文本的风险评估结果,包括:

7.根据权利要求1所述的方法,其特征在于,所述将所述地址文本按照区域级别进行分词,得到不同区域级别下的至少一个分词,包括:

8.根据权利要求1所述的方法,其特征在于,所述依据所述至少一个分词以及所述风险评估结果中每个文字所对应的风险属性,确定所述待处理地址的目标风险评估属性,包括:

9.一种地址数据处理装置,其特征在于,所述装置包括:

10.一种电子设备,其特征在于,所述电子设备包括:

11.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-8任一项所述的地址数据处理方法。


技术总结
本发明实施例公开了一种地址数据处理方法、装置、电子设备及存储介质,该方法包括:获取与待处理地址相对应的地址文本;基于预先训练得到的地址风险评估模型对地址文本评估处理,得到地址文本的风险评估结果,其中,风险评估结果包括地址文本中每个文字所对应的风险属性;将地址文本按照区域级别进行分词,得到不同区域级别下的至少一个分词;依据至少一个分词以及风险评估结果中每个文字所对应的风险属性,确定待处理地址的目标风险评估属性。本发明实现了将地址风险评估模型的输出结果与地址文本内容结合在一起,确定其目标风险评估属性,提高了对地址文本风险管控有效性以及准确性。

技术研发人员:祖辰
受保护的技术使用者:北京沃东天骏信息技术有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)