乳腺癌的患病风险评估方法和系统

xiaoxiao5月前  23


本发明涉及数据处理的,特别涉及一种乳腺癌的患病风险评估方法、系统、计算机设备和存储介质。


背景技术:

1、乳腺癌是女性中最常见的恶性肿瘤之一,全球每年新增病例数以百万计。随着医疗技术的进步,早期筛查和诊断乳腺癌的重要性日益凸显。传统的乳腺癌筛查方法,如乳房x线摄影(mammography),尽管在早期检测中具有一定的效果,但其准确性和灵敏度受到诸多因素的影响,导致部分高风险人群无法得到及时的干预。此外,遗传因素、生活习惯和环境因素等多方面的复杂性增加了乳腺癌风险评估的难度,现有的风险评估模型在预测的准确性和个体化风险评估方面仍存在较大的改进空间。

2、当前的乳腺癌患病风险评估方法大多基于统计模型和流行病学数据,这些方法虽然在大样本的研究中显示出一定的应用价值,但在面对个体化差异时,往往表现出局限性。例如,常见的gail模型和claus模型等虽然考虑了家族史和部分风险因素,但并未考虑到个体基因突变。这导致许多高风险人群未能被有效识别,低风险人群则可能过度接受筛查,增加不必要的医疗负担和心理压力。

3、针对现有乳腺癌的识别方法无法有效面对个体化差异,导致高风险人群未能准确识别,低风险人群过度筛查的技术问题,尚未得到有效的解决方案。


技术实现思路

1、本发明的主要目的为提供一种乳腺癌的患病风险评估方法、系统、计算机设备和存储介质,以解决现有乳腺癌的识别方法无法有效面对个体化差异,导致高风险人群未能准确识别,低风险人群过度筛查的技术问题。

2、为实现上述目的,本发明提供了一种乳腺癌的患病风险评估方法,包括:获取基于乳腺癌的原始数据,其中,所述基于乳腺癌的原始数据至少包括:基因测序数据和医疗影像数据;对所述原始数据进行特征提取,得到特征集合,其中,所述特征集合至少包括:基因测序数据中的突变位点特征和基因表达水平特征,以及医疗影响数据中的肿瘤区域的形状和纹理特征;采用所述特征集合,构建基于transformer神经网络模型的乳腺癌患病评估模型,并对基于transformer神经网络模型的乳腺癌患病评估初始模型进行训练处理,得到训练好的基于transformer神经网络模型的乳腺癌患病评估模型。

3、可选的,在获取基于乳腺癌的原始数据之后,所述乳腺癌的患病风险评估方法还包括:将所述医疗影像数据中的图像像素调整为预设的像素值,得到第一医疗影像数据;采用z-score方法将所述第一医疗影像数据的像素值映射到预设区间内,得到第二医疗影像数据;采用各向异性扩散滤波器去除所述第二医疗影像数据中的图像噪声,得到第三医疗影像数据;采用对比度受限自适应直方图均衡化调整所述第三医疗影像数据的对比度,得到第四医疗影像数据;采用神经网络u-net对所述第四医疗影像进行分割,提取出第四医疗影像数据中的肿瘤区域和器官边界;对所述的第四医疗影像数据中的肿瘤区域和器官边界进行标注,得到经预处理的医疗影像数据,其中,所述经预处理的医疗影像数据用于执行“对所述原始数据进行特征提取,得到特征集合”步骤。

4、可选的,在获取基于乳腺癌的原始数据之后,所述患病风险评估方法还包括:过滤所述基因测序数据中含有接头污染的读段,并去除所述基因测序数据中的重复的读段,得到第二基因测序数据;将所述第二基因测序数据中的读段对齐到参考基因组,得到第三基因测序数据;注释所述第三基因测序数据中的对齐读段,得到经预处理的基因测序数据,其中,所述经预处理的基因测序数据用于执行“对所述原始数据进行特征提取,得到特征集合”步骤。

5、可选的,对所述原始数据进行特征提取,得到特征集合,包括;将所述经预处理的医疗影像数据中的图像划分为多个小块,并将每个小块展平成一维向量,得到第一向量;使用基于transformer神经网络模型中的线性层将第一向量嵌入到预设的维度,得到第二向量;使用学习位置编码为所述第二向量的每个位置生成编码,得到第三向量;将所述基于transformer神经网络模型中的注意力头连接所述基于transformer神经网络模型中的前馈神经网络,并把第三向量喂入基于transformer神经网络模型中的前馈神经网络中,得到医疗影像数据中肿瘤区域的形状和纹理特征。

6、可选的,对所述原始数据进行特征提取,得到特征集合,包括;提取所述经预处理的基因测序数据中每个样本的突变位点信息,基于所述突变位点信息统计每个样本突变位点的类型和频率,并基于每个样本突变位点的类型和频率构建突变特征矩阵;计算所述经预处理的基因测序数据中基因的表达量,基于所述基因的表达量构建表达特征矩阵;将所述的突变特征矩阵和表达特征矩阵进行特征变换,将其转换为稠密的向量,得到第五基因测序数据;将向量化的第五基因测序数据喂入预设的基于transformer神经网络模型中;使用预设的基于transformer神经网络模型中的卷积层提取第五基因测序数据中突变位点初始特征和基因表达水平初始特征,并输出特征图;使用预设的基于transformer神经网络模型中的池化层对所述的特征图进行降维操作,得到所述第五基因测序数据中突变位点中的第一重要特征图和基因表达水平的第二重要特征图;将所述第一重要特征图和所述第二重要特征图展平,并连接到全连接层,得到所述基因测序数据的突变位点特征和基因表达水平特征。

7、可选的,采用所述特征集合,构建基于transformer神经网络模型的乳腺癌患病评估模型,包括;将所述特征集合输入到所述基于transformer神经网络模型中的归一化层中,对输入的每一层所述医疗影像数据中肿瘤区域的形状、纹理特征和所述基因测序数据的突变位点特征及基因表达水平特征进行归一化处理,得到第一融合特征;将所述第一融合特征与所述向量化的第五基因测序数据、所述第一向量相加,得到第一融合特征;将所述第一融合特征输入到所述基于transformer神经网络模型中的归一化层中,得到第二融合特征;将所述第二融合特征与所述向量化的第五基因测序数据、所述第一向量相加,形成第三融合特征;将所述第三融合特征输入到所述基于transformer神经网络模型中的归一化层中,得到第四融合特征;将所述第四融合特征与所述向量化的第五基因测序数据、所述第一向量相加,形成第五融合特征;将所述第五融合特征输入到所述基于transformer神经网络模型中的归一化层中,得到第六融合特征;将所述第六融合特征输入到所述基于transformer神经网络模型中的softmax层,得到基于transformer神经网络模型的乳腺癌患病评估模型。

8、可选的,基于transformer神经网络模型的乳腺癌患病评估初始模型进行训练处理,得到训练好的基于transformer神经网络模型的乳腺癌患病评估模型,包括:使用交叉熵损失函数计算所述基于transformer神经网络模型的乳腺癌患病评估初始模型的损失;使用rmsprop优化器来调整所述基于transformer神经网络模型的乳腺癌患病评估初始模型的参数;使用超带宽优化方法优化所述基于transformer神经网络模型的乳腺癌患病评估初始模型的参数组合进行反复筛选和分配资源,筛选出最佳的超参数组合;将所述原始数据分成多个小批次,每次用一个小批次的数据进行前向传播和反向传播,重复上述步骤多个训练周期,多次训练所述基于transformer神经网络模型的乳腺癌患病评估初始模型,得到所述训练好的基于transformer神经网络模型的乳腺癌患病评估模型。

9、本发明还提供了一种乳腺癌的患病风险评估系统,包括:获取单元,用于获取基于乳腺癌的原始数据,其中,所述基于乳腺癌的原始数据至少包括:基因测序数据和医疗影像数据;特征提取单元,用于对所述原始数据进行特征提取,得到特征集合,其中,所述特征集合至少包括:基因测序数据中的突变位点特征和基因表达水平特征,以及医疗影响数据中的肿瘤区域的形状和纹理特征;训练单元,用于采用所述特征集合,构建基于transformer神经网络模型的乳腺癌患病评估模型,并对基于transformer神经网络模型的乳腺癌患病评估初始模型进行训练处理,得到训练好的基于transformer神经网络模型的乳腺癌患病评估模型。

10、本发明还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

11、本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

12、本发明提供的一种乳腺癌的患病风险评估方法、系统、计算机设备和存储介质,通过收集和整合患者的基因测序数据和医疗影像数据。这些数据包含了与乳腺癌相关的重要信息,如基因突变和表达水平,以及通过医疗影像(如mri或超声)捕获的肿瘤形态和纹理特征。这些数据为后续的特征提取和模型构建提供了基础。

13、为了从原始数据中提取有用的特征,本发明采用了预设的神经网络算法。该算法能够有效识别和保留最具代表性和预测性的特征,从基因测序数据中提取突变位点特征和基因表达水平特征,从医疗影像数据中提取肿瘤区域的形状和纹理特征。通过特征提取,可以显著减少数据维度,提高模型的训练效率和预测准确性。利用从特征提取中得到的特征,构建一个基于transformer神经网络的乳腺癌患病评估模型。transformer模型以其强大的自注意力机制,能够处理复杂的高维数据,捕捉不同特征之间的关联,提高预测的准确性。接下来,通过大规模的乳腺癌数据集对模型进行训练,使其能够学习和识别乳腺癌患病风险的特征模式,从而实现准确的个体化风险评估。

14、总的来说,本发明融合了基因测序数据和医疗影像数据,通过多维度数据的综合分析,提供了更全面和准确的患病风险评估。其次,采用神经网络算法,能够有效识别和保留最具预测性的特征,提高模型的训练效率和预测性能。相较于传统的统计模型和浅层神经网络模型,transformer模型具有更强的自注意力机制和处理高维数据的能力,能够捕捉复杂特征之间的相互作用,提高预测的准确性和个体化风险评估的精度。此外,本发明通过对基因突变和医疗影像进行综合评估,克服了现有模型在个体化差异识别方面的局限性。

15、总之,本发明不仅提高了乳腺癌高风险人群的识别准确性,减少了低风险人群过度筛查的可能性,还在个体化差异评估方面取得了显著突破。


技术特征:

1.一种乳腺癌的患病风险评估方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的患病风险评估方法,其特征在于,在获取基于乳腺癌的原始数据之后,所述乳腺癌的患病风险评估方法还包括:

3.根据权利要求1所述的患病风险评估方法,其特征在于,在获取基于乳腺癌的原始数据之后,所述患病风险评估方法还包括:

4.根据权利要求1所述的患病风险评估方法,其特征在于,对所述原始数据进行特征提取,得到特征集合,包括;

5.根据权利要求1所述的患病风险评估方法,其特征在于,对所述原始数据进行特征提取,得到特征集合,包括;

6.根据权利要求1所述的患病风险评估方法,其特征在于,采用所述特征集合,构建基于transformer神经网络模型的乳腺癌患病评估模型,包括;

7.根据权利要求1所述的患病风险评估方法,其特征在于,基于transformer神经网络模型的乳腺癌患病评估初始模型进行训练处理,得到训练好的基于transformer神经网络模型的乳腺癌患病评估模型,包括:

8.一种乳腺癌的患病风险评估系统,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。


技术总结
本发明涉及一种乳腺癌的患病风险评估方法、系统、计算机设备和存储介质,通过获取包括基因测序数据和医疗影像数据在内的基于乳腺癌的原始数据。然后对原始数据进行特征提取,从基因测序数据中获取突变位点特征和基因表达水平特征,从医疗影像数据中提取肿瘤区域的形状和纹理特征。利用提取的特征构建基于Transformer神经网络模型的乳腺癌患病评估模型。最后对该初始模型进行训练处理,最终得到训练好的评估模型。该方法通过融合基因测序数据和医疗影像数据,结合Transformer神经网络的特征提取和学习能力,实现了对乳腺癌患病风险的高效、准确评估。

技术研发人员:王正林,罗荣奎,崔照盟,甘露,王红,黄润,杜俊娴
受保护的技术使用者:复旦大学附属中山医院
技术研发日:
技术公布日:2024/9/23

最新回复(0)