一种多中心调强放疗个体化剂量验证方法及系统与流程

xiaoxiao1月前  35


本发明属于放射治疗技术,尤其涉及一种基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法。将人工智能中的机器学习方法与基于放射影像获取的放射组学特征进行结合,提出实现多中心调强放疗个体化剂量验证的方法。


背景技术:

1、调强放射治疗技术可以调节射线在射野内的强度分布,能给不同形状的肿瘤靶区提供高度一致的剂量分布,同时减少周围正常组织的剂量。由于调强放疗技术治疗实施的复杂性,在治疗之前实施患者特定的质量保证成为整个流程中必不可少的环节,以确定治疗技术实施的安全性和剂量投照的准确性。目前,进行调强放疗患者个体化剂量验证的标准是使用基于测量的技术,将治疗计划系统(tps)剂量计算的结果与测量设备实际测量的结果进行比较。评价剂量计算值与测量值之间的差异通常选用的方法是γ分析,它能对通过与未通过标准的区域进行定量评估。

2、近年来,随着人工智能技术的飞速发展,基于机器学习和深度学习的方法在放射治疗质量保证(qa)中的应用变得越来越广泛。各种基于机器学习的模型已显示出作为虚拟qa工具的潜力,能够快速准确地预测固定野调强放疗(intensity-modulated radiationtherapy,imrt)或容积旋转调强放疗(volume-modulated arc therapy,vmat)计划的剂量验证结果,从而为患者治疗提供安全高效的保障。然而尚未有同时混合不同调强放疗技术的伽马通过率预测研究。lundberg等在2017年提出shap值作为解决模型可解释性的方法,与机器学习算法相结合可以为每个特征分配一个特定预测的贡献值,并且提议将shap值作为预测模型中特征重要性的唯一度量。

3、因此,本发明基于放射组学的机器学习方法,建立同时混合了imrt和vmat计划、基于多中心样本数据的伽马通过率(gamma pass rate,gpr)分类预测模型,并使用shap值对模型输出进行相关解释,选取具备最佳性能的预测模型应用于临床实践。

4、目前,执行基于模体测量的个体剂量验证工作包含了在模体上的剂量重新计算、数据传输、模体摆放、射束传输及γ分析等一系列过程。现有的调强放疗患者个体化剂量验证流程需要占用大量的时间和资源,显著增加了医学物理人员的工作负担。由于不能提前知晓患者放疗计划的验证结果是否通过,不能提前针对验证结果不能通过的放疗计划进行重新优化设计从而使之剂量验证结果能通过,所以需要反复试错,这样既消耗物理师的大量工作时间,降低工作效率,还会延缓患者首次治疗时间,使患者不能尽快上机治疗,影响疗效。

5、通过上述分析,现有技术存在的问题及缺陷为:

6、(1)现有的调强放疗患者个体化剂量验证流程需要占用大量的时间和资源,显著增加了医学物理人员的工作负担。

7、(2)由于不能提前知晓患者放疗计划的验证结果是否通过,不能提前针对验证结果不能通过的放疗计划进行重新优化设计从而使之剂量验证结果能通过,所以需要反复试错,这样既消耗物理师的大量工作时间,降低工作效率,还会延缓患者首次治疗时间,使患者不能尽快上机治疗,影响患者疗效。


技术实现思路

1、针对现有技术存在的问题,本发明提供了一种基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法。

2、本发明是这样实现的,一种基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法包括:

3、步骤一,数据收集与整理;

4、步骤二,数据集划分与特征选择;

5、步骤三,模型训练与评估;

6、步骤四,模型输出解释;

7、步骤五,模型建立及验证测试。

8、进一步,所述数据收集与整理方法:

9、收集一家省级三级甲等肿瘤专科医院接受imrt/vmat调强放疗的肿瘤患者;其中:头颈部患者400例、胸部肿瘤患者400例、盆腔肿瘤患者400例;所有imrt/vmat调强放疗计划均采用基于模体测量的方式进行剂量验证;剂量验证之前,确保医用直线加速器、质控设备均处于良好运行状态,确保样本数据的正确性和准确性;伽马(γ)分析在3%/2mm标准、绝对剂量、全局归一和10%剂量阈值的模式下进行;为了针对选取的省级三级甲等肿瘤专科医院的数据样本构建分类预测模型,将测量的gpr均值的99.5%作为分类限值,当gpr大于此容差限值时,测量的gpr表示为“通过”,记为“1”,否则为“失败”,记为“0”;

10、选取其他4家三级医院,每家医院提供调强放疗病例不少于200例;建立基于多部位多中心数据的gpr预测模型,并进行测试及临床应用;

11、采取计划rt dose文件的等剂量线包括的范围作为放射组学特征提取的区域;一般取10%等剂量线包含区域;

12、使用python 3.7中radiomics库进行特征的批量提取,其中图像类型包括原始图像、小波变换图像和高斯滤波图像,总共提取1130个特征,分为7种不同类型特征:

13、形状特征(shape features 2d/3d),一阶特征(first order features),灰度共生矩阵特征(gray level cooccurrence matrix,glcm),灰度级大小区域矩阵特征(graylevel size zone matrix,glszm),灰度游程矩阵特征(gray level run length matrix,glrlm),相邻灰度差矩阵特征(neighboring gray tone difference matrix,ngtdm),灰度依赖矩阵特征(gray level dependence matrix,gldm)。

14、进一步,所述数据集划分与特征选择方法:

15、整个数据集被随机划分,其中90%的数据用于模型训练,10%的数据作为测试集;由于数据存在不平衡情况,采取分层抽样技术,使训练集和测试集中各类数据的比例与原始数据保持一致;

16、为了减少放射组学特征数量并提高模型性能,在训练集上使用shap值结合极端梯度提升树算法(extreme gradient boosting,xgboost)进行特征重要性排序。

17、进一步,所述模型训练与评估方法:

18、在训练集上做标准化处理,再将这种转换应用到测试集上,以防止测试数据信息的泄漏;选取随机森林(random forest,rf)、自适应增强(adaptive boosting,adaboost)、xgboost、轻量级梯度提升机(light gradient boosting machine,lightgbm)四种机器学习分类算法对训练数据进行拟合,使用网格搜索和五折交叉验证,以获取具有最高性能参数的模型应用于测试数据;

19、采用精确度、灵敏度、特异度、f1分数及受试者工作特征曲线(receiveroperating characteristic curve,roc)下面积(area under the curve,auc)来对二分类模型的性能进行评估;所有建模和分析过程均在python 3.7上完成;见等

20、式1-4;

21、

22、其中tp、fp、tn、fn分别代表预测为正类的正样本数、预测为正类的负样本数、预测为负类的负样本数、预测为负类的正样本数。

23、进一步,所述模型输出解释方法:

24、shap是基于shapley值来衡量特征如何影响因变量,每个特征值的shapley值是该特征值对预测的贡献,通过对所有可能的特征值组合进行加权及求和得到;特征i的shap值定义为:

25、

26、其中n表示模型输入的数据特征集,s代表n中的任何特征子集,表示特征i之前序列中所有元素的子集,ν(s)表示特征子集s的机器学习模型的输出,ν(s∪{i})-ν(s)表示特征i的累积贡献值。

27、进一步,所述模型建立及验证测试方法:

28、针对经过上述过程得出具备最优性能的预测模型,选择至少3家开展调强放疗的医疗机构进行多中心模型测试验证;测试结果合格后,该预测模型即可在临床中予以正式推广应用。

29、结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:

30、第一、目前,执行基于模体测量的个体剂量验证工作包含了在模体上的剂量重新计算、数据传输、模体摆放、射束传输及γ分析等一系列过程。现有的调强放疗患者个体化剂量验证流程需要占用大量的时间和资源,显著增加了医学物理人员的工作负担。由于不能提前知晓患者放疗计划的验证结果是否通过,不能提前针对验证结果不能通过的放疗计划进行重新优化设计从而使之剂量验证结果能通过,所以需要反复试错,这样既消耗物理师的大量工作时间,降低工作效率,还会延缓患者首次治疗时间,使患者不能尽快上机治疗,影响疗效。

31、因此,本发明提出基于机器学习和放射组学特征的调强放疗个体化剂量验证方法,旨在解决目前调强放疗患者个体化剂量验证的工作量大、效率低、不能提前预知剂量验证结果而采取干预举措,需要反复试错导致患者放疗延误等方面存在的不足问题。与此同时,通过建立基于多中心调强放疗计划样本的数据来构建具备泛化性能且适用于多个医疗机构的调强放疗剂量验证预测模型,提升各医疗机构调强放疗计划剂量验证工作的同质化水平。

32、第二,基于机器学习和放射组学特征来构建调强放疗个体化剂量验证预测模型,该剂量验证预测模型采用shap值方法进行特征选择,并对四种机器学习方法构建的模型进行性能评估,筛选出具备最佳性能特点的预测模型;

33、构建的预测模型是基于imrt与vmat不同放疗技术、多家医院样本数据来实施的,并且经过多中心验证测试的。提升了预测模型的通用性、适用性;

34、采用基于多中心调强放疗计划样本的数据来构建的具备泛化性能且适用于多个医疗机构的调强放疗剂量验证预测模型,可以提前预测患者调强放疗计划的剂量验证结果是否通过,不需要等到采用基于模体测量的方法才能知晓剂量验证结果。对于剂量验证不能通过的调强放疗计划,可以在计划设计阶段就进行调试优化,进行干预。可以显著提升放疗计划质量和工作效率。

35、第三,本发明的技术方案转化后的预期收益和商业价值为:通过建立基于多中心调强放疗计划样本的数据来构建具备泛化性能且适用于多个医疗机构的调强放疗剂量验证预测模型,可以提升各医疗机构调强放疗计划剂量验证工作的工作效率及同质化水平。在满足广大肿瘤患者调强放疗个体化剂量验证工作需求的前提下,可以节约医院人力成本和质控设备采购成本的支出。

36、本发明的技术方案填补了国内外业内技术空白:同时混合了imrt、vmat等不同调强放疗技术的伽马通过率分类预测模型;使用shap值方法对伽马通过率分类预测模型的输出进行解释,筛查出最重要的特征作为模型输入特征,并得出模型输入的放射组学特征与模型输出之间的相互对应关系。解决了伽马通过率预测模型的可解释性问题;基于多中心调强放疗计划样本的数据来构建具备泛化性能且适用于多个医疗机构的调强放疗剂量验证预测模型,提升了伽马通过率预测模型的通用性、适用性。

37、本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题:解决了在构建基于不同放疗技术、不同肿瘤部位、多中心样本数据并经过多中心验证测试的调强放疗计划剂量验证的伽马通过率预测模型中的系列关键技术难题。例如:构建具备最佳性能的预测模型;筛选出显著影响预测模型的主要放射组学特征;预测模型可以兼容不同放疗技术、不同放疗部位,并在不同医疗机构予以应用等。

38、第四,本发明提供的基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法所体现的技术进步主要表现在以下几个方面:

39、1.多中心数据整合:此方法不仅从一家省级三级甲等肿瘤专科医院收集数据,还整合了来自其他4家三级医院的数据,从而建立了一个基于多部位多中心数据的gpr预测模型。这种多中心数据整合的方式大大提高了模型的泛化能力和临床应用的实用性。

40、2.剂量验证的标准化:所有imrt/vmat调强放疗计划均采用基于模体测量的方式进行剂量验证,确保了剂量验证的标准化和一致性。此外,剂量验证之前对医用直线加速器、质控设备的状态检查,以及伽马(γ)分析的严格标准,都体现了对精确度和准确性的高度重视。

41、3.创新的数据处理方法:将测量的gpr均值的99.5%作为分类限值,将gpr分为“通过”和“失败”两类,这种处理方式简化了数据,使得模型更容易学习和理解。

42、4.先进的特征提取方法:使用python 3.7中的radiomics库进行特征的批量提取,涵盖了从原始图像到复杂变换图像的多种类型特征,如形状特征、一阶特征、灰度共生矩阵特征等。这种全面的特征提取方法有助于模型捕捉更多的信息,提高预测的准确性。

43、5.机器学习的应用:通过机器学习算法,如分类算法,建立预测模型,并利用多中心数据进行训练和验证。这种方法不仅提高了模型的预测能力,还使得模型能够适应不同的临床环境和患者情况。

44、综上所述,基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法通过多中心数据整合、标准化剂量验证、创新的数据处理方法、先进的特征提取方法和机器学习的应用等技术手段,实现了显著的技术进步,为放疗的个体化剂量验证提供了更加准确、高效和实用的解决方案。


技术特征:

1.一种基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法,其特征在于,包括以下步骤:

2.如权利要求1所述基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法,其特征在于,所述数据收集与整理方法:

3.如权利要求1所述基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法,其特征在于,所述数据集划分与特征选择方法:

4.如权利要求1所述基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法,其特征在于,所述模型训练与评估方法:

5.如权利要求1所述基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法,其特征在于,所述模型输出解释方法:

6.如权利要求1所述基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法,其特征在于,所述模型建立及验证测试方法:

7.一种基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证系统,其特征在于,该系统包括:

8.一种基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证系统,其特征在于,该系统包括:


技术总结
本发明属于放射治疗技术技术领域,公开了一种基于机器学习和放射组学特征的多中心调强放疗个体化剂量验证方法,本发明基于机器学习和放射组学特征来构建调强放疗个体化剂量验证预测模型,该剂量验证预测模型采用SHAP值方法进行特征选择,并对四种机器学习方法构建的模型进行性能评估,筛选出具备最佳性能特点的预测模型;构建的预测模型是基于IMRT与VMAT不同放疗技术、多家医院样本数据来实施的,并且经过多中心验证测试的。提升了预测模型的通用性、适用性;采用基于多中心调强放疗计划样本的数据来构建的具备泛化性能且适用于多个医疗机构的调强放疗剂量验证预测模型,可以显著提升放疗计划质量和工作效率。

技术研发人员:倪千喜,朱俊,阳小华
受保护的技术使用者:湖南省肿瘤医院
技术研发日:
技术公布日:2024/9/23

最新回复(0)