一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法与系统

xiaoxiao4月前 31

本发明涉及人工智能语音识别，特别涉及一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法与系统。

背景技术：

1、近年来，国内胃肠镜检查的应用呈增多趋势。胃肠镜检查是消化道疾病的重要诊治手段，分为普通胃肠镜和全麻胃肠镜两种，普通胃肠镜指的是受检者意识清醒的状态下进行，而全麻状态下的胃肠镜检查(又称无痛胃肠镜检查)，与普通胃肠镜检查相比，在全麻放松状态下，也使受检者接受检查的过程更舒适，有利于医生操作内镜，从而带来检查效果和效率的同时提升。

2、在全麻检查结束之后，受检者需要一段时间从全麻状态中恢复清醒，清醒又可分为不完全清醒和完全清醒两种状态，在内镜中心，接受无痛胃肠镜检查的受检者需要在完全清醒后方可离开内镜中心。根据中国消化内镜诊疗镇静/麻醉的专家共识(2020)要求，门诊接受一般消化内镜诊疗镇静/麻醉受检者评价是否可以离院，需要按照评分量表包括生命体征(血压和心率)、运动功能、恶心呕吐、疼痛和手术出血，评分超过9分，可以由亲友陪同离院。本院内镜中心全麻受检者安全离开内镜中心流程中是要求受检者读一段话，经安全员(一般为内镜中心护士)判断受检者意识清醒，自觉良好，方可离开。由于个人体质不同，受检者自全麻恢复至完全清醒所需的时间亦不同，恢复过程中的行为、对外界刺激的反应也因人而异。安全员在巡回过程中，有大量的时间用于监测等待，人力资源利用不合理，存在严重浪费，但若多位受检者在临近时间醒来，会出现人手不足的情况，此时若有受检者在不完全清醒的状态下独自离开复苏区，可能会发生跌倒、摔伤等意外风险，引发医院和受检者的矛盾。此外，全麻胃肠镜的普遍开展，其复苏监护和评价指标的应用差异性较大，尤其在基层医院缺乏质量标准，往往缺乏护理人才，对于受检者全麻后的复苏程度不能准确判断，往往会要求受检者停留过多的时间，或是在受检者尚未完全苏醒时就允许受检者离开，造成部分受检者的不满和不理解，增加护理人员工作负担和医疗风险。

3、从安全员通过对受检者读话的评判标准来看，其核心是语音比较法。常用的语音比较方法包括听觉法、光谱法和声学法，听觉法完全由人工完成，一般需要多位有经验的专家，直接听取录音做出判断；光谱法将语音转换为可见的图像，又叫做“声纹”，通过对比其中同样的单词和短语的声纹特征，从而判断两段语音是否来自同一个说话人，语音声纹密码是采用语音段中的文本信息和说话人信息对用户信息进行双重加密的技术，因此具有较好的安全性和便捷性，在银行、公安、智能家居等领域都有广泛的应用；声学法比较的是语音中的声学特征比如共振峰和基频，同样需要选取相同的单词和短语。在语音识别(speechrecognition)和话者识别(speaker recognition)方面，最常用到的语音特征就是梅尔频率倒谱系数(mel-scale frequency cepstral coefficients，简称mfcc)。

4、人工智能(artificial intelligence，ai)是一门包含了认知、推理、计算机视觉、自然语言理解与交互、机器学习等多个领域的学科，目的是让机器能像人一样理解、思考、学习，也是拥有人工智能系统的重要特征之一。机器学习算法可以看作是在训练经验的指导之下，从庞大的算法库中选择合适当前任务的算法，机器学习在过去二十年取得了巨大进步，对许多应用程序而言，通过向系统展示所需输入-输出的示例来训练比手动输入所有可能的输出要来的方便得多。

5、因此，以基于人工智能的精确语音比较对内镜全麻受检者苏醒后的声音状态是否与全麻前完全清醒时一致进行判断，改变当前只能依赖人工主观判断的现状，为内镜全麻复苏方向的评判方式提供新思路。

技术实现思路

1、针对以上现有技术中尚存在的缺陷，本发明的目的在于提出一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法与系统，以及研发一种对全麻后复苏受检者进行实时语音辅助评判的系统，通过收集内镜全麻检查的受检者在检查前后的语音信息，基于人工智能计算机深度学习技术评判受检者在全麻后的复苏状态为复苏评价提供一个客观标准，改变当前只能依赖人工主观判断的现状，如人工智能语音识别判断为清醒，则系统提醒安全员进行最终人工核准，从而节省巡回时间，提高工作效率，增加安全性。

2、为了实现上述技术目的，本发明采用如下的技术方案：

3、本发明公开的第一方面的技术方案为：一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法，包括以下步骤：

4、s1：基于历史语音数据集建立语音识别模型并进行优化；

5、s2：采集受检者在清醒状态下的第一次语音信息，并输入优化后的语音识别模型；

6、s3：当受检者苏醒后，采集第二次语言信息并输入优化后的语音识别模型，与第一次语音信息进行比对分析和评判，输出受检者清醒与否的判断结果。

7、上述技术方案的进一步优化方案为：步骤s1中，建立语音识别模型的步骤具体包括：

8、s11历史语音数据采集：收集内镜全麻受检者在麻醉前、不完全苏醒和完全苏醒后的语音信息，形成历史语音数据集并分类保存；

9、s12语音特征提取：对历史语音数据集中的每个语音信息分别进行mfcc特征参数提取，形成对应的特征数据集；

10、s13语音识别模型建立和优化：将特征数据集输入lstm网络模型中建立语音识别模型并对其进行优化。

11、上述技术方案的进一步优化方案为：步骤s12中，mfcc特征参数提取过程包括：

12、(1)对每个语音信息进行预加重、分帧和加窗的预处理；

13、(2)利用fft对预处理后的语音信息进行频谱分析，计算通过mel滤波器的对数能量；

14、(3)将对数能量带入离散余弦变换(dct)公式计算dct倒谱系数(mfcc)，求出l阶的mel参数，mel参数的表达式如下：

15、

16、其中：l为mfcc的阶数，m为三角滤波器个数，c(n)表示第n个倒谱系数，表示语音信号的频谱特征，s(m)表示mel滤波器的对数能量表达式，m是一个元素取值在0～n-1之间，不同的m对应不同的对数能量表达式，具体如下：

17、

18、其中,xa(k)和hm(k)表达式如下：

19、

20、其中：f(m)表示中心频率。

21、上述技术方案的进一步优化方案为：步骤s13中，基于lstm网络模型建立语音识别模型具体包括：

22、(1)将提取的mfcc特征参数输入lstm网络模型中学习序列特征关系，得到学习后的输出特征参数；

23、(2)对输出特征参数利用attention机制加权得到最终分类结果，从而建立语音识别模型。

24、基于上述技术方案，进一步地，步骤s13中，对语音识别模型进行优化的具体过程包括：

25、(1)将特征数据集划分为训练集、测试集和验证集；

26、(2)利用训练集和测试集分别对语音识别模型完成训练和测试，通过测试后的语音识别模型与人工判别标准进行比较，对语音识别模型进行优化；

27、(3)通过验证集对优化后的语音识别模型的有效性进行验证。

28、基于上述技术方案，进一步地，对优化后的语音识别模型进行验证时，通过模型分析的准确率来评判，具体为：

29、

30、其中：accuracy表示准确率，tp表示真正类，tn表示真负类，fp表示假正类，fn表示假负类。

31、本发明公开的第二方面的技术方案为：一种对全麻后复苏状态受检者进行实时语音辅助评判的系统，用于对内镜全麻受检者的麻醉前后语音进行对比分析，以评判受检者的复苏状态，该系统包括：

32、数据采集模块，用于收集内镜全麻受检者在麻醉前、不完全苏醒和完全苏醒后的语音信息并分类保存；

33、特征提取模块，用于对每个语音信息进行mfcc特征参数提取；

34、模型构建模块，用于构建优化后的语音识别模型，并将其部署至后台；

35、识别评判模块，用于调用后台优化后的语音识别模型，对采集的实时语音进行分析和评判，并向输出端反馈评判结果。

36、作为上述方案的进一步优选方案：模型构建模块具体包括：

37、建模子模块，通过mfcc特征参数输入lstm网络模型进行语音特征关系学习，再将输出的特征使用attention加权得到最终分类结果，形成语音识别模型；

38、训练与测试子模块，利用mfcc特征参数的训练集和测试集分别对语音识别模型进行训练和测试；

39、优化子模块，用于对语音识别模型的测试结果进行优化；

40、验证子模块，用于对优化后的语音识别模型进行验证。

41、本发明公开的第三方面的技术方案为：一种电子设备，包括处理器和存储器，存储器上存储有计算机指令，处理器用于运行存储器上存储的计算机指令，以实现如权利要求1-5中任一项所述方法的步骤。

42、本发明公开的第四方面的技术方案为：一种存储有计算机指令的计算机可读存储介质，计算机指令用于执行如权利要求1-5中任一项所述方法的步骤。

43、与现有技术相比，本发明的技术方案具有如下优点：

44、1、本发明将人工智能与语音识别相结合，利用收集的内镜全麻受检者在麻醉前、麻醉后不完全清醒和麻醉后完全清醒的语音数据，基于采用attention机制的lstm网络模型构建二分类的语音识别模型，以语音情感识别方式将病人麻醉后的未清醒状态和麻醉药效过后病人恢复清醒状态进行分类甄别，为智能化复苏监护的评价指标提供一个客观评判标准。

45、2、本发明的方法能够快速应对临近复苏的多个全麻受检者的检测判断，改善现有护理人员不足的工作负担和造成的医疗风险，为临床上对复苏状态及风险预防提供高效且准确的评判应用模型，具有极大临床推广价值。

技术特征：

1.一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法，其特征在于，步骤s1中，建立语音识别模型的步骤具体包括：

3.根据权利要求2所述的一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法，其特征在于，步骤s12中，mfcc特征参数提取过程包括：

4.根据权利要求3所述的一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法，其特征在于，步骤s13中，建立语音识别模型的步骤具体包括：

5.根据权利要求3所述的一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法，其特征在于，步骤s13中，对语音识别模型进行优化的步骤具体包括：

6.根据权利要求5所述的一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法，其特征在于，对优化后的语音识别模型进行验证时，通过模型分析的准确率来评判，具体为：

7.一种对全麻后复苏状态受检者进行实时语音辅助评判的系统，其特征在于，用于对内镜全麻受检者的麻醉前后语音进行对比分析，以评判受检者的复苏状态，该系统包括：

8.根据权利要求7所述的一种对全麻后复苏状态受检者进行实时语音辅助评判的系统，其特征在于，模型构建模块具体包括：

9.一种电子设备，包括处理器和存储器，其特征在于，存储器上存储有计算机指令，处理器用于运行存储器上存储的计算机指令，以实现如权利要求1-6中任一项所述方法的步骤。

10.一种存储有计算机指令的计算机可读存储介质，其特征在于，计算机指令用于执行如权利要求1-6中任一项所述方法的步骤。

技术总结
本发明提供一种基于人工智能语音识别的内镜全麻复苏状态及风险预防的方法与系统，属于人工智能语音识别技术领域。针对目前内镜全麻受检者的复苏状态完全依靠人工判断的工作负担和医疗风险等问题，本发明包括：基于历史语音数据集建立语音识别模型并进行优化；采集受检者在清醒状态下的第一次语音信息，并输入优化后的语音识别模型；当受检者苏醒后，采集第二次语言信息并输入优化后的语音识别模型，与第一次语音信息进行比对分析和评判，输出受检者清醒与否的判断结果。本发明的方法为目前内镜中心的全麻内镜受检者复苏评价提供一个客观标准，能够很好地改善当前只能依赖人工主观判断的现状，节省安全员巡回时间，提高工作效率，增加安全性。

技术研发人员：叶峰,史今锦,何植,熊文婕,陈涵,张国新
受保护的技术使用者：江苏省人民医院（南京医科大学第一附属医院）
技术研发日：
技术公布日：2024/9/23

专利

最新回复(0)