会议内容讲解方法、存储介质、程序产品及设备与流程

xiaoxiao9月前  49


本技术涉及计算机,尤其涉及一种会议内容讲解方法、存储介质、程序产品及设备。


背景技术:

1、现有技术的线上会议中,听讲用户在听到主讲用户的演讲后,若对会议内容存在疑惑,通常需要听讲用户在会议过程中主动向主讲用户提出疑问再由主讲用户解答。

2、然而,现有技术的方式容易导致主讲用户难以注意到存在疑惑但未主动提出的听讲用户,使得该听讲用户的疑惑没有被解决进而影响其参会的效果,或者当提出疑惑的听讲用户人数较多时,容易导致主讲用户难以把控会议进度和/或时长。


技术实现思路

1、为了解决上述技术问题,本技术实施例提出了一种会议内容讲解方法、存储介质、程序产品及设备。

2、本技术实施例提供了一种会议内容讲解方法,包括:

3、创建多个相互独立的会议空间,其中,所述会议空间包括:主讲数字人所处的第一会议空间,若干听讲数字人所处的第二会议空间,以及,没有所述主讲数字人与所述听讲数字人的第三会议空间;

4、将所述第一会议空间的数据流输出至所述第二会议空间;

5、当在所述第二会议空间中识别到存在产生疑问的目标听讲数字人时,将所述目标听讲数字人传输至所述第三会议空间中进行疑问内容相关的会议内容讲解。

6、进一步的,所述方法还包括:

7、基于所述第一会议空间的数据流以及所述第二会议空间的数据流,生成在预设时间段内的时间点上的判定向量;

8、将所述判定向量分配到时间间隔,得到所述时间间隔对应的判定向量集,其中,所述时间间隔为所述预设时间段中的子时间段;

9、基于所述判定向量集,利用人工智能模型生成与所述时间间隔对应的增强内容,以所述增强内容作为所述会议内容讲解在所述时间间隔中所需讲解的内容。

10、进一步的,所述第一会议空间的数据流包括主讲数字人数据流及主讲音视频数据流,所述主讲音视频数据流包括演讲音频信息和演讲图片信息;所述第二会议空间的数据流包括听讲数字人数据流;

11、所述基于所述第一会议空间的数据流以及所述第二会议空间的数据流,生成在预设时间段内的时间点上的判定向量,包括:

12、基于所述演讲音频信息生成与所述时间点对应的语音向量;

13、基于所述演讲图片信息生成与所述时间点对应的关键字向量;

14、将所述语音向量与所述关键字向量进行拼接生成与所述时间点对应的第一向量,所述第一向量用于指示会议关键内容;

15、通过第一深度学习模型从所述听讲数字人数据流中提取出与所述时间点对应的听讲数字人表情特征,通过第二深度学习模型从所述主讲数字人数据流中提取出与所述时间点对应的主讲数字人表情特征,并基于所述听讲数字人表情特征及所述主讲数字人表情特征生成与所述时间点对应的第二向量,所述第二向量用于指示数字人表情;

16、将所述第一向量与所述第二向量拼接成与所述时间点对应的判定向量。

17、进一步的,所述时间间隔包括多个子时间间隔;

18、所述将所述判定向量分配到时间间隔,得到所述时间间隔对应的判定向量集,包括:

19、按照所述多个子时间间隔的时间次序,依次通过如下步骤为每一子时间间隔进行分配:

20、将未分配且最早生成的判定向量分配到第一子时间间隔对应的判定向量集中,将其余未分配的判定向量按照生成的时间次序,依次计算每个未分配的判定向量与已分配到所述第一子时间间隔中的所有判定向量之间的平均相似度;以及,

21、每计算到一个所述平均相似度时,若所述平均相似度大于等于预设的相似度阈值,则将与所述平均相似度对应的未分配的判定向量分配到所述第一子时间间隔对应的判定向量集中,若所述平均相似度小于所述相似度阈值,则输出所述第一子时间间隔对应的判定向量集并进入为第二子时间间隔进行分配的步骤;

22、其中,所述第二子时间间隔为所述第一子时间间隔的下一个子时间间隔。

23、进一步的,所述基于所述判定向量集,利用人工智能模型生成与所述时间间隔对应的增强内容,包括:

24、计算所述时间间隔对应的判定向量集中所有判定向量的平均向量值;

25、通过词嵌入矩阵将所述平均向量值转换为文本信息;

26、将所述文本信息输入到所述人工智能模型,得到所述人工智能模型输出的与所述时间间隔对应的增强内容。

27、进一步的,所述方法还包括:

28、确定所述主讲数字人对应的预计演讲时间,以及所述若干听讲数字人对应的听讲人数及用户历史数据;

29、基于所述用户历史数据,计算所述若干听讲数字人各自对应的进入所述第三会议空间的概率;

30、基于所述预计演讲时间、所述听讲人数、所述概率以及预设修正因子,计算所述第三会议空间的数量。

31、进一步的,所述当在所述第二会议空间中识别到存在产生疑问的目标听讲数字人时,将所述目标听讲数字人传输至所述第三会议空间中进行疑问内容相关的会议内容讲解,包括:

32、基于所述第二会议空间的数据流中包含的听讲数字人数据流,通过第三深度学习模型实时识别在所述第二会议空间中的每一听讲数字人的当前表情,并将当前表情指示为疑问的听讲数字人判定为目标听讲数字人;

33、将所述目标听讲数字人传输至所述第三会议空间,并在所述第三会议空间中讲解与识别时间点对应的会议内容,其中,所述识别时间点为识别到所述目标听讲数字人的当前表情指示为疑问的时间;

34、在讲解完与所述识别时间点对应的会议内容之后,将所述第一会议空间的数据流中晚于所述识别时间点的数据流传输至所述第三会议空间。

35、本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的会议内容讲解方法的步骤。

36、本技术实施例还提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述任一项所述的会议内容讲解方法的步骤。

37、本技术实施例还提供了一种计算机设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的会议内容讲解方法的步骤。

38、综上,本技术实施例至少具有以下有益效果:

39、采用本技术实施例,通过创建多个相互独立的会议空间,其中,所述会议空间包括:主讲数字人所处的第一会议空间,若干听讲数字人所处的第二会议空间,以及,没有所述主讲数字人与所述听讲数字人的第三会议空间;将所述第一会议空间的数据流输出至所述第二会议空间;当在所述第二会议空间中识别到存在产生疑问的目标听讲数字人时,将所述目标听讲数字人传输至所述第三会议空间中进行疑问内容相关的会议内容讲解,能够自动识别出对于演讲内容存在疑问的目标听讲数字人,并在不打断主讲数字人的演讲、不影响会议进程的情况下,给该目标听讲数字人进行疑问内容相关的优化讲解,从而增强会议连贯性,改善听讲的效果。


技术特征:

1.一种会议内容讲解方法,其特征在于,包括:

2.如权利要求1所述的会议内容讲解方法,其特征在于,所述方法还包括:

3.如权利要求2所述的会议内容讲解方法,其特征在于,所述第一会议空间的数据流包括主讲数字人数据流及主讲音视频数据流,所述主讲音视频数据流包括演讲音频信息和演讲图片信息;所述第二会议空间的数据流包括听讲数字人数据流;

4.如权利要求2所述的会议内容讲解方法,其特征在于,所述时间间隔包括多个子时间间隔;

5.如权利要求2所述的会议内容讲解方法,其特征在于,所述基于所述判定向量集,利用人工智能模型生成与所述时间间隔对应的增强内容,包括:

6.如权利要求1-5任一项所述的会议内容讲解方法,其特征在于,所述方法还包括:

7.如权利要求1-5任一项所述的会议内容讲解方法,其特征在于,所述当在所述第二会议空间中识别到存在产生疑问的目标听讲数字人时,将所述目标听讲数字人传输至所述第三会议空间中进行疑问内容相关的会议内容讲解,包括:

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的会议内容讲解方法。

9.一种计算机程序产品,包括计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1-7任一项所述的会议内容讲解方法。

10.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1-7任一项所述的会议内容讲解方法。


技术总结
本申请公开了一种会议内容讲解方法、存储介质、程序产品及设备,该方法包括:创建多个相互独立的会议空间,其中,会议空间包括:主讲数字人所处的第一会议空间,若干听讲数字人所处的第二会议空间,以及,没有主讲数字人与听讲数字人的第三会议空间;将第一会议空间的数据流输出至第二会议空间;当在第二会议空间中识别到存在产生疑问的目标听讲数字人时,将目标听讲数字人传输至第三会议空间中进行疑问内容相关的会议内容讲解,能够自动识别出对于演讲内容存在疑问的目标听讲数字人,并在不打断主讲数字人的演讲、不影响会议进程的情况下,给该目标听讲数字人进行疑问内容相关的优化讲解,从而增强会议连贯性,改善听讲的效果。

技术研发人员:孙维佳,任佳,周东谕,陈辉,张聪
受保护的技术使用者:咪咕文化科技有限公司
技术研发日:
技术公布日:2024/9/23

最新回复(0)