本发明属于智慧教育领域,具体涉及一种基于互信息最大化的跨课程知识追踪方法。
背景技术:
1、大规模在线开放课程(moocs)的普及为学习者提供了广泛的课程选择,积累了大量与学习者学习行为相关的数据。因此,知识追踪(kt)成为分析这些学习行为并为学习者提供个性化学习体验的一种有价值的方法。知识追踪的目标是预测学习者未来的表现,基于他们与问题的历史互动动态评估他们的知识状态。
2、现有的知识追踪模型通常是基于单个课程中收集的学习者的学习行为来开发的,因此诊断结果只能反映学习者在特定领域的部分知识状态。然而,在现实中,学习者往往同时选修多门课程,而他们的知识状态受到广泛的学习经验的影响。例如,“c语言编程”中的“指针”是“数据结构和算法分析”中“链表”的先决知识,熟悉“指针”的学习者更可能擅长“链表”。基于单一课程的知识追踪模型只考虑特定课程内的学习行为,可能会忽略课程间的知识迁移,对学习者未来表现的预测存在偏差。因此,联合学习者的跨课程学习行为进行建模来得到鲁棒的知识状态表示具有重要意义。
3、本发明旨在联合学习者的多门课程答题记录进行跨课程知识追踪,主要面临如下问题:(1)如何联合学习学习者的单课程和跨课程知识状态表示,以实现全面的信息共享。(2)如何促进单课程和跨课程知识状态之间的相关性,因为学习者在不同课程中的学习行为具有一致性。
技术实现思路
1、为了解决背景技术中的问题,本发明提供了一种基于互信息最大化的跨课程知识追踪方法。本发明旨在通过分析学习者在多个课程之间的历史顺序交互来预测学习者在课程问题集层面的表现。本发明主要由三部分构成:第一部分利用层次化知识状态建模来获得学习者在不同粒度级别上的知识状态表示,包括问题集层面和课程层面的知识状态;第二部分设计了跨课程对比学习模块,通过互信息最大化来增强学习者在单课程和跨课程中的知识状态之间的相关性;第三部分引入一种专门针对教育场景设计的混合硬负采样策略,以进一步提高对比学习过程的判别能力。
2、本发明采用的技术方案如下;
3、一、一种基于互信息最大化的跨课程知识追踪方法
4、包括以下步骤:
5、1)以学习者为单位对公开的跨课程数据集ptadisc进行处理,获得跨课程知识追踪数据集s;
6、2)对步骤1)构建的跨课程知识追踪数据集s进行加工,得到模型的训练集、验证集、测试集,并针对训练集中的每个正例进行混合硬负采样得到对应的负例;
7、3)基于rasch模型对问题进行表征,并通过多层级知识状态模块对学习者的问题集层面知识状态和课程层面知识状态进行表征;
8、4)基于步骤3),联合单课程和跨课程层面知识状态表征对学习者在新问题集上的答题情况进行预测;
9、5)基于步骤3),对单课程和跨课程层面知识状态表征进行互信息最大化对比学习;
10、6)使用mini-batch方法对步骤4)和步骤5)进行训练,并使用正则化因子平衡跨课程知识追踪预测损失和跨课程互信息最大化对比学习损失。
11、所述步骤1)具体为:
12、按问题集交互记录的提交时间对学习者的多个课程的问题集交互记录进行排序,得到问题集交互记录列表,将n位学习者的问题集交互记录列表进行整合得到跨课程知识追踪数据集s;
13、所述问题集为一位学习者在单个课程的一次测验中的多道问题;
14、所述问题集交互记录为问题集及其对应的回复;
15、所述跨课程知识追踪数据集s包括n位学习者的问题集交互记录列表。
16、所述步骤2)具体为:
17、对数据集s按7:1.5:1.5的比例进行划分的得到训练集、验证集、测试集。
18、2.1)对步骤1)得到的数据集s进行筛选,保留在k个课程中都有问题集交互记录的学习者;
19、2.2)在数据集s中过滤掉交互次数少于10次的问题,以保持数据质量;
20、所述交互次数表示被学习者解答的次数;
21、2.3)在数据集s中过滤掉单个课程中交互次数少于3次或在k个课程中交互次数少于10次的学习者,以关注高度参与的学习者;
22、2.4)对于每个问题集交互记录通过混合硬负采样策略生成对应的负例具体为:
23、给定阈值θ和随机数rand:
24、若rand≤θ,保持问题不变,对学习者的回复进行翻转,即
25、若rand>θ,进行问题替换操作,并对学习者的回复进行翻转,即:
26、
27、式中,表示根据学习者原问题的难度值随机替换一个更难或者更简单的问题;
28、式中,(pi,ri)是问题回复对,pi表示问题,ri表示pi对应的回复。
29、所述步骤3)具体为:
30、所述步骤3)独立地对单课程和跨课程数据进行类似的操作,具体为:执行步骤3.1)~步骤3.2)对问题集和问题集交互进行表征。执行步骤3.3)~步骤3.4)对学习者问题集层面知识状态和课程层面知识状态进行建模;
31、3.1)对与问题关联的知识概念kc(knowledge concept)的表征进行平均池化,并将平均池化结果与问题难度的表征进行拼接得到问题的表征,即
32、式中,表示连接操作;mean[{c}]表示平均池化操作;c表示与问题关联的知识概念的表征;d表示问题难度的表征;
33、再将问题回复的表征与问题的表征相加以得到问题交互的表征,即pr=p+r;
34、式中,r为问题回复的表征;
35、3.2)由于数据集s中的学习者学习记录是按问题集交互记录组织的,对步骤3.1)得到的所有问题表征、问题交互表征进一步聚合得到问题集的表征q和问题集交互的表征qr,即:
36、
37、式中,αi为注意力系数,
38、其中,∈(.)表示密集网络;
39、3.3)将问题集的表征q和问题集交互的表征qr输入transformer网络,得到学习者在任意时间步的问题集层面知识状态:
40、ht+1=selfattention(q,k,v)
41、式中,q=qt+1,k={q1,...,qt},
42、其中,qt+1为t+1时刻问题集的表征
43、3.4)课程层面的知识状态反映的是学习者在某一特定课程内的整体和综合能力,对学习者的问题集层面知识状态进行聚合,得到当前学习者在课程层面的知识状态:
44、
45、式中,βt为注意力系数,ψ(.)表示密集网络。
46、所述步骤4)为,通过步骤3)得到的学习者单课程和跨课程问题集层面知识状态进行跨课程知识追踪预测任务,具体为:
47、4.1)通过常量η∈[0,1]对学习者的单课程和跨课程问题集层面知识状态进行加权,得到当前学习者在任意时间步的联合问题集层面知识状态,即:
48、
49、式中,分别为在t+1时刻,学生的跨课程问题集层面知识状态和单课程问题集层面知识状态
50、4.2)将学习者的问题集层面知识状态与下一时间步要解决的问题的表征进行拼接,并依次通过多层感知网络、sigmoid函数,得到学习者在目标问题上的二元预测值,即:
51、
52、再采用二元交叉熵损失预测损失,即:
53、
54、所述步骤5)为,基于步骤3)得到的学习者单课程和跨课程层面知识状态(包含正例和负例)进行互信息最大化(mutual information maximizing)对比学习任务,具体为:
55、5.1)考虑到同一学习者在单课程和跨课程之间知识状态的一致性,其跨课程(cross-course)知识状态gc被视为全局信息,单课程(single-course)知识状态gs被视为局部信息;
56、记学习者在单课程和跨课程的问题集交互序列分别为和通过步骤2.4)的混合硬负采样策略,得到学习者的跨课程问题集交互序列的负例
57、基于步骤3)得到跨课程知识状态gc即正全局信息,跨课程知识状态gc的负例即负全局信息,单课程知识状态gs即局部信息;
58、5.2)以双线性层网络θ作为鉴别器,对正全局-局部对(gs,gc)和负全局-局部对进行鉴别,得到二元鉴别结果,具体如下式表示:
59、θ(gs,gc)=sigmoid(gsw(gc)t)
60、
61、式中,w表示可学习权重;
62、鉴别器输出0或者1的鉴别结果,表示对(局部,全局)对的判断。
63、5.3)视正全局-局部对的ground truth为1,负全局-局部对的ground truth为0,进行交叉熵损失计算:
64、
65、所述步骤6)具体为:基于步骤4)和步骤5)使用mini-batch方法进行训练,并使用正则化因子λ平衡跨课程知识追踪预测损失和跨课程互信息最大化对比学习损失,从而得到最终损失,即:
66、
67、二、一种终端
68、所述终端包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的跨课程知识追踪程序,所述处理器执行跨课程知识追踪程序时,实现上述基于互信息最大化的跨课程知识追踪方法。
69、三、一种计算机可读存储介质
70、所述计算机可读存储介质上存储有跨课程知识追踪程序,所述跨课程知识追踪程序被处理器执行时,实现上述基于互信息最大化的跨课程知识追踪方法。
71、本发明提供的基于互信息最大化的跨课程知识追踪方法带来的有益效果是:
72、1)本发明首次提出课程间潜在的知识概念的可迁移性,并将学习者的单课程信息和跨课程信息结合起来,以获得更全面的学习者知识状态表示。
73、2)本发明基于真实教育场景,提出了一种新颖的混合硬负采样策略。
74、3)本发明提出了一种互信息最大化对比学习方法,有效促进学习者的单课程和跨课程知识状态的一致性。
1.一种基于互信息最大化的跨课程知识追踪方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于互信息最大化的跨课程知识追踪方法,其特征在于,所述步骤1)具体为:
3.根据权利要求1所述的基于互信息最大化的跨课程知识追踪方法,其特征在于,所述步骤2)具体为:
4.根据权利要求1所述的基于互信息最大化的跨课程知识追踪方法,其特征在于,所述步骤3)具体为:
5.根据权利要求1所述的基于互信息最大化的跨课程知识追踪方法,其特征在于,所述步骤4)为,通过步骤3)得到的学习者单课程和跨课程问题集层面知识状态进行跨课程知识追踪预测任务,具体为:
6.根据权利要求3所述的基于互信息最大化的跨课程知识追踪方法,其特征在于,所述步骤5)为,基于步骤3)得到的学习者单课程和跨课程层面知识状态进行互信息最大化对比学习任务,具体为:
7.根据权利要求3所述的基于互信息最大化的跨课程知识追踪方法,其特征在于,所述步骤6)具体为:基于步骤4)和步骤5)使用mini-batch方法进行训练,并使用正则化因子λ平衡跨课程知识追踪预测损失和跨课程互信息最大化对比学习损失,从而得到最终损失,即:
8.一种终端,其特征在于,所述终端包括存储器、处理器及存储在所述存储器中并可在所述处理器上运行的跨课程知识追踪程序,所述处理器执行跨课程知识追踪程序时,实现如权利要求1-7任一项所述的基于互信息最大化的跨课程知识追踪方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有跨课程知识追踪程序,所述跨课程知识追踪程序被处理器执行时,实现如权利要求1-7任一项所述的基于互信息最大化的跨课程知识追踪方法。
