一种知识要点推送方法及系统的制作方法

xiaoxiao2021-2-28  230

一种知识要点推送方法及系统的制作方法
【技术领域】
[0001] 本发明涉及知识推送技术领域,尤其涉及一种知识要点推送方法及系统。
【背景技术】
[0002] 关于M00C在线教育:大规模开放式网络课程,即M00L2012年,由Coursera、 Udacity、edX三大课程提供商兴起的,同时,美国顶尖大学均陆续设立网络学习平台,在网 上提供免费课程。M00C是一种新的课程模式并且具有比较完整的课程结构,在开放教育领 域内,没有人数、时间、地点的限制,通过网络传播即可进行学习。M00C与传统的开放课程相 比,具有易于使用、免费使用、工具和资源多元化、自主学习、社会性建构的优势。社会性学 习有利于构建社会化学习网络与知识的创造和分享,对于推动开放教育会产生深远影响。 M00C课程主要针对的是高等教育,因此其社会教育性质更加显著,授课人群主要还是大量 的非在校学习者,但对于高等院校的在校学生来说,尤其是与高校的教学系统融合,如利用 在线教育平台完成教学工作等,仍处于初始阶段。
[0003] 关于大数据在教育领域的应用:近年来,随着大数据成为互联网信息技术行业的 流行词汇,教育逐渐被认为是大数据可以大有作为的一个重要应用领域。大数据技术允许 中小学和大学分析从学生的学习行为、考试分数到职业规划等所有重要的信息。许多这样 的数据已经被诸如美国国家教育统计中心之类的政府机构储存起来用于统计和分析。教育 领域中的大数据分析最终目的是为了改善学生的学习成绩。成绩优异的学生对学校、对社 会、以及对国家来说都是好事。学生的作业和考试中有一系列重要的信息往往被我们常规 的研究所忽视。因此如何针对学生的学习行为进行推送知识要点的方法成为了亟需解决的 问题。

【发明内容】

[0004] 针对现有技术中的缺陷,本发明提供了一种知识要点推送方法及系统,能够根据 学生的学习行为向学生推送知识要点,以知识干预的方式完成智能化的教学决策和学习补 充,解决学生学习能力发展失衡、学习资源利用不合理等问题。
[0005] 第一方面,本发明提供了一种知识要点推送方法,包括:
[0006] 采集预先记录的学生的学习行为数据,并通过预设规则对所述学习行为数据进行 预处理;
[0007] 对预处理后的学习行为数据通过聚类分析算法建立知识要点推送数据库,所述数 据库中包括学生的学习行为与预设推送策略的对应关系,所述推送策略包括不同学习行为 对应的知识要点;
[0008] 根据学生的学习行为,在所述知识要点推送数据库中获取与所述学习行为对应的 推送策略,并推送该推送策略所包括的知识要点。
[0009] 可选的,所述学习行为数据包括:用户名、访问日期、访问页面地址、页面操作信 息、访问开始时间和访问结束时间。
[0010]可选的,所述通过预设规则对所述学习行为数据进行预处理,包括:
[0011]将所述学习行为数据通过预设规则进行处理,形成预设数据流的数据。
[0012]可选的,所述对预处理后的学习行为数据通过聚类分析算法建立知识要点推送数 据库,包括:
[0013] 对所述预处理后的学习行为数据通过聚类分析算法进行相似度分组;
[0014] 关联每一分组中的数据中学生的学习行为与预设推送策略;
[0015] 将关联后的学习行为与预设推送策略存储在所述知识要点推送数据库中。
[0016] 可选的,在推送该推送策略所包括的知识要点之后,所述方法还包括:
[0017] 存储所述学生的学习行为,并定期推送所述知识要点。
[0018] 第二方面,本发明还提供了一种知识要点推送系统,包括:
[0019] 采集模块,采集预先记录的学生的学习行为数据;
[0020] 预处理模块,用于通过预设规则对所述学习行为数据进行预处理;
[0021] 数据库建立模块,用于对预处理后的学习行为数据通过聚类分析算法建立知识要 点推送数据库,所述数据库中包括学生的学习行为与预设推送策略的对应关系,所述推送 策略包括不同学习行为对应的知识要点;
[0022] 推送模块,用于根据学生的学习行为,在所述知识要点推送数据库中获取与所述 学习行为对应的推送策略,并推送该推送策略所包括的知识要点。
[0023] 可选的,所述学习行为数据包括:用户名、访问日期、访问页面地址、页面操作信 息、访问开始时间和访问结束时间。
[0024]可选的,所述预处理模块,用于将所述学习行为数据通过预设规则进行处理,形成 预设数据流的数据。
[0025]可选的,所述数据库建立模块,用于对所述预处理后的学习行为数据通过聚类分 析算法进行相似度分组;
[0026] 关联每一分组中的数据中学生的学习行为与预设推送策略;
[0027] 将关联后的学习行为与预设推送策略存储在所述知识要点推送数据库中。
[0028] 可选的,所述推送模块还用于在推送该推送策略所包括的知识要点之后,存储所 述学生的学习行为,并定期推送所述知识要点。
[0029] 由上述技术方案可知,本发明提供一种知识要点推送方法及系统,通过采集预先 记录的学生的学习行为数据,对该数据进行预处理,并对于处理后的数据通过聚类分析算 法建立指示要点推送数据库,根据学生的学习行为,在所述知识要点推送数据库中获取与 所述学习行为对应的推送策略,并推送该推送策略所包括的知识要点。针对学生学习投入 情况失衡、知识掌握程度不牢固而产生学习效率低、学习效果差等问题,通过大数据分析方 法,以M00C在线教育平台中学生的多维度学习行为数据为依据,构建基于大数据技术的 M00C在线教育中知识干预系统。应用该系统,能够以知识干预的方式完成智能化的教学决 策和学习补充,解决学生学习能力发展失衡、学习资源利用不合理等问题,目标是推进并加 快学生的学习进程、提高学习效率,以达到较为满意的学习效果。
【附图说明】
[0030] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些图获得其他的附图。
[0031] 图1是本发明一实施例提供的一种知识要点推送方法的流程示意图;
[0032] 图2是本发明一实施例提供的知识干预系统模型结构示意图;
[0033]图3是本发明一实施例提供的一种知识要点推送系统的结构示意图。
【具体实施方式】
[0034]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0035]图1示出了本发明一实施例提供的一种知识要点推送方法的流程示意图,如图1所 示,该方法包括以下步骤:
[0036] 101、采集预先记录的学生的学习行为数据,并通过预设规则对所述学习行为数据 进行预处理。
[0037]所述学习行为数据包括:用户名、访问日期、访问页面地址、页面操作信息、访问开 始时间和访问结束时间。
[0038] 102、对预处理后的学习行为数据通过聚类分析算法建立知识要点推送数据库,所 述数据库中包括学生的学习行为与预设推送策略的对应关系,所述推送策略包括不同学习 行为对应的知识要点;
[0039] 103、根据学生的学习行为,在所述知识要点推送数据库中获取与所述学习行为对 应的推送策略,并推送该推送策略所包括的知识要点。
[0040] 上述方法通过采集预先记录的学生的学习行为数据,对该数据进行预处理,并对 于处理后的数据通过聚类分析算法建立指示要点推送数据库,根据学生的学习行为,在所 述知识要点推送数据库中获取与所述学习行为对应的推送策略,并推送该推送策略所包括 的知识要点。针对学生学习投入情况失衡、知识掌握程度不牢固而产生学习效率低、学习效 果差等问题,通过大数据分析方法,以M00C在线教育平台中学生的多维度学习行为数据为 依据,构建基于大数据技术的M00C在线教育中知识干预系统。应用该系统,能够以知识干预 的方式完成智能化的教学决策和学习补充,解决学生学习能力发展失衡、学习资源利用不 合理等问题,目标是推进并加快学生的学习进程、提高学习效率,以达到较为满意的学习效 果。
[0041] 上述步骤101中所述通过预设规则对所述学习行为数据进行预处理,包括:
[0042] 将所述学习行为数据通过预设规则进行处理,形成预设数据流的数据。
[0043] 本实施例中数据采集环境是设定在M00C在线教育平台,从该平台中选取某一门课 程,对该课程中的所有学生进行整学期学习轨迹跟踪。当本学期结束后,收集该课程的所有 学生的学习行为轨迹数据作为本发明的数据研究基础。针对本平台,学习行为数据采集所 涉及的内容如表1所示。
[0044] 表 1
[0046] 而平台课程组织结构主要包括课程视频、论坛、Wiki、平时作业、考试管理五部分。 从该在线教育平台中,采集学生学习行为轨迹的Web日志记录,一般Web日志记录主要包括 学生用户姓名、访问日期、访问页面网址、页面操作情况、访问开始时间、访问结束时间六种 行为记录。
[0047] 本发明将采集到的学生学习行为数据以数据流的方式存储。数据流顺序为:学生 用户ID+访问日期+访问页面网址+页面操作类型+访问开始时间+访问结束时间+期末考试 成绩。其中,学生用户ID:学号,如1008140304表不学号;访问日期:年月日,如20141123表不 2014年11月23日;访问页面网址:两位数字,如01表示访问课程视频网址;页面操作类型:三 位数字,如111表示经常正常播放速度按顺序观看视频;访问开始时间:时分秒,如105357表 示上午10点53分57秒,访问结束时间同样用这种方法表示。期末考试成绩:三位数字,如087 表示本门课程期末考试成绩为87分。
[0048] 完整的数据流表示10081403042014112301011105357113721087。该在线教育平台 中各个组件与访问页面网址以及页面操作类型的对应关系如表2所示。
[0049] 表 2
[0052]上述步骤102中核心在于依据所采集的学生学习行为大数据流。基于一门课程中 所有学生在整个学期的学习行为数据,本发明对学习行为数据挖掘算法采用聚类分析和关 联规则分析。聚类分析的目的是将具有相似特征行为的学生用户进行分组,使得组内的对 象具有较高的相似度,不同组中的对象差别较大,以保证数据分析效果。关联规则分析则是 以聚类分析结果为依托,对每一类学生进行关联分析,即学习行为与学习效果的关联分析, 即挖掘出学习行为与学习效果之间的关联规则,通过对学生用户的学习行为进行序列模式 挖掘,得到用户行为模式后,对行为模式所包含的数据建立关联规则。利用分析结果建立知 识要点推送数据库。
[0053] 具体的,在执行上述步骤102的过程中具体包括以下步骤:
[0054] ①数据清洗
[0055] 将预处理后得到的学习行为大数据流进行数据清洗。首先将数据流进行分片处 理,获得具有一定语义的键值对,分别为〈学生ID,访问日期〉,〈学生ID,访问页面〉,〈学生 ID,页面操作类型〉,〈访问页面,访问开始时间〉,〈访问页面,访问结束时间〉,〈学生ID,期末 考试成绩〉。然后对所有的键值对进行数据审查,在审查过程中将发现的明显错误值、缺失 值、异常值、可疑数据清理掉,同时还要删除掉重复数据,有利于后续统计分析得出可靠的 结论。最后将清洗后的干净数据送到数据分析部分。
[0056] ②聚类分析
[0057] 本发明采用聚类分析方法中的k-means聚类算法。首先将经过数据清洗后的干净 数据进行转码,即对每一个键值对〈学生ID,X>(X分别代表访问日期、访问页面、页面操作类 型、期末考试成绩)中的字段进行转码操作,而转码公式为:
[0058]
可以看出,转码后的值X ' i的取值范围是[0,1 ]。
[0059] a.从转码后的键值对数据中,随机抽取出5个不同学生ID的键值对,作为聚类中心 点。中心点作为计算聚类内点间距离的基点。之后遍历其余的含有学生ID字段的键值对,利 用欧式距离公式:
[0060]
计算X之间的距离,找到距离各自最近的聚类中心点, 将其加入到该聚类中。这样,产生了一个初始的聚类结果,也是一次迭代的过程。
[0061] b.有些点被划分到聚类中将引起聚类中心点发生变化,此时,要根据聚类内的具 体情况,重新计算聚类中心点。再重新遍历所有的还有学生ID字段的键值对,计算 distance,找到其距离最近的中心点,加入到聚类中。
[0062] c.重复上述步骤,直到前后两次迭代得到的聚类中心点相同,然后停止迭代操作。
[0063] ③关联规则分析
[0064] 通过聚类分析,可以得到5种不同学习效果的聚类学生用户,分别对每一种情况进 行关联规则分析。
[0065] a.构建学习行为序列。首先使用一个五元组来描述操作的结构:0peration =〈ID, 学生ID,访问时间,访问页面,页面操作类型〉,该五元组的各个字段均可以从学习行为数据 流数据流一一找到对应变量。一组学生对页面的连续操作,形成一个由操作构成的时间序 列<0ρ1,0ρ2, · · ·,0ρη>,称做学习行为序列。
[0066] b.对学习行为序列进行R/S分析,计算Hurst指数,然后对| H-0.5 |大于阈值的学习 行为序列运用Apriori算法进行学习行为模式挖掘。
[0067] c.学生行为模式挖掘基于Apriori算法,获取学习行为序列中重复出现的行为片 段,得到行为片段后,其中的操作对象构成了学习行为模式。Apriori算法是一种挖掘关联 规则的频繁项集算法。其算法处理步骤是:第一步,简单统计所有含有一个元素候选集出现 的频率,即统计访问某页面的操作类型在所有序列中的频率,并找出那些不小于最小支持 度的候选集,即一维最大项目集,从第二步开始循环处理,直到没有最大项目集生成。运算 结束后,选取所有长度大于λ且支持度大于最小支持度的项目集,即为挖掘出的学习行为模 式。
[0068]建立关联规则,依据置信度产生关联规则步骤是,第一步,对于每个项目集L,产生 L的所有非空子集;第二步,对于L的每个非空子集S,如果P(L)/P(S)>=min_C〇nf,则输出规 则 S-XL-S)。
[0069] 上述步骤103中所述对预处理后的学习行为数据通过聚类分析算法建立知识要点 推送数据库,包括:
[0070] 对所述预处理后的学习行为数据通过聚类分 析算法进行相似度分组;
[0071] 关联每一分组中的数据中学生的学习行为与预设推送策略;
[0072] 将关联后的学习行为与预设推送策略存储在所述知识要点推送数据库中。
[0073] 根据聚类分析和关联规则分析所得到的数据分析结果,构建基于大数据技术的 M00C在线教育中知识干预系统模型,如图2所示。该模型主要依托于数据分析结果所形成的 知识要点推送数据库,然后对知识要点推送数据库进行有效评估和检测,再将分析和反馈 结果以知识干预的形式推送给学生和教师及管理者。知识干预系统模型流程图如图2所示。
[0074] 在推送该推送策略所包括的知识要点之后,所述方法还包括:
[0075] 存储所述学生的学习行为,并定期推送所述知识要点。
[0076]本发明公开的方法利用M00C在线教育中学习行为数据作为构建知识干预系统模 型的重要数据来源,并且本发明的一个重要特点在于以大数据分析技术为理论依据,以大 数据分析技术为核心所建立的数学模型更为准确、可靠。
[0077] 通过对学习行为数据进行有效、深层次地挖掘,可以发现其潜在的数据信息,以此 作为知识干预系统的知识要点推送数据库,其目的是改善学生的学习成绩、提高学习效率, 尤其在学习进程中,有针对性地向学生推送知识要点,同时反馈给教师关于学生的学习情 况,这样可以有助于教师对学生提供个性化指导。
[0078] 图3示出了本发明实施例提供的一种知识要点推送系统的结构示意图,如图3所 示,该系统包括:
[0079]采集模块31,采集预先记录的学生的学习行为数据;
[0080]预处理模块32,用于通过预设规则对所述学习行为数据进行预处理;
[0081]数据库建立模块33,用于对预处理后的学习行为数据通过聚类分析算法建立知识 要点推送数据库,所述数据库中包括学生的学习行为与预设推送策略的对应关系,所述推 送策略包括不同学习行为对应的知识要点;
[0082] 推送模块34,用于根据学生的学习行为,在所述知识要点推送数据库中获取与所 述学习行为对应的推送策略,并推送该推送策略所包括的知识要点。
[0083] 在本实施例的一个优选的实施方式中,所述学习行为数据包括:用户名、访问日 期、访问页面地址、页面操作信息、访问开始时间和访问结束时间。
[0084]在本实施例的一个优选的实施方式中,所述预处理模块32,用于将所述学习行为 数据通过预设规则进行处理,形成预设数据流的数据。
[0085]在本实施例的一个优选的实施方式中,所述数据库建立模块33,用于对所述预处 理后的学习行为数据通过聚类分析算法进行相似度分组;
[0086] 关联每一分组中的数据中学生的学习行为与预设推送策略;
[0087] 将关联后的学习行为与预设推送策略存储在所述知识要点推送数据库中。
[0088] 在本实施例的一个优选的实施方式中,所述推送模块34,还用于在推送该推送策 略所包括的知识要点之后,存储所述学生的学习行为,并定期推送所述知识要点。
[0089] 上述系统与上述方法是一一对应的关系,上述方法的实施细节同样适用于该系 统,因此本实施例不再对系统的具体实施细节进行详细说明。
[0090] 以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例 对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施 例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者 替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1. 一种知识要点推送方法,其特征在于,包括: 采集预先记录的学生的学习行为数据,并通过预设规则对所述学习行为数据进行预处 理; 对预处理后的学习行为数据通过聚类分析算法建立知识要点推送数据库,所述数据库 中包括学生的学习行为与预设推送策略的对应关系,所述推送策略包括不同学习行为对应 的知识要点; 根据学生的学习行为,在所述知识要点推送数据库中获取与所述学习行为对应的推送 策略,并推送该推送策略所包括的知识要点。2. 根据权利要求1所述的方法,其特征在于,所述学习行为数据包括:用户名、访问日 期、访问页面地址、页面操作信息、访问开始时间和访问结束时间。3. 根据权利要求1或2所述的方法,其特征在于,所述通过预设规则对所述学习行为数 据进行预处理,包括: 将所述学习行为数据通过预设规则进行处理,形成预设数据流的数据。4. 根据权利要求1所述的方法,其特征在于,所述对预处理后的学习行为数据通过聚类 分析算法建立知识要点推送数据库,包括: 对所述预处理后的学习行为数据通过聚类分析算法进行相似度分组; 关联每一分组中的数据中学生的学习行为与预设推送策略; 将关联后的学习行为与预设推送策略存储在所述知识要点推送数据库中。5. 根据权利要求1所述的方法,其特征在于,在推送该推送策略所包括的知识要点之 后,所述方法还包括: 存储所述学生的学习行为,并定期推送所述知识要点。6. -种知识要点推送系统,其特征在于,包括: 采集模块,采集预先记录的学生的学习行为数据; 预处理模块,用于通过预设规则对所述学习行为数据进行预处理; 数据库建立模块,用于对预处理后的学习行为数据通过聚类分析算法建立知识要点推 送数据库,所述数据库中包括学生的学习行为与预设推送策略的对应关系,所述推送策略 包括不同学习行为对应的知识要点; 推送模块,用于根据学生的学习行为,在所述知识要点推送数据库中获取与所述学习 行为对应的推送策略,并推送该推送策略所包括的知识要点。7. 根据权利要求6所述的系统,其特征在于,所述学习行为数据包括:用户名、访问日 期、访问页面地址、页面操作信息、访问开始时间和访问结束时间。8. 根据权利要求6或7所述的系统,其特征在于,所述预处理模块,用于将所述学习行为 数据通过预设规则进行处理,形成预设数据流的数据。9. 根据权利要求6所述的系统,其特征在于,所述数据库建立模块,用于对所述预处理 后的学习行为数据通过聚类分析算法进行相似度分组; 关联每一分组中的数据中学生的学习行为与预设推送策略; 将关联后的学习行为与预设推送策略存储在所述知识要点推送数据库中。10. 根据权利要求6所述的系统,其特征在于,所述推送模块还用于在推送该推送策略 所包括的知识要点之后,存储所述学生的学习行为,并定期推送所述知识要点。
【专利摘要】本发明提供了一种知识要点推送方法及系统,该方法包括:采集预先记录的学生的学习行为数据,并通过预设规则对所述学习行为数据进行预处理;对预处理后的学习行为数据通过聚类分析算法建立知识要点推送数据库,所述数据库中包括学生的学习行为与预设推送策略的对应关系,所述推送策略包括不同学习行为对应的知识要点;根据学生的学习行为,在所述知识要点推送数据库中获取与所述学习行为对应的推送策略,并推送该推送策略所包括的知识要点。该方法能够根据学生的学习行为向学生推送知识要点,以知识干预的方式完成智能化的教学决策和学习补充,解决学生学习能力发展失衡、学习资源利用不合理等问题。
【IPC分类】G06F17/30
【公开号】CN105488103
【申请号】CN201510801693
【发明人】冀荣华, 高万林, 郑立华, 刘云玲, 张港红, 于丽娜
【申请人】中国农业大学
【公开日】2016年4月13日
【申请日】2015年11月18日

最新回复(0)