一种个性化教育资源的推荐方法和装置的制造方法
【技术领域】
[0001] 本发明涉及数据处理领域,尤其涉及一种个性化教育资源的推荐方法和装置。
【背景技术】
[0002] 在当今互联网时代,信息的制造、复制和传播都变得越来越容易,使得各种信息都 呈现爆炸增长的趋势。但在海量的数据面前,用户不得不把大量的时间浪费在信息的筛选 上。为了解决这个问题,各种个性化信息推荐方法越来越引起人们的注意。
[0003] 目前的信息推荐技术主要分为两类。一类是基于邻居用户的兴趣内容进行信息推 荐的协同过滤技术,即找到与用户相似度最高的邻居用户,把邻居用户感兴趣的信息推荐 给用户。这种推荐技术有利于发现用户新的兴趣点,比较适用于社交类网站及一般商业类 网站。但是,教育资源推荐和商业推荐存在差异,一般在商业场景中用户的兴趣广泛,而在 远程教育领域用户的兴趣只在一个或几个特定的类别。例如,医学教育系统的用户大多是 医疗机构的医生、技师等,他们的工作领域往往是较为固定的医学类别,希望获取工作领域 的相关知识(如某类疾病的影像诊断知识)。因此,协同过滤的高发散性不适用于远程教育 资源的推荐。
[0004] 另一类是基于内容的推荐,这种推荐以所有资源项为基础,从中提取特征词,通过 特征词之间的对比和相似性计算找到资源项之间的关联性,从而为用户推荐与过去感兴趣 的资源相似的内容。但是,在资源项基数庞大的情况下,这种方法的运算复杂度很高。并 且,医学教育系统中的资源多以视频为主,特征词提取的难度大并且准确率低,得到的特征 词很难准确地描述资源的实际内容,因此,采用这种方式推荐的医学资源会与用户的兴趣 有较大的偏差。
[0005] 另外,这两类技术的核心都是基于历史数据(通过用户过往的行为记录来推算用 户的兴趣或找到邻居用户),当系统使用此类技术对新用户进行信息推荐时,由于系统没有 用户的历史数据,推荐带有较大的盲目性。
【发明内容】
[0006] 本发明解决的问题是提供一种个性化教育资源的推荐方法和装置,为不同的用户 推荐准确的个性化教育资源,使用户可以快速地找到与自己兴趣相符的内容。
[0007] 为了解决上述问题,本发明提供了一种个性化教育资源的推荐方法,包括如下步 骤:
[0008] (1)根据用户对所述教育资源的当前初始偏好信息,确定所述用户的当前初始推 荐向量;
[0009] (2)根据所述用户的学习记录以及所述当前初始推荐向量,得到所述用户的当前 个性化推荐向量;
[0010] (3)计算所述当前初始推荐向量和当前个性化推荐向量的相关性r;
[0011] (4)若所述相关性r大于指定阈值s,则根据所述当前个性化推荐向量,过滤得到 推荐的资源;若所述相关性r小于等于指定阈值s,则提示所述用户重新选择兴趣类别,并 返回所述步骤(1)。
[0012] 上述所述一种个性化教育资源的推荐方法,其中,确定所述用户的当前初始推荐 向量的过程为:
[0013] (1)建立所述教育资源网站的类别字典,并确定所述类别字典的基向量;
[0014] (2)所述用户选择的所述类别字典基向量中的多个元素为兴趣类别;
[0015] (3)将所述用户选择的元素赋值为a,其余元素赋值为0,即得到所述当前初始推 荐向量,其中,a为正整数。
[0016] 上述所述一种个性化教育资源的推荐方法,其中,得到所述用户的当前个性化推 荐向量的过程为:
[0017] (1)将所述当前初始推荐向量赋值于个性化推荐向量,得到当前初始化个性化推 荐向量;
[0018] (2)根据所述用户的学习记录,提取所述用户的个性化偏好信息,确定所述用户的 个性化偏好向量;
[0019] (3)将所述当前初始化个性化推荐向量和所述个性化偏好向量相加,得到所述当 前个性化推荐向量。
[0020] 上述所述一种个性化教育资源的推荐方法,其中,确定所述用户的个性化偏好向 量的过程为:
[0021] (1)分析所述用户的上一次学习记录,得到所述用户打开所述教育资源的频率;
[0022] (2)将所述频率与指定阈值t进行比较,若所述频率大于所述指定阈值t,则所述 频率对应的教育资源为所述用户的个性化偏好信息;
[0023] (3)将所述用户打开所述个性化偏好信息的频数作为所述个性化偏好向量中对应 元素的元素值,即得到所述用户的个性化偏好向量。
[0024] 上述所述一种个性化教育资源的推荐方法,其中,所述指定阈值t为20%。
[0025] 上述所述一种个性化教育资源的推荐方法,其中,计算所述相关性r的过程为:将 所述当前初始推荐向量和所述当前个性化推荐向量进行归一化处理;通过Pearson相关系 数度量所述相关性r。
[0026] 上述所述一种个性化教育资源的推荐方法,其中,通过Top-N推荐、新资源推荐和 /或基于内容的过滤推荐,过滤得到所述推荐资源。
[0027] 为了解决上述问题,本发明还提供了一种个性化教育资源的推荐装置,包括:
[0028] 确定初始向量单元,适用于根据用户对所述教育资源的当前初始偏好信息,确定 所述用户的当前初始推荐向量;
[0029] 确定个性化向量单元,适用于根据所述用户的学习记录以及所述当前初始推荐向 量,得到所述用户的当前个性化推荐向量;
[0030] 计算单元,适用于计算所述当前初始推荐向量和当前个性化推荐向量的相关性 r;
[0031] 判断推荐单元,适用于若所述相关性r大于指定阈值s,则根据所述当前个性化推 荐向量,过滤得到推荐的资源;若所述相关性r小于等于指定阈值s,则提示所述用户重新 选择兴趣类别,并返回所述步骤(1)。
[0032] 与现有技术相比,本发明引入个性化推荐的校正环节,在推荐的资源和用户的初 始兴趣类别差异较大时,主动向用户确认兴趣类别,这种机制在资源推荐有偏差的情况下 可以通过用户确认来校正推荐误差,还可以帮助用户发现自己的真实兴趣,在推荐的内容 与用户初始兴趣背离但接近用户真实兴趣的情况下,用户可以通过校正环节确认自己的真 实兴趣;
[0033] 进一步地,利用用户初始兴趣类别,解决了现有推荐技术无法为初次使用系统的 用户提供准确推荐的问题,实现了在用户初始登录时即可以查看到个性化教育资源;
[0034] 进一步地,利用医学类别的划分,事先建立类别字典,避免了提取特征词的过程, 以及内容推荐方法中资源项数目大的问题,从而使运算复杂度大大降低,有效提高了推荐 的效率。
【附图说明】
[0035] 图1所示为本发明实施例一种个性化教育资源的推荐方法的流程示意图;
[0036] 图2所示为本发明实施例确定所述用户的当前初始推荐向量的流程示意图;
[0037] 图3所示为本发明实施例得到所述用户的当前个性化推荐向量的流程示意图;
[0038] 图4所示为本发明实施例确定用户的个性化偏好向量的流程示意图;
[0039] 图5所示为本发明实施例一种个性化教育资源的推荐装置的结构示意图。
【具体实施方式】
[0040] 在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以 很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况 下做类似推广,因此本发明不受下面公开的具体实施的限制。
[0041] 其次,本发明利用示意图进行详细描述,在详述本发明实施例时,为便于说明,所 述示意图只是实例,其在此不应限制本发明保护的范围。
[0042] 下面结合附图和实施例对本发明一种个性化教育资源的推荐方法和装置进行详 细地描述。本发明实施例个性化教育资源的推荐方法如图1所示,首先,执行步骤S1,根据 用户对所述教育资源的当前初始偏好信息,确定所述用户的当前初始推荐向量。具体地, 确定所述用户的当前初始推荐向量的过程如图2所示,首先,执行步骤S201,建立所述教育 资源网站的类别字典,并确定所述类别字典的基向量。具体地,在本实施例中,远程教育网 站提供的教育资源为医学影像类,类别字典为设备类型,如〇1?、(:1\1?、超声、?£1/(:1'以及其 它,则类别字典的长度为n= 6,类别字典基向量为出1?,(:1',1?,超声,?£1/(:1',其它}。
[0043] 接着,执行S202,所述用户选择的所述类别字典基向量中的多个元素为兴趣类别。 在本实施例中,用户选择的k(k= 3)个兴趣类别为CT、MR和超声。接着,执行步骤S203, 将所述用户选择的元素赋值为a,其余元素赋值为0,即得到所述当前初始推荐向量,其中, a为正整数。具体地,若用户选择了类别字典基向量中的第i个元素为兴趣类别,则当前初 始推荐向量的第i个元素赋值为正整数a。在本实施例中,所述正整数a为1,根据上述步 骤S202中用户选择的兴趣类别,可知当前初始推荐向量为(0,1,1,1,0,0)。需要说明的是, 正整数a的大小决定了用户个性化推荐向量的调整步幅,a的值越大,用户每查看一次教育 资源对应的个性化向量调整就越明显。此外,需要说明的是,当用户初次使用系统时,才根 据步骤S201至S203确定初始推荐向量,若用户不是初次使用该系统,则所述用户的初始推 荐向量为上次使用系统时所确定的初始推荐向量。
[0044] 接着,执行步骤S2,根据所述用户的学习记录以及所述当前初始推荐向量,得到所 述用户的当前个性化推荐向量。具体地,得到所述用户的当前个性化推荐向量的过程如图3 所示,首先,执行步骤S301,将所述当前初始推荐向量赋值于个性化推荐向量,得到当前初 始化个性化推荐向量。在本实施例中,根据步骤S1可知,当前初始化个性化推荐向量为(0, 1,1,1,0,0)。接着,执行步骤S302,根据所述用户的学习记录,提取所述用户的个性化偏好 信息,确定所述用户的个性化偏好向量。具体地,确定所述用户的个性化偏好向量的过程如 图4所示,首先,执行步骤S401,分析所述用户的上一次学习记录,得到所述用户打开所述 教育资源的频率。具体地,在本实施例中,以用户的登录、退出操作作为一个学习过程的起 始和终止时间,以用户打开教育资源的频数作为分析偏好信息的依据。用户在一次学习过 程中打开了 6个教育资源,其中,3个为CT类,2个为MR类,1个为DR类,则可知所述用户打 开的教育资源的频率分别为50%,33. 3%和16. 7%。
[0045] 接着,执行步骤S402,将所述频率与指定阈值t进行比较,若所述频率大于所述指 定阈值t,则所述
频率对应的教育资源为所述用户的个性化偏好信息。具体地,在本实施例 中,所述指定阈值t为20%。将所述步骤S401中用户所打开的教育资源和指定阈值t进行 比较可知,用户的个性化偏好信息为MR和CT。
[0046]接着,执行步骤S403,将所述用户打开所述个性化偏好信息的频数作为所述个性 化偏好向量中对应元素的元素值,即得到所述用户的个性化偏好向量。具体地,在此次学习 过程中,用户的偏好为第i类,则个性化偏好向量的第i个元素值为用户在此次学习过程中 查看第i类教育资源的频数;用户不偏好第j类教育资源,则个性化偏好向量中第j个元素 值为0。在本实施例中,由步骤S402可知,用户的偏好信息为MR和CT,频数分别为3和2, 则所述用户的个性化偏好向量为(〇,3,2,0,0,0)。
[0047]接着,执行步骤S303,将所述当前初始化个性化推荐向量和所述个性化偏好向量 相加,得到所述当前个性化推荐向量。具体地,在本实施例中,当前初始个性化推荐向量为 (0,1,1,1,0,0),个性化偏好向量为(0,3,2,0,0,0),则所述当前个性化推荐向量为(0,4, 3,1,0,0)〇
[0048]接着,执行步骤S3,计算所述当前初始推荐向量和当前个性化推荐向量的相关性r。具体地,首先,将所述当前初始推荐向量和所述当前个性化推荐向量进行归一化处理,且 使向量中各元素之和为1。在本实施例中,当前初始推荐向量(〇,1,1,1,〇,〇)归一化处理 后为x= (0,1/3,1/3,1/3,0,0);当前个性化推荐向量(0,4,3,1,0,0)归一化出处理后为 y= (0,1/2, 3/8,1/8,0,0)。接着,通过Pearson相关系数度量所述相关性r。在本实施例 中,计算相关性r的公式为:
[0050]其中,i为向量x和y中元素的个数;n为向量x和y中元素的总个数;Xi为向量x 中的元素;^为向量X中所有元素的平均值;yi为向量y中的元素;f为向量y中所有元素 的平均值。通过上述公式,可以得到所述当前初始推荐向量和当前个性化推荐向量的相关 性r为0.83。
[0051] 接着,执行步骤S4,比较相关性r和指定阈值s的大小,若所述相关性r大于指定 阈值s,则执行步骤S5,根据所述当前个性化推荐向量,过滤得到推荐的资源;若所述相关 性r小于等于指定阈值s,则提示所述用户重新选择兴趣类别,并返回所述步骤S1。具体地, 本实施例中阈值为0,若r> 0,所述当前初始推荐向量和当前个性化推荐向量呈现正相关, 说明推荐的资源是符合用户兴趣的资源,则接下来执行步骤S5 ;若r< 0,说明所述当前初 始推荐向量和当前个性化推荐向量相互独立或呈负相关,说明用户初始兴趣与根据学习记 录跟踪调整得到的兴趣有较大差异,甚至是反向相关,即推荐的资源是用户不感兴趣的资 源,此时,将当前个性化推荐向量中值最大的k个类别作为新的兴趣类别推荐给用户,提示 用户修改兴趣类别,并返回所述步骤S1。
[0052] 具体地,在本实施例中,由步骤S3可知,相关性r>0,则根据所述当前个性化推荐 向量,过滤得到推荐的资源。具体地,将兴趣类别中的资源,作为推荐资源的候补名单,并将 已查看过的资源从候补名单上提出,再通过Top-N推荐、新资源推荐和/或基于内容的过滤 推荐等,过滤得到推荐给所述用户的资源。类别字典基向量为出1?,(:1',1?,超声,?£1/(:1',其 它},而当前个性化推荐向量为(〇,1/2,3/8,1/8,0,0),按1^4推荐" =2为例),选取值 最大的两个,即CT和MR推荐给用户。若步骤S3中得到的相关性r< 0,则将当前个性化推 荐向量中的值最大的k个资源作为新的兴趣类别推荐给所述用户,并提示用户修改兴趣类 另IJ。用户根据提示对兴趣类别进行修改,即重新确定了当前初始推荐向量,再根据上述同样 的方法,确定用户的推荐资源。
[0053] 对应于上述一种个性化教育资源的推荐方法,本发明实施例还提供了一种个性化 教育资源的推荐装置,如图5所示,包括确定初始向量单元1,确定个性化向量单元2,计算 单元3以及判断推荐单元4。
[0054] 所述确定初始向量单元1适于据用户对所述教育资源的当前初始偏好信息,确定 所述用户的当前初始推荐向量。所述确定初始向量单元1包括建立类别字典单元,选择兴 趣类别单元和赋值单元。其中,所述建立类别字典单元适于建立所述教育资源网站的类别 字典,并确定所述类别字典的基向量;所述选择兴趣类别单元适于所述用户选择的所述类 别字典基向量中的多个元素为兴趣类别;所述赋值单元适于将所述用户选择的元素赋值为 a,其余元素赋值为0,即得到所述当前初始推荐向量,其中,a为正整数。
[0055] 所述确定个性化向量单元2适于根据所述用户的学习记录以及所述当前初始推 荐向量,得到所述用户的当前个性化推荐向量。所述确定个性化向量单元2包括向量赋值 单元,确定个性化偏好向量单元和相加单元。所述向量赋值单元适于将所述当前初始推荐 向量赋值于个性化推荐向量,得到当前初始化个性化推荐向量;所述确定个性化偏好向量 单元适于根据所述用户的学习记录,提取所述用户的个性化偏好信息,确定所述用户的个 性化偏好向量;所述相加单元适于将所述当前初始化个性化推荐向量和所述个性化偏好向 量相加,得到所述当前个性化推荐向量。
[0056] 所述计算单元3适于计算所述当前初始推荐向量和当前个性化推荐向量的相关 性r。具体地,将所述当前初始推荐向量和所述当前个性化推荐向量进行归一化处理;通过 Pearson相关系数度量所述相关性r〇
[0057] 所述判断推荐单元4适于若所述相关性r大于指定阈值s,则根据所述当前个性化 推荐向量,过滤得到推荐的资源;若所述相关性r小于等于指定阈值s,则提示所述用户重 新选择兴趣类别,并返回所述确定初始向量单元1。
[0058] 上述个性化教育资源推荐装置中各单元的配合及工作过程可以参考上述个性化 教育资源推荐方法的说明,在此不再赘述。
[0059] 本发明虽然已以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域 技术人员在不脱离本发明的精神和范围内,都可以利用上述揭示的方法和技术内容对本发 明技术方案做出可能的变动和修改,因此,凡是未脱离本发明技术方案的内容,依据本发明 的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本发明技术方案 的保护范围。
【主权项】
1. 一种个性化教育资源的推荐方法,其特征在于,包括如下步骤: (1) 根据用户对所述教育资源的当前初始偏好信息,确定所述用户的当前初始推荐向 量; (2) 根据所述用户的学习记录以及所述当前初始推荐向量,得到所述用户的当前个性 化推荐向量; (3) 计算所述当前初始推荐向量和当前个性化推荐向量的相关性r; (4) 若所述相关性r大于指定阈值s,则根据所述当前个性化推荐向量,过滤得到推荐 的资源;若所述相关性r小于等于指定阈值s,则提示所述用户重新选择兴趣类别,并返回 所述步骤(1)。2. 如权利要求1所述一种个性化教育资源的推荐方法,其特征在于,确定所述用户的 当前初始推荐向量的过程为: (1) 建立所述教育资源网站的类别字典,并确定所述类别字典的基向量; (2) 所述用户选择的所述类别字典基向量中的多个元素为兴趣类别; (3) 将所述用户选择的元素赋值为a,其余元素赋值为0,即得到所述当前初始推荐向 量,其中,a为正整数。3. 如权利要求1所述一种个性化教育资源的推荐方法,其特征在于,得到所述用户的 当前个性化推荐向量的过程为: (1) 将所述当前初始推荐向量赋值于个性化推荐向量,得到当前初始化个性化推荐向 量; (2) 根据所述用户的学习记录,提取所述用户的个性化偏好信息,确定所述用户的个性 化偏好向量; (3) 将所述当前初始化个性化推荐向量和所述个性化偏好向量相加,得到所述当前个 性化推荐向量。4. 如权利要求3所述一种个性化教育资源的推荐方法,其特征在于,确定所述用户的 个性化偏好向量的过程为: (1) 分析所述用户的上一次学习记录,得到所述用户打开所述教育资源的频率; (2) 将所述频率与指定阈值t进行比较,若所述频率大于所述指定阈值t,则所述频率 对应的教育资源为所述用户的个性化偏好信息; (3) 将所述用户打开所述个性化偏好信息的频数作为所述个性化偏好向量中对应元素 的元素值,即得到所述用户的个性化偏好向量。5. 如权利要求4所述一种个性化教育资源的推荐方法和装置,其特征在于,所述指定 阈值t为20%。6. 如权利要求1所述一种个性化教育资源的推荐方法和装置,其特征在于,计算所述 相关性!的过程为:将所述当前初始推荐向量和所述当前个性化推荐向量进行归一化处 理;通过Pearson相关系数度量所述相关性r。7. 如权利要求1所述一种个性化教育资源的推荐方法,其特征在于,通过Top-N推荐、 新资源推荐和/或基于内容的过滤推荐,过滤得到所述推荐资源。8. 如权利要求1所述一种个性化教育资源的推荐装置,其特征在于,包括:确定初始向 量单元,适用于根据用户对所述教育资源的当前初始偏好信息,确定所述用户的当前初始 推荐向量; 确定个性化向量单元,适用于根据所述用户的学习记录以及所述当前初始推荐向量, 得到所述用户的当前个性化推荐向量; 计算单元,适用于计算所述当前初始推荐向量和当前个性化推荐向量的相关性r; 判断推荐单元,适用于若所述相关性r大于指定阈值8,则根据所述当前个性化推荐向 量,过滤得到推荐的资源;若所述相关性r小于等于指定阈值s,则提示所述用户重新选择 兴趣类别,并返回所述步骤(1)。
【专利摘要】本发明提供一种个性化教育资源的推荐方法和装置,所述方法包括如下步骤:(1)根据用户对所述教育资源的当前初始偏好信息,确定所述用户的当前初始推荐向量;(2)根据所述用户的学习记录以及所述当前初始推荐向量,得到所述用户的当前个性化推荐向量;(3)计算所述当前初始推荐向量和当前个性化推荐向量的相关性r;(4)若所述相关性r大于指定阈值s,则根据所述当前个性化推荐向量,过滤得到推荐的资源;若所述相关性r小于等于指定阈值s,则提示所述用户重新选择兴趣类别,并返回所述步骤(1)。本技术方案为不同的用户推荐准确的个性化教育资源,使用户可以快速地找到与自己兴趣相符的内容。
【IPC分类】G06F17/30
【公开号】CN104899195
【申请号】CN201410038251
【发明人】陈文娟, 秦畅
【申请人】武汉联影医疗科技有限公司, 上海联影医疗科技有限公司
【公开日】2015年9月9日
【申请日】2014年1月26日