一种基于技能学习的智能解答方法与系统的制作方法

xiaoxiao2020-6-26 28

专利名称：一种基于技能学习的智能解答方法与系统的制作方法
技术领域：
本发明涉及计算机智能教学以及数字出版领域，尤其涉及一种基于技能学习的智能解答方法和系统。
背景技术：
人们在学习一些技能操作时，一般通过师傅传授的方式，随着科技进步，数字出版的发展，教材的形式发生着重大变化，人们可以通过一个智能的系统来学习技能知识。操作技能就是指掌握操作方法的能力，任意一个操作方法都是由一些更小的操作按一定的流程组成。计算机技术可以根据每个操作流程的一维定义，推理出一个操作技能所包含的操作方法有哪几种组合。每一个操作方法都有一个完整的教材内容与之匹配，因此，学生向智能系统提出某一项技能的学习请求后，智能系统会为学生提供一个对应的教材内容组合。然而，如何能够准确地提供教材内容组合是此领域的一个难题。

发明内容
鉴于现有技术的问题，本发明提供一种基于技能学习的智能解答方法，其特征在于包括如下步骤(I)以最小的完整操作技能为基本单元将教材内容拆分为多个片断，并为每个片断赋予用于标出每个片断的所在章节及所在页码的信息的结构属性；(2)将用于对所拆分的多个片断进行语义描述所用到的词进行规范并建立技能语义描述字典；(3)将每一个技能定义为一个技能本体，每一个技能本体由语义字典中的语义词按一定的逻辑关系组成；(4)根据所述技能本体，对所述多个片断的每一个进行语义描述；(5)根据各个技能之间的逻辑关系来建立一个基于技能本体的逻辑模型；(6)通过语义检索分析用户提出的技能需求，根据基于技能本体的逻辑模型推理出用户所提出的技能由多少种子操作组合而成，每一个操作都是一个本体，根据本体中的语义词以及其逻辑关系或者根据每一个本体的ID号，检索出通过该本体来描述语义的片断，并根据相应片断的结构属性提取出相对应的教材内容。此外，本发明还提供一种基于技能学习的智能解答系统，其特征在于包括如下装置用于以最小的完整操作技能为基本单元将教材内容拆分为多个片断，并为每个片断赋予用于标出每个片断的所在章节及所在页码的信息的结构属性的装置；用于对所拆分的多个片断进行语义描述所用到的词进行规范并建立技能语义描述字典的装置；用于将每一个技能定义为一个技能本体，并且使每一个技能本体由语义字典中的语义词按一定的逻辑关系组成的装置；用于根据所述技能本体，对所述多个片断的每一个进行语义描述的装置；用于根据各个技能之间的逻辑关系来建立一个基于技能本体的逻辑模型的装置；用于通过语义检索分析用户提出的技能需求，根据基于技能本体的逻辑模型推理出用户所提出的技能由多少种子操作组合而成，其中每一个操作都是一个本体，然后根据本体中的语义词以及其逻辑关系或者根据每一个本体的ID号，检索出通过该本体来描述语义的片断，并根据相应片断的结构属性提取出相对应的教材内容的装置。
本发明能够实现教材的片断内容的技能语义描述，教材不再是完整的、不可分割的，而是被有目的地分成若干个片断，每一个片断都对应着一个技能，教材以及相关的海量的图书以及多媒体课件最终形成了海量的知识库，而不是简单的数据库。读者的提出的每一个关于技能学习的问题都能从知识库中检索到一个或多个可选择的方案，读者可以通过该系统与方法举一反三，学习到更多、更广的技能知识。甚至可以帮读者解决从未遇到过的复杂问题。

图I是本发明基于技能学习的智能解答方法的数据处理流程图。
具体实施例方式为使本发明的上述目的、特征和优点更加明显易懂，下面结合附图和具体实施方式
对本发明作进一步详细的说明。图I是本发明基于技能学习的智能解答方法的数据处理流程图，该处理流程包括如下步骤(I)以最小的完整操作技能为基本单元将教材内容拆分为多个片断，并为每个片断赋予用于标出每个片断的所在章节及所在页码的信息的结构属性；教材的内容可以看成一个一维的阵列，在一个一维阵列中可以任意提取一个子列。因此，教材的内容可以很容易地被人工或工具拆分成没有嵌套及先后顺序关系的片断。对于视频、动画两样如此。在该步骤中，以一个最小的完整操作技能作为最小单元来拆分教材内容，从教材中(包含图书、视频、动画等)识别这些基本单元，使分割的片断内容基本上包含了一个基本的操作方法；所拆分的片断之间是并列关系的结构。拆分时要读取片断在原书内容的位置以及样式的信息，并保存在文本中。这种“最小操作技能”并非绝对最小，用户可根据拆分难度与操作技能的粒度之间平衡一个最佳的选择。因为一般情况下，越大的操作越容易拆分，但应用效果不好，反之亦然。(2)将用于对所拆分的多个片断进行语义描述所用到的词进行规范并建立技能语义描述字典；在该步骤中，为了让其它工具更好识别这些语义，我们对语义描述中所用到的一些词可以做一个规范,建立一个技能语义描述字典。例如,对OP i = (0 i, A i, AK i, C i)中的每个取值做如下说明属性名、取值范围、详细说明
ID 属性=id;ID取值范围=整型；0.属性名=主体词；0 取值范围=任意名词；0.说明=语义所描述的对象A.属性名=谓体词；A.取值范围=任意动词或系动词+名词；A.说明=语义所描述的对象的功能性说明；
AK.属性名=谓体词的补充说明；AK 取值范围=任意词；AK.说明=语义所描述的对象的功能性说明的进一步补充C.属性名=约束条件；C.取值范围=多元词组；C.说明=从多个方面来说明对象功能的条件(3)将每一个技能定义为一个技能本体，每一个技能本体由语义字典中的语义词按一定的逻辑关系组成；由于用户要学习的技能分解为一系列的操作或者动作，为了便于对技能本身的表达，我们将每一个技能都定义为一个技能本体，虽然每一个技能又是由一个多元组，但这并不影响把每一个技能都定义为一个本体，因此本发明的本体要比一般意义上的本体要复杂，每一个本体都是二维的，其中的一维用于描述该项技能的操作特点，另外一维用于描述本体之间的逻辑关系。(4)根据所述技能本体，对所述多个片断的每一个进行语义描述；根据每一个片断的内容，编辑人员采用一个多元因子来描述该内容是可实现的。这个多元因子的属性是清楚的，没有二义性，虽然多元因子的取值具有人为因素干扰而偏差，但是对于出版该教材的编辑人员以及审校流程来说，可以消除这种偏差。在该步骤中，对于片断最小单元S，用DD描述语义特征，这一步必须是手工填加，实现对片断内容的抽象过程I、DD = U {OP i}，OP i = (ID i, 0 i, A i, AK i, C i)S卩，用多个属性组合(OP i)从其用途、意义、内容概括、相关问题等多方面来描述片断⑶的。其中，DD为技能语义描述集合；它由若干技能的语义描述组成。技能语义描述OP i是一个五元组。其中ID i表示该技能的唯一识别号；0 i表示语义的主体；A i为语义的谓体;AK i为A i的补充关键字；C 1为约束条件，是一个多元组{0’11，(’21，(’31……}C，Ii = {NAME, VALUE}C，2i = {NAME, VALUE}C，3i = {NAME, VALUE}......举例，对于软件类教材的C，1，C，2，C，3，可以分别取值为:C，I. name = “类别”， C’ 2. name =“软件名称”，C’ 3. name = “版本”通过对每一个片断内容进行技能的语义描述，使计算机系统可以识别出这段内容对应着一个操作技能。(5)根据各个技能之间的逻辑关系来建立一个基于技能本体的逻辑模型；在该步骤中，建立一个基于技能本体逻辑模型。本体逻辑的描述语言与工具较成熟，完全可以实现技能本体之间存在的组合与顺序的逻辑关系。逻辑关系主要设计为组合关系、组合内的先后关系。即描述A操作由A1、A2、…… 组成。同时，Al在A2的前面。由此，建立一个本体描述模型，反映每一个操作(本体)与其它操作(本体)之间的逻辑关系。(6)通过语义检索分析用户提出的技能需求，根据基于技能本体的逻辑模型推理出用户所提出的技能由多少种子操作组合而成，每一个操作都是一个本体，根据本体中的语义词以及其逻辑关系或者根据每一个本体的ID号，检索出通过该本体来描述语义的片断，并根据相应片断的结构属性提取出相对应的教材内容。在该步骤中，建立一个计算机系统，用来推理用户提出的某种技能的学习内容。具体的方案是用户提出需求-计算机通过语义检索分析该技能是什么-计算机推理出该技能由多少种子操作组合而成一计算机列出多种组合一计算机推荐使用最多的或人为推荐的组合-用户确认其中某一种组合方案-计算机根据本体中的语义词以及其逻辑关系或者根据每一个本体的ID号，检索出通过该本体来描述语义的片断，从数据库中提取出相对应的教材内容(含视频、动画等)。由此,把任意一个学生提出来的技能学习诉求,分解为若干个小操作技能的组合，最终提供每个操作技能的教材内容。基本本体逻辑描述的机器推理工具比较成熟，设计人员既可以通过成熟的工具来实现推理，也可以重新设计推理程序来实现机器推理的功能。本发明能够实现教材的片断内容的技能语义描述，教材不再是完整的、不可分割的，而是被有目的地分成若干个片断，每一个片断都对应着一个技能，教材以及相关的海量的图书以及多媒体课件最终形成了海量的知识库，而不是简单的数据库。读者的提出的每一个关于技能学习的问题都能从知识库中检索到一个或多个可选择的方案，读者可以通过该系统与方法举一反三，学习到更多、更广的技能知识。甚至可以帮读者解决从未遇到过的复杂问题。下面以具体应用实例进行描述，以使得对本发明的应用理解更直观。第一步，内容结构拆分取自任意一本电子教材，格式可以是DOC\H)F\EPUB\INDD\等可以提取内容的文件，本文以WORD格式的电子图书为例，说明本方案的实施过程。I. I用相应的软件打开这种格式的电子图书，如《MICROSOFT WORD》。或者I. 2启动《希望结构拆分工具》，运行“文件导入”功能，把word文件导入系统。2.用WORD中的“选择”工具，依次把文档内容中的片断，按照用户所需要的方式 COPY出来，手动粘贴到任意一个XML编辑器中，最终把全部内容COPY出来。COPY过程中，片断之间可以有重复的内容，但不能有遗漏的内容。3. I在XML编辑器中，严格按照本发明的方法为每一个内容定义其片断的结构属性，包括所在章节及所在页码的信息等。或者3. 2在《希望结构拆分工具》中运行导入功能，把当前XML文件自动赋予属性，包括所在章节及所在页码的信息等。取代2与3. I。功能流程1、计算机读取文件并识别出所有标题的样式，2、计算机根据样式的特点确定该标题的结构属性，取值范围为章标题、节标题、小节标题、小小节标题。3、计算机读取该标题的正确的页码信息。4、把所有读取的标题内容做为元素组成一个XML文件，并给这些元素赋予结构与页码的属性值。通过上述手动还是自动的方法，结果产生一个XML文件，其特点是每个片断内容之间是并列关系，但每个片断都具有反映层次关系的结构属性，如果没有结构属性也可以，不影响到智能解答的功能，但是如果有结构属性，那么可以使在技能语义的标注工作中相对方便些。第二步，数据的语义处理运行《希望语义标注系统》，导入上一环节输出的XML文件，在系统中运行“生成图书结构”功能，此功能读取XML文件各个元素的结构属性，并根据其属性来判断各元素的先后与层次关系。功能流程1、计算机读取XML文件中的所有标题元素。2、计算机根据标题元素的结构属性值，结合章包含节，节包含小节，小节包含小小节的原理，重新组织元素的包含关系。3、计算机根据新的组织关系生成一个有包含层次关系的新的XML文件。运行“浏览XML”功能，在浏览窗口中查看XML文件，这时的XML文件是具有先后顺序及层次关系的，进一步浏览并检查是否有错误，如果有，可以用鼠标拖动方式调整位置关系。运行《希望语义标注系统》的“语义字典”模块，建立技能语义字典以及技能本体之间的逻辑关系。语义字典实质上是由一个个技能点组成，每一个技能点是由多个词组成的一句话。比如“新建文件的方法”运行《希望语义标注系统》中的“语义标注”模块，可以看到完整的图书内容及对应的XML结构以及语义树(技能点组成的树)，然后对每一个元素(片断内容)进行技能语义标注。如果有视频、动画等课件需要标注，则运行《希望语义标注系统》的多媒体标注模块，把视频、动画等多媒体导入系统，并对每一个多媒体内容进行技能语义的标注，方法同第7条。上述两步实现了内容的入库工作。下述两步将实现机器智能推理的功能。第三步，分析用户输入问题用户通过学习平台输入关于技能的问题，如“如何用PHOTOSHOP CS4消除红眼？ ”。《希望语义分析引擎》分解用户提问的问题。并且分析出这样一个技能语义“主体(红眼)-谓体(消除)-版本(PHOTOSHOP CS4) ”《希望语义分析引擎》推理技能语义，并且推理出如下结论方案一“I.新建文件 2. COPY原图3.新建图层4.粘贴图像5……方案二“I.消除红眼案例”(假设有这样的标注)第四步，结果输出12、《希望语义分析引擎》启动数据检索服务，根据上述11方法得出的结论，按语义检索的方式去检索，向用户输出教材内容。如I.新建文件--------《PHOTOSHOP CS4教材》第二章第一位节第3页2. COPY JPG-----《PH0P0SH0P案例教学》第一章第三位节第23页3. COPY JPG-----《如何使用COPY命令的视频教学》
最后应当说明的是以上实施例仅用以说明本发明的技术方案而非对其限制；尽管参照较佳实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解依然可以对本发明的具体实施方式
进行修改或者对部分技术特征进行等同替换；而不脱离本发明技术方案的精神，其均应涵盖在本发明请求保护的技术方案范围当中。
权利要求
1.一种基于技能学习的智能解答方法，其特征在于包括如下步骤 (1)以最小的完整操作技能为基本单元将教材内容拆分为多个片断，并为每个片断赋予用于标出每个片断的所在章节及所在页码的信息的结构属性； (2)将用于对所拆分的多个片断进行语义描述所用到的词进行规范并建立技能语义描述字典； (3)将每一个技能定义为一个技能本体，每一个技能本体由语义字典中的语义词按一定的逻辑关系组成； (4)根据所述技能本体，对所述多个片断的每一个进行语义描述； (5)根据各个技能之间的逻辑关系来建立一个基于技能本体的逻辑模型； (6)通过语义检索分析用户提出的技能需求，根据基于技能本体的逻辑模型推理出用户所提出的技能由多少种子操作组合而成，每一个操作都是一个本体，根据本体中的语义词以及其逻辑关系或者根据每一个本体的ID号，检索出通过该本体来描述语义的片断，并根据相应片断的结构属性提取出相对应的教材内容。
2.根据权利要求I所述的基于技能学习的智能解答方法，其特征在于所拆分的多个片断之间是并列关系的结构。
3.根据权利要求I所述的基于技能学习的智能解答方法，其特征在于在拆分成多个片断时，要读取片断在原教材内容的位置以及样式的信息，并保存在文件中。
4.根据权利要求I所述的基于技能学习的智能解答方法，其特征在于对所述多个片断的每一个进行语义描述的方式是手工输入。
5.根据权利要求I所述的基于技能学习的智能解答方法，其特征在于所述教材内容包括图书、视频、动画。
6.一种基于技能学习的智能解答系统，其特征在于包括如下装置用于以最小的完整操作技能为基本单元将教材内容拆分为多个片断，并为每个片断赋予用于标出每个片断的所在章节及所在页码的信息的结构属性的装置；用于对所拆分的多个片断进行语义描述所用到的词进行规范并建立技能语义描述字典的装置；用于将每一个技能定义为一个技能本体，并且使每一个技能本体由语义字典中的语义词按一定的逻辑关系组成的装置；用于根据所述技能本体，对所述多个片断的每一个进行语义描述的装置；用于根据各个技能之间的逻辑关系来建立一个基于技能本体的逻辑模型的装置；用于通过语义检索分析用户提出的技能需求，根据基于技能本体的逻辑模型推理出用户所提出的技能由多少种子操作组合而成，其中每一个操作都是一个本体，然后根据本体中的语义词以及其逻辑关系或者根据每一个本体的ID号，检索出通过该本体来描述语义的片断，并根据相应片断的结构属性提取出相对应的教材内容的装置。
7.根据权利要求6所述的基于技能学习的智能解答系统，其特征在于所拆分的多个片断之间是并列关系的结构。
8.根据权利要求6所述的基于技能学习的智能解答系统，其特征在于在拆分成多个片断时，要读取片断在原教材内容的位置以及样式的信息，并保存在文件中。
9.根据权利要求6所述的基于技能学习的智能解答系统，其特征在于对所述多个片断的每一个进行语义描述的方式是手工输入。
10.根据权利要求6所述的基于技能学习的智能解答系统，其特征在于所述教材内容包括图书、视频、动画。
全文摘要
一种基于技能学习的智能解答方法与系统，其以最小的完整操作技能为基本单元将教材内容拆分为多个片断，并为每个片断赋予用于标出每个片断的所在章节及所在页码的信息的结构属性；将用于对所拆分的多个片断进行语义描述所用到的词进行规范并建立技能语义描述字典；将每一个技能定义为一个技能本体，每一个技能本体由语义字典中的语义词按一定的逻辑关系组成；然后对所述多个片断的每一个进行语义描述；最后根据各个技能之间的逻辑关系通过语义检索分析用户提出的技能需求，根据基于技能本体的逻辑模型推理出用户所提出的技能由多少种子操作组合而成并根据相应片断的结构属性提取出相对应的教材内容。
文档编号G09B7/02GK102622920SQ20111031821
公开日2012年8月1日申请日期2011年10月19日优先权日2011年10月19日
发明者张训军申请人:北京中科希望软件股份有限公司

2010-2011专利技术

最新回复(0)