文章的主观意见管理方法及其相关装置与计算机程序产品的制作方法

xiaoxiao2021-2-28  248

文章的主观意见管理方法及其相关装置与计算机程序产品的制作方法
【技术领域】
[0001]本发明有关于一种文章的主观意见管理方法及其相关装置,且特别有关于一种可以对于网络文章的主观意见进行识别的方法及其相关装置。
【背景技术】
[0002]近年来,随着各式各样具有网络连接能力的电子装置,如计算机、笔记型计算机、平板计算机、及智能型手机的问市,使用者可以随时随地的利用电子装置来连接网络,以浏览因特网,且透过网络进行相关应用与服务。由于网络及这些装置及其功能所带来的便利,也使得这些装置成为现代人的必备品之一,并随时随地的在生活中频繁使用这些功能。
[0003]同时,随着因特网的发展,网络经营者积极地开发各式各样的网络应用给使用者使用。举例来说,使用者可以透过电子布告栏系统(BBS)来浏览文章与发表评论。使用者也可以透过特定网站或是自行架设网页来发表文章。目前,因特网上正盛行的是部落格(Blog)的应用。每一个使用者可以建立自己的部落格,在自己在部落格中发表文章。
[0004]由于部落格及其它类似网络平台的兴起,在任一网络文章中必定会有一至多个在描述或谈论的对象,此对象可以为人物、事件、时间、地点、物品等。文章作者可以对于对象本身表示意见,也可以对于对象写下评论描述文字,从而产生使用者对于对象的主观性意见。相对于相关厂商,其也期望透过其上发布的网络文章来得知使用者对于其商品或服务的消费意见,以进行相关改进或广告行为。
[0005]现有技术中,网络文章的分析技术仅限于单纯利用事先定义的特定词库,如属性词库、意见词库、程度词库、否定词库等来比对网络文章,从而取得相关对象的属性及其对应的意见词。然而,现有文章分析的结果往往不如预期。举例来说,现有技术由网络文章找出的主观意见往往不够正确。因此,目前业界亟需一种可以强化主观意见的识别,与/或加强网络文章与词库比对效率的技术。

【发明内容】

[0006]有鉴于此,本发明提供文章的主观意见管理方法及其相关装置,其中,电子装置可以对于网络文章进行主观意见的识别作业。
[0007]本发明实施例的一种文章的主观意见管理方法。首先,取得一文章语句;依据包括多个候选属性词的一属性词库搜寻文章语句中的一属性词,并将属性词输入一距离模型,从而得到相应属性词的一标准距离值;接着,由文章语句取得一意见词组,且计算属性词与意见词组于文章语句中的一实际距离值;之后,依据标准距离值与实际距离值判断文章语句是否为一非主观意见语句。
[0008]作为优选,可以依据属性词于文章语句中的位置及标准距离值决定由文章语句搜寻意见词组的一搜寻起始位置。
[0009]作为优选,意见词组可以依据一评价词库、一程度词库、与一否定词库进行搜寻文章语句所得到。
[0010]作为优选,当实际距离值大于或小于标准距离值时,判定文章语句为一非主观意见语句;在一些实施例中,当实际距离值大于标准距离值加一容许误差值,或小于标准距离值减一容许误差值时,判定文章语句为一非主观意见语句。
[0011]作为优选,距离模型可以依据多个训练语句产生,其中该等训练语句至少包括一训练属性词与一训练意见词组,且训练属性词与训练意见词组间的一距离被作为一特征值以输入距离模型。
[0012]本发明公开一种文章的主观意见管理方法,首先,取得一文章语句;依据包括多个候选属性词的一属性词库搜寻文章语句中的一属性词,并将属性词输入一距离模型,从而得到相应属性词的一标准距离值;接着,依据属性词于文章语句中的位置及标准距离值决定由文章语句搜寻一意见词组的一搜寻起始位置。
[0013]本发明公开一种文章的主观意见管理装置至少包括一储存单元、与一处理单元;储存单元具有一文章语句、包括多个候选属性词的一属性词库、与一距离模型;处理单元依据属性词库搜寻文章语句中的一属性词,并将属性词输入距离模型,从而得到相应属性词的一标准距离值;处理单元由文章语句取得一意见词组,且计算属性词与意见词组于文章语句中的一实际距离值;处理单元依据标准距离值与实际距离值判断文章语句是否为一非主观意见语句。
[0014]本发明公开的一种文章的主观意见管理装置至少包括一储存单元、与一处理单元;储存单元具有一文章语句、包括多个候选属性词的一属性词库、与一距离模型。处理单元依据属性词库搜寻文章语句中的一属性词,并将属性词输入距离模型,从而得到相应属性词的一标准距离值;处理单元依据属性词于文章语句中的位置及标准距离值决定由文章语句搜寻一意见词组的一搜寻起始位置。
[0015]本发明公开一种计算机程序产品,用以被一机器加载且执行一文章的主观意见管理方法,该计算机程序产品包括:一第一程序代码,用以依据包括多个候选属性词的一属性词库搜寻一文章语句中的一属性词;一第二程序代码,用以将该属性词输入一距离模型,从而得到相应该属性词的一标准距离值;一第三程序代码,用以由该文章语句取得一意见词组;一第四程序代码,用以计算该属性词与该意见词组于该文章语句中的一实际距离值;以及一第五程序代码,用以依据该标准距离值与该实际距离值判断该文章语句是否为一非主观意见语句。
[0016]本发明公开一种计算机程序产品,用以被一机器加载且执行一文章的主观意见管理方法,该计算机程序产品包括:一第一程序代码,用以依据包括多个候选属性词的一属性词库搜寻一文章语句中的一属性词;一第二程序代码,用以将该属性词输入一距离模型,从而得到相应该属性词的一标准距离值;一第三程序代码,用以依据该属性词于该文章语句中的位置及该标准距离值决定由该文章语句搜寻一意见词组的一搜寻起始位置。
[0017]本发明的文章的主观意见管理方法及其相关装置可以对于网络文章进行主观意见的识别作业,从而增加由文章中擷取主观意见的正确性,且/或增加由文章中搜寻意见词组的效率。
[0018]本发明上述方法可以透过程序代码方式存在。当程序代码被机器加载且执行时,机器变成用以实行本发明的装置。
【附图说明】
[0019]图1为本发明实施例的文章的主观意见管理装置。
[0020]图2为一本发明实施例的距离模型训练方法的流程图。
[0021]图3为一本发明实施例的文章的主观意见管理方法的流程图。
[0022]图4为一本发明实施例的意见词组搜寻方法的流程图。
[0023]图5为一本发明另一实施例的文章的主观意见管理方法的流程图。
[0024]附图标记:
[0025]100?文章的主观意见管理装置;
[0026]110?储存单元;
[0027]111?文章语句;
[0028]112?属性词库;
[0029]113?距离模型;
[0030]120?处理单元;
[0031]S210、S220、S230、S240 ?步骤;
[0032]S310、S320、…、S360 ?步骤;
[0033]S410、S420 ?步骤;
[0034]S510、S520、...、S550 ?步骤。
【具体实施方式】
[0035]为使本发明的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附图示,详细说明如下。
[0036]图1显示的为本发明一实施例的文章的主观意见管理装置。如图1所示,依据本发明实施例的文章之主观意见管理装置100可以适用于一电子装置,如计算机。文章的主观意见管理装置100可以至少包括一储存单元110与一处理单元120。
[0037]储存单元110 可以包括至少一文章语句111、一属性词库112、与一距离模型113。值得注意的是,在一些实施例中,文章的主观意见管理装置100可以更包括一网络连接单元(图1中未显示),用以连接至一网络,如有线网络、电信网络、与无线网络等。藉由网络连接单元使文章的主观意见管理装置100可以具有一网络接取能力,以连接至网络以取得一网络文章。在一些实施例中,文章语句111可以为网络文章中的一语句。属性词库112中可以记录相应至少一目标关键词,如对象的欲评价的多个候选属性词。举例来说,目标关键词可以为一特定型号的手机,且相应此特定型号的手机的属性词可以包括电池、外型、功能、速度等。值得注意的是,在一些实施例中,储存单元110可以更包括一评价词库、一程度词库、与一否定词库。在一些实施例中,“知网”所发布的中文情感分析用词语集中的情感词子类别词语集和评价词子类别词语集可以做为评价词库的来源,而程度词子类别词语集可以做为程度词库的来源。在一些实施例中,王正豪2010年于相关文献中所归纳的否定词可以做为否定词库的来源。必须说明的是,前述词库来源仅为本案的例子,本案并不限定于此。值得注意的是,在一些实施例中,意见词组可以包括评价词、程度词与否定词。其中,前述评价词库、程度词库、与否定词库可以用来搜寻文章语句中的意见词组,相关细节将于后进行说明。距离模型113可以为由相关训练数据所训练出的文章语句中属性词与意见词组,尤其是意见词组中的评价词间距离的分类模型。处理单元120用以执行依据本案的文章的主观意见管理方法,其细节将于后进行说明。
[0038]图2显示的为本发明一实施例的距离模型训练方法的流程图。
[0039]首先,如步骤S210,取得多个文章语句。值得注意的是,在一些实施例中,可以以网络爬虫方式配合搜寻引擎来搜寻相应目标关键词的一定数量的网络文章。其中,距离模型为相应此目标关键词领域的训练结果。同时,可以分析每一文章的相关关键信息,如文章本文、人气指数、发文时间等等。取得网络文章之后,可以将这些文章进行标示,以确定对文章作者本身进行意见评论的文章,以将新闻、广告、转录等文章滤除。接着,将标示的文章进行语句层级的断句,其中具有主观意见评论的文章语句将会被取出。举例来说,擷取出的文章语句可以包括“就一直让我对智能手机的功能与实用性赞誉有加”、“还有下方的黑线部分就是一直被嫌弃的天线设计”、“运行速度更快”、“ iPhone4是”最好的智能手机、“电池很不经用”等。如步骤S220,搜寻文章语句中的属性词与意见词组。其中,属性词库中的候选属性词可以比对文章语句,从而找出文章语句中的属性词及属性词于文章语句中的位置。此夕卜,依据评价词库、程度词库、与否定词库搜寻文章语句中的意见词组及意见词组于文章语句中的位置。其中,意见词组可以包括评价词、程度词与否定词。举例来说,“功能”、“天线”、“速度”、“iPhone4”、“电池”可以为前述文章语句中的属性词。“赞誉有加”、“嫌弃”、“更快”、“最好”、“不经用”可以为前述文章语句中的意见词组。接着,如步骤S230,依据属性词于文章语句中的位置及意见词组于文章语句中的位置计算至少一特征值,并如步骤S240,将特征值输入距离模型以进行训练。必须说明的是,在一些实施例中,距离模型可以为一支持向量机(Support Vector Machine, SVM),且特征输入至支持向量机之前可以先进行正规化转换为特征值。值得注意的是,在一些实施例中,输入至支持向量机的特征可以包括属性词与评价词的距离,其中正规化后特征值的数值可以大于0。在一些实施例中,输入至支持向量机的特征可以包括评价词情感正反面,其中正规化后特征值的数值可以为1或-1。在一些实施例中,输入至支持向量机的特征可以在属性词位置相对于评价词的前后,其中正规化后特征值的数值可以为1或-1。在一些实施例中,输入至支持向量机的特征可以有无程度词,其中正规化后特征值的数值可以为1或-1。在一些实施例中,输入至支持向量机的特征可以为程度词分级,其中正规化后特征值的数值可以为0-6。在一些实施例中,输入至支持向量机的特征可以在程度词位置相对于评价词的前后,其中正规化后特征值的数值可以为1、0或-1。在一些实施例中,输入至支持向量机的特征可以为评价词与否定词的距离,其中正规化后特征值的数值可以大于等于0。在一些实施例中,输入至支持向量机的特征可以有无否定词,其中正规化后特征值的数值可以为1或-1。在一些实施例中,输入至支持向量机的特征可以在否定词位置相对于评价词的前后,其中正规化后特征值的数值可以为1、0或-1。在一些实施例中,输入至支持向量机的特征可以为否定词与评价词的距离,其中正规化后特征值的数值可以大于等于0。值得注意的是,在一些实施例中,支持向量机可以为产生距离模型的工具,其中,属性词与评价词的距离可以作为分类卷标,其它特征可以做为索引,而特征所相应的特征值作为数值,以输入至支持向量机来进行训练以产生主观意见语句的距离分类模式。必须说明的是,前述特征及其特征值皆为本案的例子,本案并不限定于此。任何足以依据文章语句中属性词与意见词组产生的特征皆可应用至本案中。
[0040]图3显示的为本发明一实施例的文章的主观意见管理方法的流程图。依据本发明实施例的文章的主观意见管理方法适用于一电子装置,如计算机。
[0041]首先,如步骤S310,取得一文章语句。值得注意的是,在一些实施例中,可以以网络爬虫方式取得一网络文章,接着,将文章进行语句层级的断句,以取出具有主观意见评论的文章语句。如步骤S320,依据属性词库搜寻文章语句中的一属性词。其中,属性词库中的候选属性词可以比对文章语句,从而找出文章语句中的属性词及属性词于文章语句中的位置。如步骤S330,将属性词输入距离模型,从而得到相应属性词的一标准距离值。提醒的是,距离模型可以依据多个训练语句产生,其中每一训练语句至少包括一训练属性词与一训练意见词组。其中,训练属性词与训练意见词组间的一距离被作为至少一特征值以输入距离模型。另外,在一些实施例中,特征可以包括评价词情感正反面、属性词位置相对于评价词的前后、有无程度词、程度词分级、程度词位置相对于评价词的前后、评价词与否定词之距离、有无否定词、否定词位置相对于评价词的前后、与/或否定词与评价词的距离等。其中,属性词与评价词的距离可以作为分类卷标,其它特征可以做为索引,而特征所相应的特征值作为数值,以输入至支持向量机来进行训练以产生主观意见语句的距离分类模式。类似地,前述特征及其特征值皆为本案的例子,本案并不限定于此。任何足以依据文章语句中属性词与意见词组产生的特征皆可应用至本案中。如步骤S340,由文章语句取得一意见词组。值得注意的是,在一些实施例中,可以依据评价词库、程度词库、与否定词库搜寻文章语句中的意见词组及意见词组于文章语句中的位置。注意的是,在一些实施例中,可以依据步骤S330得到的标准距离值来搜寻文章语句中的意见词组,以增加搜寻的效率。图4显示的是本发明一实施例的意见词组搜寻方法的流程图。如步骤S410,依据属性词于文章语句中的位置及标准距离值决定由文章语句搜寻意见词组的一搜寻起始位置。如步骤S420,依据此搜寻起始位置由文章语句中搜寻意见词组。类似地,如前所述,可以依据评价词库、程度词库、与否定词库搜寻文章语句中的意见词组。接着,如步骤S350,依据属性词于文章语句中的位置与意见词组于文章语句中的位置计算属性词与意见词组于文章语句中的一实际距离值。之后,如步骤S360,依据标准距离值与实际距离值判断文章语句是否为一非主观意见语句。注意的是,在一些实施例中,当实际距离值大于或小于标准距离值时,可以判定此文章语句为一非主观意见语句。值得注意的是,在一些实施例中,判断文章语句是否为一非 主观意见语句时可以设定一容许误差值。当实际距离值大于标准距离值加一容许误差值或小于标准距离值减一容许误差值时,可以判定文章语句为一非主观意见语句。
[0042]图5显示的为本发明另一实施例的文章的主观意见管理方法的流程图。依据本发明实施例的文章的主观意见管理方法适用于一电子装置,如计算机。
[0043]首先,如步骤S510,取得一文章语句。类似地,在一些实施例中,可以以网络爬虫方式取得一网络文章,接着,将文章进行语句层级的断句,以取出具有主观意见评论的文章语句。如步骤S520,依据属性词库搜寻文章语句中的一属性词。其中,属性词库中之候选属性词可以比对文章语句,从而找出文章语句中的属性词及属性词于文章语句中的位置。如步骤S530,将属性词输入距离模型,从而得到相应属性词的一标准距离值。类似地,距离模型可以系依据多个训练语句产生,其中每一训练语句至少包括一训练属性词与一训练意见词组。其中,训练属性词与训练意见词组间的一距离被作为至少一特征值以输入距离模型。另外,在一些实施例中,特征可以包括评价词情感正反面、属性词位置相对于评价词的前后、有无程度词、程度词分级、程度词位置相对于评价词的前后、评价词与否定词的距离、有无否定词、否定词位置相对于评价词的前后、与/或否定词与评价词的距离等。其中,属性词与评价词的距离可以作为分类卷标,其它特征可以做为索引,而特征所相应之特征值作为数值,以输入至支持向量机来进行训练以产生主观意见语句的距离分类模式。类似地,前述特征及其特征值皆为本案的例子,本案并不限定于此。任何足以依据文章语句中属性词与意见词组产生的特征皆可应用至本案中。如步骤S540,依据属性词于文章语句中的位置及标准距离值决定由文章语句搜寻意见词组的一搜寻起始位置。如步骤S550,依据此搜寻起始位置由文章语句中搜寻意见词组。类似地,如前所述,可以依据评价词库、程度词库、与否定词库搜寻文章语句中的意见词组。
[0044]因此,透过本案的文章之主观意见管理方法及其相关装置可以对于网络文章进行主观意见的识别作业,从而增加由文章中擷取主观意见的正确性,且/或增加由文章中搜寻意见词组的效率,并减少电子装置的系统资源浪费。
[0045]本发明的方法,或特定型态或其部份,可以以程序代码的型态存在。程序代码可以包含于实体媒体,如软盘、光盘片、硬盘、或是任何其它机器可读取(如计算机可读取)储存媒体,亦或不限于外在形式的计算机程序产品,其中,当程序代码被机器,如计算机加载且执行时,此机器变成用以参与本发明的装置。程序代码也可以透过一些传送媒体,如电线或电缆、光纤、或是任何传输型态进行传送,其中,当程序代码被机器,如计算机接收、加载且执行时,此机器变成用以参与本发明的装置。当在一般用途处理单元实作时,程序代码结合处理单元提供一操作类似于应用特定逻辑电路的独特装置。
[0046]虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明,任何熟悉此项技艺者,在不脱离本发明的精神和范围内,当可做些许更动与润饰,因此本发明的保护范围当视后附的申请专利范围所界定者为准。
【主权项】
1.一种文章的主观意见管理方法,适用于一电子装置,其特征在于,包括下列步骤: 取得一文章语句; 依据包括多个候选属性词的一属性词库搜寻该文章语句中的一属性词; 将该属性词输入一距离模型,从而得到相应该属性词的一标准距离值; 由该文章语句取得一意见词组; 计算该属性词与该意见词组于该文章语句中的一实际距离值;以及 依据该标准距离值与该实际距离值判断该文章语句是否为一非主观意见语句。2.根据权利要求1所述的文章的主观意见管理方法,其特征在于,还包括依据该属性词于该文章语句中的位置及该标准距离值决定由该文章语句搜寻该意见词组的一搜寻起始位置。3.根据权利要求1所述的文章的主观意见管理方法,其特征在于,其中该意见词组依据一评价词库、一程度词库、与一否定词库进行搜寻该文章语句所得到。4.根据权利要求1所述的文章的主观意见管理方法,其特征在于,其中当该实际距离值大于该标准距离值加一容许误差值,或小于该标准距离值减一容许误差值时,判定该文章语句为一非主观意见语句。5.根据权利要求1所述的文章的主观意见管理方法,其特征在于,其中该距离模型依据多个训练语句产生,其中每一该等训练语句至少包括一训练属性词与一训练意见词组,且该训练属性词与该训练意见词组间的一距离被作为一特征值以输入该距离模型。6.一种文章的主观意见管理方法,适用于一电子装置,其特征在于,包括下列步骤: 取得一文章语句; 依据包括多个候选属性词的一属性词库搜寻该文章语句中的一属性词; 将该属性词输入一距离模型,从而得到相应该属性词的一标准距离值;以及依据该属性词于该文章语句中的位置及该标准距离值决定由该文章语句搜寻一意见词组的一搜寻起始位置。7.一种文章的主观意见管理装置,其特征在于,至少包括: 一储存单兀,包括一文章语句、包括多个候选属性词的一属性词库、与一距离模型;以及 一处理单元,用以依据该属性词库搜寻该文章语句中的一属性词,将该属性词输入该距离模型,从而得到相应该属性词的一标准距离值,由该文章语句取得一意见词组,计算该属性词与该意见词组于该文章语句中的一实际距离值,且依据该标准距离值与该实际距离值判断该文章语句是否为一非主观意见语句。8.一种文章的主观意见管理装置,其特征在于,至少包括: 一储存单兀,包括一文章语句、包括多个候选属性词的一属性词库、与一距离模型;以及 一处理单元,用以依据该属性词库搜寻该文章语句中的一属性词,将该属性词输入该距离模型,从而得到相应该属性词的一标准距离值,且依据该属性词于该文章语句中的位置及该标准距离值决定由该文章语句搜寻一意见词组的一搜寻起始位置。9.一种计算机程序产品,用以被一机器加载且执行一文章的主观意见管理方法,其特征在于,该计算机程序产品包括: 一第一程序代码,用以依据包括多个候选属性词的一属性词库搜寻一文章语句中的一属性词; 一第二程序代码,用以将该属性词输入一距离模型,从而得到相应该属性词的一标准距离值; 一第三程序代码,用以由该文章语句取得一意见词组; 一第四程序代码,用以计算该属性词与该意见词组于该文章语句中的一实际距离值;以及 一第五程序代码,用以依据该标准距离值与该实际距离值判断该文章语句是否为一非主观意见语句。10.一种计算机程序产品,用以被一机器加载且执行一文章的主观意见管理方法,其特征在于,该计算机程序产品包括: 一第一程序代码,用以依据包括多个候选属性词的一属性词库搜寻一文章语句中的一属性词; 一第二程序代码,用以将该属性词输入一距离模型,从而得到相应该属性词的一标准距离值; 一第三程序代码,用以依据该属性词于该文章语句中的位置及该标准距离值决定由该文章语句搜寻一意见词组的一搜寻起始位置。
【专利摘要】一种文章的主观意见管理方法及其相关装置。首先,取得一文章语句;依据包括多个候选属性词之一的属性词库搜寻文章语句中的一属性词,并将属性词输入一距离模型,从而得到相应属性词的一标准距离值;接着,由文章语句取得一意见词组,且计算属性词与意见词组于文章语句中的一实际距离值;之后,依据标准距离值与实际距离值判断文章语句是否为一非主观意见语句。
【IPC分类】G06F17/27, G06F17/30
【公开号】CN105488037
【申请号】CN201410366116
【发明人】萧瑞祥, 曹金丰, 姜青山, 简之文
【申请人】萧瑞祥, 曹金丰, 姜青山, 简之文
【公开日】2016年4月13日
【申请日】2014年10月13日

最新回复(0)