可信度计分和报告的制作方法

xiaoxiao2020-7-22  2

【专利下载】Tel:18215660330

可信度计分和报告的制作方法
【专利摘要】一些实施例提供了方法、系统和计算机软件产品,用于产生以标准化得分的形式的有形资产,该标准化得分基于多个数据源和包括量化数据和定性数据的可信度数据来可量化地测量企业可信度。一些实施例产生以报告形式的分离的有形资产,根据该报告,每一个企业可以识别已经成功的实践、阻碍企业成功的实践、客户希望的改进、未来成长机会位于何处以及可以做出以改进企业未来成长和成功的改变,并且由此改进企业的可信度得分。
【专利说明】可信度计分和报告
【技术领域】
[0001]本发明有关用于使得企业能够确定、通信和管理它们的可信度的系统、方法和处理。
【背景技术】
[0002]个人和企业的信誉一直是很多个人和商业交易所依赖的可量化测量。当个人寻求住房抵押贷款、个人贷款、财产租赁和信用卡时,使用个人的信誉来确定条款(例如,数量和利率)。一些信用机构存在并且操作以确定个人的信誉,并且出售该信息给感兴趣的买家。信用机构通过监控个人花费习惯、支付习惯、净值等来推导个人的信誉。信用机构将这些和其他监控的行为转换为可量化信用分,该信用分已经被标准化到300-850点之间的范围,其中较高分表示更大的信誉而较低分表示更少的信誉。
[0003]企业信誉也是驱动很多企业交易的可量化测量。然而,推导企业信誉是远比推导个人信誉复杂的问题。对于个人,在身份(即,社会保险号)和个人之间存在一一对应。对于很多企业不是这样的。作为一些示例,企业可以在不同名字、子公司、分公司和特许代理下操作。此外,因为企业合并、企业退出、开业、拆分等,追踪企业资产、账户和交易更为复杂。因此,需要更多资源监控和分析企业信誉。诸如Dun&Bradstreet之类的公司操作以监控并推导企业信誉。企业信用报告可以从Dun&Bradstreet和其他这样的企业信用报告公司购买。这样信息的销售已经变为数十亿美元的产业。
[0004]虽然对于一些小型企业需求至关重要,但是企业信誉对于决定小型企业的日常成功通常无关紧要。例如,客户是否对已经从小型企业购买的服务或产品满意地离开在决定该客户是否将成为常客或是否将提供推荐以鼓励其他人访问该小型企业是有帮助的。足量的良好客户体验有益地增加小型企业的曝光,由此导致成长、成功和盈利的更好机会。相反,足量的恶劣客户体验可以毁灭小型企业。小型企业的成功因而更多地基于所生成的善意和良好口碑而不是企业信誉。日常的、影响小型企业运营的善意、口碑、满足和其他这样的标准在以下称为可信度。
[0005]目前没有小型企业可以从其精确而容易地查明它们可信度的服务。一些小型企业进行调查。其他小型企业寻求各种介质来拼凑它们的可信度。作为一些示例,这些介质包括报纸和杂志评论、发布在诸如WWW.yelp, com和www.citysearch.com的因特网网站上的客户评论以及经由电话向优质经营局登记的投诉。对于以此方式拼凑其可信度的小型企业,这是非常费时、不精确和困难的。小型企业因而不能理解或意识到影响它们可信度的因素,作为结果,不能直接地解决问题。
[0006]因此,需要横跨多个源和介质监控企业的可信度并且提供企业可信度的精确估计。进一步需要量化可信度信息以提供企业信誉的易于理解和容易可用的查看,使得可以识别可信度而不必通读多个文本评论和意见。还需要横跨全部企业标准化可信度,使得推导可信度而不受偏见或可信度数据的不一致解读的影响。此外,需要提供企业可以改进其可信度的工具、资源和信息。
【发明内容】

[0007]本发明的目的是定义用于生成以标准化得分形式的有形资产的方法、系统和计算机软件产品,该标准化得分基于各种数据源和包括量化数据和定性数据的可信度数据来可量化地测量企业可信度。进一步的目的是结合可信度数据利用可信度得分来提供以报告形式的、分离的有形资产,每一个企业可以从该报告识别已经成功的实践、妨碍企业成功的实践、客户希望的改进、未来成长机会位于何处,以及可以做出以改进企业的未来成长和成功的改变,并且由此改进企业的可信度得分。
[0008]因此,一些实施例提供可信度计分和报告系统以及方法。可信度计分和报告系统包括主数据管理器、数据库、报告引擎和接口端口。主数据管理器从多个数据源汇聚定性和可量化可信度数据,并且所汇聚的数据与该数据相关的恰当的企业实体匹配。报告引擎对定性可信度数据进行自然语言处理,以将定性可信度数据转换为可量化地表示定性可信度数据的数字测量。随后将量化测量和可信度数据过滤以移除异常值,在希望的地方调整权重,并且规格化(normalize)量化测量。对于特定的企业实体,报告引擎将有关特定企业实体的量化测量汇编为可信度得分。在一些实施例中,生成可信度报告以用相关的可信度数据来详述可信度得分的推导。在一些实施例中,可信度报告还建议企业可以改进其可信度得分的行动。使用接口端口,在还参与和与可信度计分和报告系统交互的同时,企业和个人可以购买和查看可信度得分和/或可信度报告。具体地,用户可以提交可信度数据并且校正在可信度数据和错误企业实体之间的失配。
【专利附图】

【附图说明】
[0009]为了实现本发明的本质的更好理解,仅以示例的方式,现在将参考附图描述可信度计分和报告系统以及方法的优选实施例,其中:
[0010]图1呈现根据一些实施例由可信度计分和报告系统进行以生成可信度得分和可信度报告的处理。
[0011]图2呈现一些实施例的可信度计分和报告系统的一些组件。
[0012]图3呈现根据一些实施例的主数据管理器的组件。
[0013]图4呈现由一些实施例的主数据管理器进行的匹配处理的流程图。
[0014]图5图示用于存储可信度计分信息的示例性数据结构。
[0015]图6图示根据一些实施例的用于生成可信度得分和可信度报告的报告引擎的一些组件。
[0016]图7呈现根据一些实施例的、用于识别文本量化符和修饰对象之间的关系的由NLP引擎进行的处理。
[0017]图8图示根据一些实施例识别文本量化符和修饰对象对。
[0018]图9呈现根据一些实施例的用于从定性可信度数据推导量化测量的处理。
[0019]图10图示根据一些实施例的将已识别的文本量化符和修饰对象对映射到数值范围中的特定值。
[0020]图11呈现根据一些实施例的由计分过滤器进行的以过滤量化测量和可信度数据的处理。[0021]图12图示根据一些实施例的在接口端口内的可信度报告窗口。
[0022]图13呈现根据一些实施例的替代可信度报告查看器。
[0023]图14图示利用其实现一些实施例的计算机系统。
【具体实施方式】
[0024]在以下详细描述中,阐述和描述可信度计分和报告系统以及方法的大量细节、示例和实施例。本领域技术人员鉴于本描述将明白,系统和方法不限于所阐述的实施例,并且系统和方法可以不具有所讨论的某些具体细节和示例地实践。同样,参考图示可以实践本发明的具体实施例的附图。要明白,可以使用其他实施例并且可以做出结构性的改变而不背离这里描述的实施例的范围。
[0025]1.概述
[0026]对于小型企业,企业可信度是无价资产,其可以用来识别哪个企业实践已经成功、妨碍企业成功的实践、客户希望的改进、未来成长机会位于何处以及可以做出以改进企业的未来成长和成功的改变。今天,企业可信度作为使用不同分级系统而选择性地测定(gauge)有关企业的各种因素的定性数据和非标准化量化测量而存在。然而,可信度数据的定性和非标准化本质导致模糊资产,对于该模糊资产,不存在基线测量,无法做出交叉对t匕,并且针对该模糊资产个人偏见和信息的缺乏破坏了信息的相关性。因此,作为结果,企业,特别是小型企业,无法有效地确定或评估它们在市场中的可信度以及未来的战略决策。
[0027]为了克服这些和其他问题并且提供可量化地测量企业可信度的有形资产,一些实施例提供可信度计分和报告系统。可信度计分和报告系统生成标准化的可信度得分,其基于从多个数据源汇聚的数据可量化地测量企业可信度并且将可信度呈现为易于识别的得分,使用相同的系统和方法可以将该易于识别的得分与竞争者的可信度得分比较地分析。在一些实施例中,可信度计分和报告系统生成对每一个企业详述可信度得分的推导的可信度报告。更具体地,可信度报告是单独的工具,根据其特定企业可以识别已经成功的实践、妨碍企业成功的实践、客户希望的改进、未来成长机会位于何处以及可以做出以改进企业的未来成长和成功的改变。
[0028]图1呈现根据一些实施例的由可信度计分和报告系统进行以生成可信度得分和可信度报告的处理100。该处理以从多个数据源汇聚(在110)定性和量化可信度数据开始。这包括通过合作伙伴反馈、文件和人工输入来从各种在线和离线的数据源搜集数据。处理将所汇聚的数据匹配(在120)到恰当的企业。分析(在130)对每一个企业的所匹配数据以从量化可信度数据识别定性可信度数据。处理对定性可信度数据进行自然语言处理(在140)以将定性可信度数据转换为量化测量。对于定性可信度数据和其他所汇聚的量化可信度数据推导的可量化测量随后经历计分过滤器,该计分过滤器对异常和偏见的可信度数据修改(在150)量化测量并且规格化量化测量。处理通过汇编所剩余的已规格化量化测量产生(在160)可信度得分。
[0029]可信度得分精确地表示给定企业的可信度,因为(i)可信度得分使用来自不同数据源的数据计算并且因此不取决于任何单一数据源或不成比例地受任何单一数据源影响,
(ii)使用从定性可信度数据的解译消除个人偏见的算法来处理可信度数据,(iii)使用消除偏见可信度数据同时规格化不同的量化测量的过滤器处理可信度数据,并且(iv)通过使用相同的方法和一致的算法集合来对多个企业产生可信度得分,所产生的可信度得分被标准化并且可以经历比较分析,以便确定如何相对于其他竞争者或企业的可信度得分地分级一个企业的可信度。作为结果,可以将可信度得分作为有形资产出售给对明白其自身的可信度感兴趣的那些企业。
[0030]在一些实施例中,处理对于对明白其可信度得分的推导和如何改进其可信度得分感兴趣的企业还生成(在170)可信度报告作为分离的有形资产。在一些实施例中,可信度报告呈现相关可信度数据以识别可信度得分的推导。在一些实施例中,可信度报告还建议企业可以改进其可信度得分的行动。
[0031 ] 一些实施例提供了接口端口,从该接口端口企业和个人可以购买和查看可信度得分和/或可信度报告。使用这些资产(即,可信度得分和可信度报告),企业可以制定精确和有目的的企业目标以改进其可信度,并且更重要的是,改进其未来成长和成功的可能性。个人和企业还将具有对其他企业的可信度得分的访问。可信度得分可以以此方式使用以指引客户到可信的企业并且引导客户远离提供恶劣客户体验的企业。此外,可信度得分可以用来识别特定企业对于未来企业交易将希望与之合作或形成关系的企业。因此,对于企业存在改进其可信度得分的激励,因为客户和合作伙伴在确定是否与特定企业进行业务时可能查看相同的信息。
[0032]端口进一步用作企业可以直接参与可信度计分处理的工具。具体地,使用接口端口,企业可以提交除此以外不能从数据源获得的相关的可信度数据,并且可以校正失配可信度数据。
[0033]I1.可信度计分和报告系统
[0034]图2呈现一些实施例的可信度计分和报告系统205的组件。可信度计分和报告系统205包括⑴主数据管理器210,⑵数据库220,(3)报告引擎230,以及(4)接口端口240。鉴于本描述,本领域技术人员将明白,除了已列举的图2的组件或取代已列举的图2的组件,可信度计分和报告系统205可以包括其他组件。图2的组件210-240不意图为穷尽的列举,而是作为用于描述性和呈现目的的组件的示例性集合。整体系统205被设计为具有模块插件组件,由此新组件或增强的功能可以合并于整体系统205中而不必修改现有组件或功能。
[0035]A.主数据管理器
[0036]目前,企业可以试图通过分析特定数据源处的可信度数据来看看其他人关于该企业在说什么以确定其可信度。以此方式获得的可信度在很多方面是有缺陷的。首先,从一个或少数数据源推导的可信度是有缺陷的,因为从这样的少数数据源不能获得可信度的足够采样。例如,当特定企业每天服务数千个人时,关于特定企业仅包括两个负面评论的站点不精确地描绘该特定企业的可信度。此外,一个或多个数据源可能具有偏见数据或过期数据,它们不成比例地影响企业的可信度。第二,从一个或少数数据源推导的可信度是有缺陷的,因为每一个数据源可以包含企业的特定方面的信息。因此,从这样的少数源推导的可信度将考虑企业整体,并且可以因此是误导的。第三,可信度在未比较地应用于全部企业、竞争者之间或企业的特定领域时是有缺陷的。例如,挑剔的评论者可能将第一企业识别为“差的表现”,而将第二企业识别为“非常差的表现”。当分开查看时,每一个企业将以差可信度地分类。然而,利用比较分析,第一企业可以以比第二企业更好的可信度地分类。第四,来自不同评论者或数据源的可信度数据不是标准化的,这使得可信度数据存在不同解译和个人偏见的可能性。例如,难以确定对同一企业来自WWW.yelp, com的在5分中分级为3分等同于在www.zagat.com上在30分中分级为26。类似地,声明第一企业的服务为“良好”的评论可以由第一企业解译为成功或正面评论,而对于第二企业的“良好”的同一评论可以由第二企业解译为平均评论,由此服务必须改进。
[0037]为了解决在推导企业可信度中的这些和其他问题,一些实施例提供主数据管理器210以与多个数据源250对接并且以定期和连续的间隔从这些源250自动地获取相关可信度数据。这样做时,主数据管理器210移除不充足样本大小的、过期数据和缺乏比较数据导致的缺陷。
[0038]图3图示根据一些实施例的主数据管理器210的组件。主数据管理器210包括各种插件接口模块310(包括插件320)、匹配处理330和存储匹配算法的集合的数据库340。通过图2的接口端口 240提供对主数据管理器210的访问。
[0039]主数据管理器210通过插件接口模块310 (包括320)并且通过接口端口 240汇聚来自各种数据源的数据。每一个插件接口模块310配置为自动地与一个或多个数据源对接,以便从那些数据源提取可信度数据。在一些实施例中,利用通信协议、脚本和账户信息来配置每一个插件接口模块310以访问一个或多个数据源。另外,可以利用数据爬行功能配置每一个插件接口模块310以从一个或多个数据源提取可信度数据。特定插件接口模块浏览特定数据源以便定位可信度数据。在一个图示的示例中,主数据管理器210包括到网站WWW.yelp, com的特定插件接口模块320。此接口模块320可以利用账户信息配置以访问画.yelp, com网站并且可以利用访问数据爬虫脚本配置以浏览该网站并且从该网站提取企业可信度数据。在一些实施例中,与数据源建立合作伙伴协议,由此插件接口模块与数据源的一个或多个数据库直接对接以提取可信度数据。
[0040]所提取的可信度数据包括关于一个或多个企业的定性数据和量化数据。作为一些示例,定性数据包括客户和专业评论数据、博客内容以及社交媒体内容。可以从其获取关于各种企业的定性数据的一些数据源是因特网网站,诸如WWW.yelp.com、www.citysearch.com、www.zagat.com、www.gayot.com、www.facebook.com 以及 www.twitter, com。因此,主数据管理器210的一些实施例包括不同插件接口模块310以从那些站点的每一个提取可信度数据。量化数据包括企业信用、其他企业信息(例如,地址、电话号码、网站等)以及使用一些标准、分级或评级来量化测量的可信度数据。一些量化数据源包括Dun&Bradstreet和优质经营局(BBB)。一些定性数据源还可以包括量化可信度数据。例如,www.yelp, com包括以文本评论和意见形式的定性数据以及以O到5分评级系统形式的量化数据。主数据管理器210的一些实施例包括不同插件接口模块310以从量化数据源提取量化数据。
[0041]插件接口模块310允许来自新数据源的数据被集成到主数据管理器210中而不改变任何其他插件接口模块310的功能。此模块化允许系统在希望额外或新数据源时调整。此外,插件接口模块310允许可信度数据自动且连续地从这些各种数据源获取。在一些实施例中,所汇聚的数据包括复制的文本、文件、反馈、数据库记录和其他数字内容。
[0042]定性数据和量化数据还可以从包括印刷出版物(例如,报纸或杂志文章)、电视评论或电台评论的其他介质汇聚。在一些实施例中,数据源访问接口端口 240以便向主数据管理器210直接提供它们的数据。例如,相关杂志文章可以由出版方通过接口端口 240上传或扫描和提交。出版物和记录还可以通过邮件提交。对于出版方提交这样的信息的激励在于这样做可以增加出版方的曝光。具体地,在所提交的出版物被包括在一些实施例的所生成的可信度报告中时曝光可以增加。
[0043]可信度数据还可以由企业直接提交给主数据管理器210。这对于不为人知或被各种数据源忽视的小型企业是有益的。具体地,可信度数据可以由企业所有人通过接口端口240提交并且一旦该数据变得可用,该数据就可以合并到可信度得分和可信度报告中。以该方式,企业可以直接参与可信度数据汇聚处理并且不需要依赖其他数据源提供关于该企业的可信度数据到主数据管理器210。例如,洛杉矶健康署以分级的A、B和C评级系统向餐馆发布健康评级。一旦餐馆接收到新的评级,餐馆企业所有人可以通过接口端口 240向主数据管理器210提交新的评级而不等待第三方数据源这样做。可以经由网页完成提交,在该网页上提交方识别他/她自己并且输入作为文本的数据或者提交作为文件的数据。
[0044]主数据管理器210利用识别与数据有关的企业的一个或多个识别符来标记使用插件模块310汇聚的数据和通过接口端口 240提交的数据。在一些实施例中,作为一些示例,识别符包括一个或多个名字、语音名字、地址、唯一的识别符、电话号码、电邮地址以及统一资源定位符(URL)。对于自动汇聚的可信度数据,插件模块310利用在数据源与可信度数据关联的任何可用识别符来标记所汇聚的可信度数据。例如,WWW.yelp, com site在包括关于企业的联系信息(例如,名字、地址、电话号码、网站等)的页面上对特定企业将评论和分级(即,可信度数据)分组。对于通过接口端口 240提交的可信度数据,将首先要求提交方创建用户账户,该用户账户包括由该方发送的、对可信度数据进行标记的各种识别符。
[0045]在一些情况下,所标记的识别符不唯一地或正确地识别数据与之关联的企业。当企业在多个不同名字、电话号码、地址、URL等下操作时这可能发生。因此,主数据管理器210包括匹配处理330,该匹配处理330使用来自匹配算法数据库340的匹配算法的集合将所汇聚的数据匹配到恰当的企业。为了进一步确保数据匹配的完整性和质量,一些实施例允许企业所有人和社区参与到匹配处理330。
[0046]图4呈现由一些实施例的主数据管理器进行的匹配处理330的流程图。匹配处理330涉及所标记的可信度数据410、自动匹配处理420、第一数据库430、第二数据库440、接口端口 240、所有人470、用户社区480、校正处理490和匹配算法数据库340.。
[0047]匹配处理330在所标记的可信度数据410被传递给自动匹配处理420时开始。自动匹配处理420使用来自匹配算法数据库340的各种匹配算法来将可信度数据410与恰当的企业匹配。具体地,将可信度数据410与唯一地识别恰当企业的识别符关联。当完成匹配时,使用可信度数据与之匹配的企业的唯一识别符,将可信度数据存储到第一数据库430。在一些实施例中,第一数据库430是图2的数据库220。在一些实施例中,唯一识别符称为可信度识别符。如以下将描述的,可信度识别符可以是识别企业的一个或多个数值或字母值。
[0048]除了将数据匹配到恰当的企业之外,自动匹配处理420还可以进行名字标准化和验证、地址标准化和验证、语音名字匹配、可配置匹配权重以及多遍错误悬疑减少(mult1-pass error suspense reduction)。在一些实施例中,如果怀疑所有权、合作关系或其他关系,则自动匹配处理420执行将多个企业列表彼此匹配的其他匹配算法。例如,自动匹配处理420确定纽约的Acme商店是否与费城的Acme商店是同一企业、单词Acme拼写中的变化(例如,“Acme”、“Acmi ”、“Akme”、“ACkme”等)是否涉及同一企业或不同企业、或者“Acme商店”、“Acme公司”和“Acme集团”是否涉及同一企业或不同企业。当查明具有数字存在(即,在线存在)和实际存在两者的企业的可信度时,这样的匹配是特别重要的。例如,离线信用数据可能与具有“Acme公司”名字的企业实体关联,而该同一企业可能具有与具有“Acme披萨店”名字关联的在线可信度数据。
[0049]然而,当标记内不存在充足的信息以找到精确或合适匹配时,匹配处理330可能不能自动地匹配某些可信度数据到企业。将未匹配可信度数据存储到第二数据库440。第二数据库440是暂存未匹配可信度数据直到丢弃、由所有人470人工匹配或由社区480中的用户人工匹配该数据的临时存储区域。
[0050]图2的接口端口 240允许企业所有人470和用户的社区480变得参与匹配处理330。在一些实施例中,接口端口 240是企业所有人470通过其获得到匹配处理330和数据库430及440的访问的网站。通过该接口端口 240,企业所有人470可以声明它们的账户并且之后控制匹配错误、检测身份诈骗、并且监控它们的可信度得分的完整性。具体地,所有人470可以识别第一数据库430中的匹配错误并且确认、拒绝或提出已经被暂存到第二数据库440中的可信度数据的匹配。通过接口端口 240,企业所有人470可以实时地解决可信度问题。在一些实施例中,企业所有人470包括在可信度计分和报告系统中准许访问企业所有人账户的机构或企业的代表。
[0051]在一些实施例中,接口端口 240还通过插件向用户提供对匹配处理330的访问。插件可以在发现企业可信度数据的任何网站上利用。在一些实施例中,插件是用于希望将可信度数据供应者的后端无缝地集成到可信度计分和报告系统的外部网站。以该方式,企业可以自己拥有并且管理可信度数据的评论以及该企业的网站利用插件作为其企业评论提供者。这促进了跨越所有参与的第三方网站的可信度的单一源的创建。因此,无论社区中的用户480还是企业所有人470发现错误匹配或发布可信度数据,它们都可以通过插件与该数据交互。这允许社区480交互,由此其他用户帮助改进匹配结果。这样做,企业评论数据被转换为所有人和社区中的用户的交互连接。
[0052]当对评论标记不当匹配或提出新匹配时,将其传递给校正处理490用于验证。在一些实施例中,校正处理490包括自动校正验证和人工校正验证。自动校正验证可以通过将所标记的可信度数据与已知企业账户信息或已经与特定企业匹配的其他可信度数据比较来进行。认可的校正进入第一数据库430。不认可的校正被忽视。
[0053]在一些实施例中,可以基于已认可的校正,做出调整以改进匹配算法数据库340中匹配算法的匹配精度。以该方式,匹配处理330从在先的错误学习,并且以改进未来匹配的精度的方式对算法做出改变。
[0054]B.数据库
[0055]参考回图2,数据库220使用分配给每一个特定企业的唯一识别符,存储与该企业的可信度计分有关的各种信息。图5图示用于存储可信度计分信息的示例性数据结构510。数据结构510包括唯一识别符515、联系要素520、可信度要素530以及实体要素540。
[0056]照样,唯一识别符515唯一地识别每一个企业实体。联系要素520存储识别企业并且用来匹配所汇聚和所标记的可信度数据到特定企业的一个或多个名字、地址、识别符、电话号码、电邮地址以及URL。可信度字段530存储所汇聚和所匹配的定性和量化可信度数据。因此,可信度字段530可以存储链接到数据结构510的唯一识别符515的所生成的可信度得分以及可信度报告。实体要素540指定企业信息、个人信息以及关系信息。企业信息可以包括企业信用、财务信息、供应商、承包商以及由诸如Dun&Bradstreet之类的公司提供的其他信息。个人信息识别与企业关联的个人。关系信息识别企业中个人的角色以及各种商业组织或结构。个人信息可以被包括以协助匹配处理,并且作为影响可信度得分的因素。例如,具有形成成功的企业的已证明记录的主管可以提高特定企业的可信度得分,而无经验的主管或已经导致失败企业的主管可能不利地影响企业的可信度得分。
[0057]逻辑上,数据库220可以包括图4的数据库430和440以及在图中和此文档中提及的其他数据库。物理上,数据库220可以包括位于单个物理地点或横跨各种地理区域而分布的一个或多个物理存储服务器。存储服务器包括一个或多个处理器、用于联网通信的网络接口以及易失性和/或非易失性计算机可读存储介质,诸如随机存取存储器(RAM)、固态盘驱动器或磁盘驱动器。
[0058]C.报告引擎
[0059]报告引擎230访问数据库220以获得可信度数据,根据该可信度数据对各种企业推导可信度得分和可信度报告。在一些实施例中,报告引擎230更新之前生成的得分并在企业的可信度得分和报告已经在之前生成并且可信度数据已经改变或新可信度数据在数据库220中可用时报告。图6图示根据一些实施例的用于生成可信度得分和可信度报告的报告引擎230的一些组件。报告引擎230包括数据分析器610、自然语言处理(NLP)引擎620、计分引擎625、计分过滤器630、可信度计分汇聚器640以及报告生成器650.。在一些实施例中,报告引擎230及其各种组件610-650实现为执行计算机指令的集合的脚本或机器实现的处理的集合。
[0060]1.数据分析器
[0061]数据分析器610与数据库220对接,以便获得一个或多个企业的所汇聚的可信度数据。如上所述,使用唯一识别符将特定企业的可信度数据存储到数据库220。因此,向数据分析器610提供将对其生成可信度得分和报告的一个唯一识别符或唯一识别符列表。该唯一识别符列表可以由系统管理员提供或可以基于通过接口端口提交的请求动态生成。数据分析器610使用唯一识别符以从数据库220获取关联的数据。
[0062]一旦特定企业的可信度数据从数据库220获取到,数据分析器610就分析该可信度数据以从量化可信度数据识别定性可信度数据。如上所述,可信度数据可以包括定性和量化可信度数据两者。在这样的情况下,数据分析器610将可信度数据分段以分离量化数据部分和定性数据部分。
[0063]数据分析器610使用模式匹配技术和字符分析以区分量化可信度数据和定性可信度数据。定性可信度数据包括不以量化术语描述、不数值测量的数据或者是主观的数据。从诸如WWW.yelp, com和www.citysearch.com之类的站点获得的基于文本的评论和意见是定性数据的示例。因此,数据分析器610识别这样的基于文本的评论并且将它们分类为定性可信度数据。数据分析器610将所识别的定性数据传递给NLP引擎620以及计分引擎625用于转换为量化测量。
[0064]相反,量化数据包括以量化术语描述的数据,是可量化地测量的,或者是客观的。限制在界定范围(0-5星)的企业信用得分、评级或分级是量化数据的示例。因此,数据分析器610识别这些得分、评级和分级作为量化可信度数据。数据分析器610将所识别的量化数据传递到计分过滤器630。
[0065]i1.NLP 引擎
[0066]在一些实施例中,NLP引擎620对定性可信度数据进行关系识别。具体地,NLP引擎620识别(i)文本量化符和(ii)修饰对象之间的关系。
[0067]在一些实施例中,文本量化符包括量化测量可以从其推导的形容词或其他单词、词组和符号。这包括意味着某种程度的正面或负面的单词、词组或符号。即使具有不同程度,以下单词集合意味着类似含义:“良好”、“好”、“很好”、“极好”以及“有史以来最好”。文本量化符还包括不同程度等同物可能或不可能存在的形容词,诸如:“有用”、“博学”、“令人尊敬”、“客气的”、“昂贵的”、“坏的”和“疏忽的”。以上列举是文本量化符的示例性集合,并且不意图为穷尽的列举。文本量化符的完全列举存储到由NLP引擎620访问的数据库。以该方式,NLP引擎620可以根据需要调整以识别新的和不同的文本量化符。
[0068]在一些实施例中,修饰对象包括关于企业的某个方面并且由一个或多个文本量化符修饰的单词、词组或符号。换言之,修饰对象向文本量化符提供上下文。例如,陈述“我在Acme商店的整体体验是好的,但是服务不好”包含两个文本量化符“好的”和“不好”以及两个修饰对象“整体体验”和“服务”。由文本量化符“好的”修饰第一修饰对象“整体体验”。由文本量化符“不好”修饰第二修饰对象“服务”。在一些实施例中,修饰对象的完整列举存储在由NLP引擎访问的数据库中。另外,语法规则和其他修饰对象识别规则可以存储到数据库并且由NLP引擎使用以识别由各种文本量化符修饰的对象。
[0069]图7呈现根据一些实施例的、用于识别文本量化符和修饰对象之间的关系的由NLP引擎620进行的处理700。处理700在NLP引擎620从数据分析器610接收到(在710)定性可信度数据时开始。处理进行可信度数据的初始历遍(pass through)以识别(在720)其中的文本量化符。在第二历遍中,处理试图对每一个文本量化符识别(在730)修饰对象。未匹配文本量化符或匹配与企业的某个方面无关的对象的文本量化符被丢弃。将已匹配对传递(在740)给计分引擎625用于转换到量化测量,并且处理700结束。应当显然的是,其他自然语言处理可以对定性可信度数据进行以便促进从这样数据的推导量化测量,并且其他这样的处理可以被NLP引擎620利用。
[0070]图8图示根据一些实施例识别文本量化符和修饰对象对。该图图示以企业评论的形式的定性可信度数据810。评论采用文本描述企业的各种用户体验。当传递给NLP引擎620用于处理时,识别可信度数据的文本量化符和修饰对象。在此图中,使用矩形框(例如,820)指示文本量化符而利用圆圈指示修饰对象(例如,830)。
[0071]ii1.计分引擎
[0072]NLP引擎620将文本量化符和修饰对象的匹配对传递给计分引擎625。计分引擎625将每一对转换为量化测量。图9呈现根据一些实施例的用于从定性可信度数据推导量化测量的处理900。处理900在计分引擎625从NLP引擎620接收具有文本量化符和修饰对象的已识别对的定性可信度数据时开始。
[0073]处理选择(在910)首先识别的文本量化符和修饰对象对。基于所选择对的修饰对象,处理识别(在920)值的量化范围。在一些实施例中,值的范围确定归因于特定修饰对象的权重。一些修饰对象比其他修饰对象的权重更重,以便具有对可信度得分更大的影响。例如,根据陈述“我在Acme商店的整体体验是好的,但是服务不好”,修饰对象“整体体验”比修饰对象“服务”的权重更重,因为“服务”涉及企业的可信度的一个方面,而“整体体验”涉及作为整体的企业可信度。在一些实施例中,处理使用修饰对象作为索引或散列到识别与该修饰对象关联的对应值的范围的表格。
[0074]接着,处理将根据已识别对的文本量化符映射(在930)到值的识别范围中的特定值,以推导量化测量。在一些实施例中,结合在文本量化符和值的范围作为输入提供时输出特定值的转换公式进行映射。在一些其他实施例中,文本量化符映射到根据由修饰对象识别的值的范围而随后调整的第一值。例如,文本量化符“良好”、“好”、“很好”、“极好”以及“有史以来最好”分别映射到0-10的未调整范围中的6、7、8、9和10。与文本量化符“极好”成对的修饰对象可以识别分布在0-100的值的范围。因此,与文本量化符关联的值(即,8)根据识别范围调整到80的值。
[0075]处理确定(在940)是否操作与可信度数据关联的其他识别文本量化符和修饰对象对。如果是,则处理回到步骤910并且选择下一对。否则,处理与关联可信度数据一起将映射值传递(在950)到计分过滤器630并且处理900结束。
[0076]图10图示根据一些实施例将已匹配的文本量化符和修饰对象对映射到值的范围中的特定值。如所示,对于每一个已识别的文本量化符和修饰对象对,识别值的范围(例如,1010和1020)以表示该修饰对象对于整体可信度得分的相对权重或重要性。例如,值的范围1010分布在0-20,而值的范围1020分布在0-3。这指示与值的范围1010关联的修饰对象在可信度得分中比与值的范围1020关联的修饰对象的权重更重。随后将对每一个已识别对的文本量化符映射到值的范围(例如,1030和1040)中的特定值。鉴于本描述,应当显然的是,呈现的范围用于示例性目的,并且计分引擎625可以对不同修饰对象利用不同范围。
[0077]在一些实施例中,报告引擎230监控量化数据和定性数据之间的关系以促进自学和适应性计分。可信度数据源经常提供在某个量化范围(例如,0-5星)上评级或分级企业的量化得分以及评价或解释量化得分的定性数据的关联集合。基于量化数据和定性数据之间的关系,一些实施例的报告引擎230适应性地调整如何从定性数据推导量化测量。具体地,报告引擎230调整(i)向在定性数据中找到的特定修饰对象提供的值的范围以及(ii)在与修饰对象关联的特定文本量化符的值的范围中选择的值。例如,当5分中得5分的量化得分在75%的时间出现定性数据包括文本量化符“良好”的情况,并且5分中得3分的量化得分在80%的时间出现定性数据包括文本量化符“比较好”的情况时,则报告引擎230从这些关系学习以增加“良好”文本量化符的量化值并减少“比较好”文本量化符的量化值。
[0078]在一些实施例中,报告引擎230监控定性数据中各种文本量化符和修饰对象之间的关系以促进自学和适应性计分。具体地,报告引擎230基于修饰对象在定性数据中出现的频率来调整与特定修饰对象关联的值的范围。类似地,报告引擎230基于文本量化符在定性数据中出现的频率来调整与特定文本量化符关联的所选择值。这些频率测量可以基于单个企业、基于企业子类(例如,快餐店、精品餐厅和家庭餐厅)、或基于企业领域(例如,餐厅、服装店和电子商店)做出。例如,当词组“食物是”在75%与特定企业关联的用户评论中出现并且词组“服务员是”在10%与特定企业关联的用户评论中出现时,则报告引擎230可以向与修饰对象“食物”关联的值的范围提供比与修饰对象“服务员”关联的值的范围提供更大的权重。以该方式,从定性数据推导的可信度得分可以更好地解释用户经常评价的因素,同时减少其他极少提及的因素对可信度得分的影响。
[0079]总而言之,可以基于在与定性数据关联的量化数据之间的对应性并且基于特定文本量化符或修饰对象参考特定企业、企业子类或企业领域使用的相对频率,适应性地调整对特定修正对象的值的范围和从对关联文本量化符的值的范围的所选择值。
[0080]iv.计分过滤器
[0081]在一些实施例中,计分过滤器630在产生可信度得分之前过滤量化测量和可信度数据。在一些实施例中,计分过滤器630包括可执行处理,该可执行处理合并不同模式匹配标准以识别哪个量化测量或哪个可信度数据以基于何种条件过滤。每一个计分过滤器可以特定于一个或多个类型的可信度数据。这样,计分过滤器基于可信度数据的类型而选择性地应用于可信度数据。
[0082]图11呈现根据一些实施例的由计分过滤器630进行以过滤量化测量和可信度数据的处理1100。处理通过使用过滤器的集合来移除(在1110)从离群、异常和偏见的可信度数据获得的量化测量而开始。这包括移除源自于处于争论中的与企业无关的可信度数据的量化测量。例如,当设置装备与商店所供应的商品和服务无关时,移除源自于陈述关于设置从商店购买的装备的难度的各种抱怨的可信度数据的量化测量。其他过滤器可以定义为结合关于提交评论方的信息来分析可信度数据。例如,过滤器可以定义为分析与可信度数据关联的人口统计信息。这在企业向特定客户发展并且提交评论方未落入客户的分类时是有用的。因此,计分过滤器可以定义为移除这样的量化测量。来自匿名评论者或涉及极端情况或非常规事件的可信度数据的其他量化测量也可以移除。
[0083]接着,处理对于剩余可信度数据使用过滤器的集合来调整(在1120)量化测量中的不一致。例如,不同评论者每一个都可能给特定企业5分中的3分,但是在关联意见中,第一评论者可能提供正面反馈而第二评论者可能提供负面反馈。这这样的情况下,过滤器可以定义为基于正面反馈而增加由第一评论者提供的量化测量并基于负面反馈而减少由第二评论者提供的量化测量。
[0084]处理对于剩余可信度数据使用过滤器的集合来规格化(在1130)量化测量中的不一致。规格化包括调整量化测量的范围。在一些实施例中,用于由计分引擎625推导的定性可信度数据的量化测量将不需要规格化。然而,源自于量化可信度数据的量化测量可能需要规格化。例如,从第一数据源(例如,www.yelp, com)获得的量化可信度数据的量化测量可能包括以5星评级而从第二数据源(例如,www.zagat.com)获得的量化可信度数据的量化测量可能包括0-30点的点范围。在一些实施例中,处理将这些量化测量规格化为统一值的范围(例如,0-100)。在一些其他实施例中,处理用不成比例的权重规格化这些量化测量,使得向从更信任的数据源的可信度数据获得的量化测量提供比从较少信任的数据源的可信度数据获得的量化测量更多的权重。还使用不成比例的权重来限制过时可信度数据对可信度得分的影响。具体地,来自较早可信度数据的量化测量以比来自较新可信度数据的量化测量更少的权重来规格化。不同计分过滤器可以定义为实现这些和其他权重标准。
[0085]处理存储(在1140)已过滤量化测量数据到数据库220并且处理结束。在一些实施例中,处理直接将已过滤量化测量传递到报告引擎230的可信度计分汇聚器640。
[0086]V.可信度计分汇聚器[0087]可信度计分汇聚器640基于特定企业的规格化的量化测量产生对该特定企业的可信度得分。在一些实施例中,可信度得分是划界在如下范围中的数值,其中一端表示缺乏可信度而另一端表示完全可信度,其中可信度解释各种企业实践的成功、客户满意度、相对于竞争者的表现、成长潜力等。在一些实施例中,可以将可信度得分编码以利用不同的数字指定不同的可信度方面。例如,六位数字得分的前三位数字指定企业信用得分,而六位数字得分的后三位数字指定可信度得分。在一些实施例中,可信度得分是每一个得分表示可信度的不同分量的得分的集合。例如,可信度得分可以包括企业信用得分、评论得分和评级得分,其中评论得分是从所汇聚的定性数据推导的量化测量汇编的,并且评级得分是从在所汇聚的量化数据内的规格化量化测量汇编的。对于本领域普通技术人员应当显然的是,可信度得分可以以任何数量的其他方式格式化,诸如已格式化的字符的集合或已格式化的字母数字字符的集合。
[0088]为了产生可信度得分,可信度计分汇聚器640从数据库220或从计分过滤器630对特定企业汇聚任何已过滤和已规格化的量化测量。可信度计分汇聚器640随后使用一个或多个专有算法来一起协调量化测量以产生可信度得分。这可以包括平均、求和或使用专有公式来从量化测量的所汇聚集合产生可信度得分。这些算法允许可信度得分利用任何数量的可用量化测量计算。所产生的可信度得分随后存储回到数据库220,其中可信度得分与特定企业关联。
[0089]用户和企业可以从图2的接口端口 240访问和查看他们的可信度得分。在一些实施例中,实时地更新和呈现可信度得分。在一些实施例中,可信度得分是用户和企业在被提供对可信度得分的访问之前购买的有形资产。用户和企业可以购买可信度得分的一次性查看或可以购买允许他们在特定订阅周期期间(例如,月、年等)的任何时间查看他们的可信度得分的订阅计划。用户和企业可以购买和查看与他们的企业关联的可信度报告,以便理解他们的可信度或可以购买他们在做生意时感兴趣的其他企业的可信度得分或查看竞争者的可信度。
[0090]v1.报告生成器
[0091]报告生成器650结合可信度计分汇聚器640操作。在一些实施例中,报告生成器650被赋予产生报告的任务,该报告详细描述如何推导可信度得分、企业成功的区域、需要改进的区域、相对竞争者的地位以及可以做出以改进可信度得分的建议改进。可信度报告因而提供如何推导可信度得分的完全披露。根据可信度报告,企业可以查看并且报告不精确关联可信度数据,企业可以识别潜在身份诈骗或侵占企业生成的信誉的利益的其他人,并且企业可以主动与他们的可信度得分以及得分从其推导的各个分量进行交互并且做出改进。所生成的报告可以作为与可信度得分分离的有形资产出售。和之前一样,尽管一些实施例提供以诸如书写或电话咨询之类的其他介质的可信度得分和可信度报告,但是用户通过接口端口 240访问可信度报告。
[0092]图12图示根据一些实施例的在接口端口 240内的可信度报告窗口 1210。如所示,可信度报告窗口 1210包括在其中具有各种信息和动作的多个查看框1220、1230、1240和1250。
[0093]框1220是呈现可信度得分和/或可信度得分的分量(诸如Dun&Bradstreet企业信用得分、可信度分级得分以及可信度评论得分)的得分框。在一些实施例中,可信度得分识别企业的整体可信度,而分级得分从量化数据的规格化的量化测量推导且评论得分从处理定性数据获得的量化测量推导。在一些实施例中,使用指示条和/或数值呈现得分。指示条可以被颜色编码以更好的区分得分。例如,红色指示差的得分,黄色指示中性得分,而绿色指示良好得分。同样在框1220中包括的是按钮1225。当点击按钮1225时,报告提供关于用户可以如何改进得分、需要改进的区域或目前成功的区域的各种建议。在弹出对话框中或通过改变框1220的内容可以呈现这样的信息。
[0094]框1230是数据编辑框。在此框中,用户或可以调整从数据源汇聚的数据评论或提供之前未合并到可信度得分中的新数据。这可以包括校正所汇聚的数据中的错误。在框1230中包括的是按钮1260和1265。按钮1260允许框1230内的特定项扩张用于编辑。按钮1265允许用户提交包括在各种所汇聚的数据源不可获得的数据或尚未传播到数据源的新数据的新可信度数据。
[0095]框1240是数据匹配框,借此可以查看用户评论和其他所汇聚的可信度数据,并且可以识别并且报告失配数据。具体地,企业所有人可以滚动所汇聚量化和定性数据的列表以查看其他人关于该企业在说什么。这包括查看正面和负面的反馈、改进企业的建议、用户体验到的问题、用户喜欢企业哪点等。另外,框1240包括按钮1270和1275用于扩张特定项并且用于报告错误。错误可以包括关于另一企业的数据以及不恰当地匹配到对其生成可信度报告的企业的数据。错误还可以包括本应当作为偏见数据或作为异常而过滤掉的数据。框1240还可以呈现关于企业的信息,诸如地址、机构、电话号码等。
[0096]框1250是客服框。在一些实施例中,该框提供关于可信度得分和报告的总结信息,诸如企业什么做得好和什么区域需要改进。该框还可以对企业提供建议的动作,以及对寻找额外帮助的用户提供联系信息。在一些实施例中,框1250向客户支持代表提供交互聊天窗口。
[0097]图13呈现根据一些实施例的替代可信度报告查看器1310。可信度报告查看器1310对可信度报告提供深入查看,用户借此可以在每一个深入层获得关于企业可信度的更详细的信息。可信度报告查看器1310显示对企业提供累积可信度得分1320的第一层1315。累积可信度得分1320是将企业可信度量化为标准化得分的单一数值或字母数字值。
[0098]用户可以点击可信度得分1320以深入第二层1330。当用户点击可信度得分1320时,一些实施例将可信度报告查看器1310的显示从显示第一深入层1315的内容改变为显示第二深入层1330的内容。导航功能允许用户在任何时候回到第一深入层1315或任何其他层。取代改变可信度报告查看器1310的显示,一些实施例提供第二窗口或显示区域来显示第二深入层1330。
[0099]第二深入层1330呈现可信度得分1320从其推导的各种分量得分。在一些实施例中,分量得分包括第一得分1335、第二得分1340以及第三得分1345。在一些实施例中,第一得分1335是将企业的信誉量化的得分。第一得分1335可以因而是Dun和Bradstreet信用得分或其他类似的企业信用分。在一些实施例中,第二得分1340是将从各种数据源汇聚的量化数据量化为单一得分的评级得分。在一些实施例中,第三得分1345是将从各种数据源汇聚的定性数据量化为单一得分的评论得分。
[0100]用户可以进一步深入以查看用来推导每一个分量得分的数据。具体地,通过点击第一得分1335,用户深入到呈现Dun和Bradstreet信用分或其他类似的企业信用报告的第三层1350。替代地,可以向用户呈现用户可以购买Dun和Bradstreet信用得分或其他类似的企业信用报告的请求窗口。通过点击第二得分1340,用户深入到呈现在推导可信度得分1320的评级得分分量中使用的各种所汇聚的量化数据的第三层1360。类似地,通过点击第三得分1345,用户深入到呈现在推导可信度得分1320的评论得分分量中使用的各种所汇聚的定性数据的第三层1370。
[0101]用户可以点击在各种第三深入层1350-1370内呈现的任何企业信用数据、量化数据或定性数据,以便访问诸如层1380之类的另一深入层,其允许用户校正错误和失配数据,提供新数据,或接收关于如何改进各种可信度得分分量的建议。可以通过提供连接可信度专家的交互聊天窗口的另一深入层来提供建议,或可以通过提供关于改进各种可信度得分分量的指引来提供建议。对于本领域普通技术人员应当显然的是,可以提供任何数量的深入层,以及每一层可以包括除了在图13中呈现的那些信息之外的额外的或其他的信息。
[0102]II1.计算机系统
[0103]很多上述处理和模块被实现为软件处理,该软件处理具体化为在非暂时性计算机可读存储介质(也称为计算机可读介质)上记录的指令的集合。当这些指令由一个或多个计算要素(诸如处理器或其他计算要素,比如ASIC和FPGA)执行时,它们使得该(多个)计算要素进行在指令中指示的动作。计算机和计算机系统以它们最宽的含义表示,并且可以包括具有处理器的任何电子装置,包括蜂窝电话、智能手机、便携式数字助理、平板装置、笔记本计算机和上网本。计算机可读介质的示例包括但不限于⑶-ROM、闪存驱动器、RAM芯片、硬盘驱动器、EPROM等。
[0104]图14图示利用其实现一些实施例的计算机系统。这样的计算机系统包括各种类型的计算机可读介质以及用于各种其他类型的计算机可读介质的接口,该计算机可读介质实现上述的各种处理、模块和引擎(例如,主数据管理获取引擎、报告引擎、接口端口等)。计算机系统1400包括总线1405、处理器1410、系统存储器1415、只读存储器1420、永久存储装置1425、输入装置1430和输出装置1435。
[0105]总线1405集中地表示可通信地连接计算机系统1400的众多内部装置的全部系统、外设和芯片组总线。例如,总线1405将处理器1410与只读存储器1420、系统存储器1415和永久存储装置1425可通信地连接。从这些各种存储单元,处理器1410获取指令以执行并且获取数据以处理,以便执行本发明的处理。处理器1410是处理装置,诸如中央处理单元、集成电路、图形处理单元等。
[0106]只读存储器(ROM) 1420存储计算机系统的处理器1410和其他模块需要的静态数据和指令。另一方面,永久存储装置1425是读写存储器装置。该装置是非易失性存储器单元,其即使在计算机系统1400关闭时也存储指令和数据。本发明的一些实施例使用大容量存储装置(诸如磁盘或光盘及其对应的盘驱动器)作为永久存储装置1425。
[0107]其他实施例使用可移除存储装置(诸如闪存驱动器)作为永久存储装置。类似永久存储装置1425,系统存储器1415是读写存储器装置。然而,不像存储装置1425,系统存储器是易失性读写存储器,诸如随机存取存储器(RAM)。系统存储器存储处理器在运行时需要的一些指令和数据。在一些实施例中,在系统存储器1415、永久存储装置1425和/或只读存储器1420中存储处理。
[0108]总线1405还连接到输入和输出装置1430以及1435。输入装置使得用户能够将信息和选择命令通信到计算机系统。输入装置1430包括电容触摸屏、电阻触摸屏、任何其他触摸屏技术、轨迹板的任意一个,其是计算系统1400的一部分或附接为外设。输入装置1430还包括字母数字键盘(包括物理键盘和触摸屏键盘)、指向装置(也称为“光标控制装置”)。输入装置1430还包括音频输入装置(例如,麦克风、MIDI乐器等)。输出装置1435显示由计算机系统生成的图像。输出装置包括打印机和显示装置,诸如阴极射线管(CRT)或液晶显示器(IXD)。
[0109]最后,如图14所示,总线1405还通过网络适配器(未示出)将计算机1400耦接到网络1465。以该方式,计算机可以是诸如局域网(“LAN”)、广域网(“WAN”)、或内部网之类的计算机网络或是网络中的网络(诸如因特网)的一部分。例如,计算机1400可以耦接到网络服务器(网络1465),使得当用户与在网络浏览器中操作的⑶I交互时,在计算机1400上执行的该网络浏览器可以与网络服务器交互。
[0110]如上所述,计算机系统1400可以包括一个或多个各种不同的计算机可读介质。这样的计算机可读介质的一些示例包括RAM、ROM、只读密致盘(CD-ROM)、可记录致密盘(CD-R)、可写致密盘(CD-RW)、只读数字多功能盘(例如,DVD-ROM、双层DVD-ROM)、各种可记录/可写DVD (例如,DVD-RAM、DVD-RW、DVD+RW等)、闪存存储器(例如,SD卡、mini_SD卡、micro-SD等)、磁 盘和/或固态硬盘驱动器、Ζ?Ρ?盘、只读和可记录蓝光盘、任何其他光或磁介质以及软盘。
[0111]虽然本发明已经参考大量具体细节描述,但是本领域技术人员将认识到本发明可以以其他具体形式实施而不偏离本发明的精神。因此,本领域普通技术人员将理解本发明不限于前述说明性细节,而是由所附权利要求定义。
【权利要求】
1.一种用于产生得分以可量化地表示特定实体的可信度的方法,所述方法包括: 从多个数据源汇聚可信度数据,所述可信度数据包括:(i)定性数据,具有与第一多个实体的每一个实体有关的文本陈述,以及(ii)量化数据,具有用于可量化地评级第二多个实体的每一个实体的量化测量; 处理所述定性数据以基于与所述第一多个实体的每一个实体的文本陈述的文本,推导用于可量化地评级所述实体的量化测量的集合; 规格化从所述定性数据推导的量化测量以及来自所述量化数据的量化测量的所述集合;以及 基于与所述第一和第二多个实体的特定实体有关的所规格化的量化测量产生所述特定实体的可信度得分。
2.如权利要求1所述的方法,进一步包括基于所述量化测量从其汇聚的数据源来调整量化测量的权重。
3.如权利要求1所述的方法,其中,处理所述定性数据包括对所述定性数据进行自然语言处理,以对每一个文本陈述识别意味着一定程度的正面或负面的第一单词以及由所述第一单词修饰的第二单词。
4.如权利要求3所述的方法,其中,处理所述定性数据进一步包括(i)基于所述第二单词识别量化测量的范围,以及(ii)基于所述第一单词在量化测量的范围中识别特定量化测量值。
5.如权利要求1所述的方法,其中,处理所述定性数据包括基于当从所述定性数据推导量化测量时消除所述定性数据的偏见和不一致的解译的算法的集合,进行自然语言处理。
6.如权利要求1所述的方法,进一步包括提供与所述特定实体关联的用户通过其提交可信度数据的接口。
7.如权利要求1所述的方法,进一步包括产生包括所述可信度得分以及在推导所述可信度得分中使用的可信度数据的报告。
8.如权利要求7所述的方法,进一步包括提供实体通过其查看所述报告和所述可信度得分的接口。
9.如权利要求1所述的方法,其中,产生所述可信度得分包括将与所述特定实体有关的量化测量汇编为单一值。
10.如权利要求1所述的方法,其中,产生所述可信度得分包括将与所述特定实体有关的量化测量汇编为表示从与所述特定实体有关的定性数据推导的量化测量的第一值以及表示与所述特定实体有关的量化数据的量化测量的第二值。
11.如权利要求1所述的方法,其中,汇聚所述可信度数据包括利用将可信度数据的片段关联到特定实体的至少一个识别符标记所汇聚的可信度数据的每一个片段。
12.如权利要求1所述的方法,其中,产生可信度得分包括产生与所述第一和第二多个实体的其他实体的可信度得分可比较的标准化得分。
13.如权利要求1所述的方法,其中,所述特定实体是运营企业的企业实体。
14.一种可信度计分系统,包括: 数据汇聚器,用于与多个数据源对接以从所述数据源获取可信度数据,其中,所述可信度数据包括(i)定性数据,具有与第一多个实体的每一个实体有关的文本陈述,以及(ii)量化数据,具有用于可量化地评级第二多个实体的每一个实体的量化测量; 主数据管理器,将可信度数据的每一个获取条目匹配到所述多个第一和第二实体的一个实体; 自然语言处理器,从所获取的定性数据的文本陈述推导量化测量; 生成器将(i)从与特定实体匹配的定性数据的文本陈述推导的量化测量以及(ii)与特定实体匹配的量化数据的量化测量汇编为所述特定实体的标准化可信度得分。
15.如权利要求14所述的可信度计分系统,进一步包括过滤器的集合,用于过滤所述可信度数据以移除无关、偏见和异常的可信度数据的至少一种并且用于规格化(i)从与定性数据关联的文本评论推导的量化测量以及(ii)所述量化数据的量化测量的至少一种。
16.如权利要求14所述的可信度计分系统,进一步包括用于提供用于用户与所述可信度计分系统交互的接口的接口端口。
17.如权利要求16所述的可信度计分系统,其中,与所述可信度计分系统交互包括实体通过所述接口端口向所述主数据管理器提交可信度数据用于包括在所述可信度得分的汇编中。
18.如权利要求16所述的可信度计分系统,其中,与所述可信度计分系统交互包括实体识别与它不恰当地匹配的可信度数据。
19.如权利要求16所述的可信度计分系统,其中,与所述可信度计分系统交互包括实体访问可信度得分用于查看。
20.如权利要求14所述的可信度计分系统,其中,所述生成器进一步用于汇编与所述特定实体匹配的可信度数据以生成详述在对所述特定实体推导可信度得分中使用的因素的可信度报告。
21.如权利要求20所述的可信度计分系统,其中,所述可信度报告识别增加所述可信度得分的成功企业实践、降低所述可信度得分的不成功企业实践以及用于改进所述特定企业的可信度得分的建议的至少一种。
22.如权利要求14所述的可信度计分系统,其中,所述数据汇聚器包括多个插件模块,每一个插件模块配置为与所述多个数据源的一个数据源对接并且从所述多个数据源的一个数据源提取可信度数据。
23.一种非暂时性计算机可读存储介质,包括用于产生得分以可量化地识别特定实体的可信度的计算机程序,所述计算机程序用于由至少一个处理器的执行,所述计算机程序包括: 指令的集合,用于从多个数据源汇聚可信度数据,所述可信度数据包括:(i)定性数据,具有与第一多个实体的每一个实体有关的文本陈述,以及(ii )量化数据,具有用于可量化地评级第二多个实体的每一个实体的量化测量; 指令的集合,用于处理所述定性数据以基于与所述第一多个实体的每一个实体有关的文本陈述的文本,推导用于可量化地评级所述实体的量化测量的集合; 指令的集合,用于规格化从所述定性数据推导的量化测量以及来自所述量化数据的量化测量的集合;以及 指令的集合,用于基于与所述第一和第二多个实体的特定实体有关的所规格化的量化测量产生所述 特定实体的可信度得分。
【文档编号】G06Q30/00GK103917994SQ201280025135
【公开日】2014年7月9日 申请日期:2012年3月19日 优先权日:2011年3月24日
【发明者】A.斯蒂贝尔, J.斯蒂贝尔, J.洛布, J.哈凯特, M.卡泽拉尼 申请人:信用公司

最新回复(0)