响应于搜索查询提供针对讨论话题的帖子的制作方法

xiaoxiao2020-7-22  7

专利名称:响应于搜索查询提供针对讨论话题的帖子的制作方法
技术领域
本说明书涉及因特网搜索引擎展现包括讨论论坛的帖子的搜索结果。
背景技术
各种信息可以对诸如因特网的网络上的用户获得。响应于接收搜索查询,搜索引擎有效地搜索托管多个资源的多个内容主机以识别符合所接收的查询的资源。通常,搜索引擎将搜索结果展现为链接列表,其中每一个链接使用户能够访问所识别的资源中的一个。所识别的资源可以具有一个或多个额外的嵌入式资源。通常,搜索引擎邻近链接提供信息的摘录。摘录包括所识别的资源的等同于或类似于包括在搜索查询中的文本的部分, 例如文本。存储在内容主机处并且由搜索引擎识别的资源可以包括包含针对讨论话题的帖子的网页。

发明内容
本说明书描述了响应于搜索查询提供针对讨论话题的帖子的系统和方法。在一个示例中,响应于接收搜索查询,搜索引擎将包括多个资源的信息识别为符合搜索查询的搜索结果。使用在此描述的技术,识别搜索结果中的为包括讨论论坛的帖子的讨论话题网页的资源和有关讨论论坛的信息。并且,提供与讨论话题有关的信息以供在显示设备中显示。 在一些情况下,将该信息与示出其它类型的搜索结果的信息一起提供。总的来说,可以将本说明书中描述的主题的一个方面具体化在包括下述动作的方法中接收识别已由搜索引擎识别为符合搜索查询的多个资源的信息;将多个资源中的第一资源识别为包括讨论论坛的帖子;识别每一个均不同于第一资源的一个或多个第二资源,每一个第二资源被直接或间接地链接到第一资源,每一个第二资源包括讨论论坛的一个或多个其它帖子;从第一资源和一个或多个第二资源提取有关讨论论坛的信息;以及将所提取的信息与指向第一资源的链接一起提供给用户设备以作为对搜索查询的响应的一部分向用户显示。本方面的其它实施例包括被配置为执行方法的操作的相应系统、装置和计算机程序产品。这些和其它实施例每一个可以可选地包括下述特征中的一个或多个。一个或多个第二资源至少部分地基于第一资源和每一个第二资源共享的一个或多个属性来识别,以及用于识别一个或多个第二资源的操作进一步包括确定第一资源的属性的值;识别与属性相关联的其它资源;确定其它资源的属性的值;以及如果所识别的资源的属性的值等于第一资源的属性的值,则将所识别的资源指定为第二资源。一个或多个属性包括向讨论论坛提供多个帖子的时间和提供多个帖子的作者。所提取的信息包括向讨论论坛提供帖子和一个或多个其它帖子的作者的数量、提供最近帖子的时间、由相同作者提供的帖子的数量以及对帖子的回复的数量。已由搜索引擎识别的多个资源包括一个或多个第二资源中的至少一个。包括在第一资源中的帖子包括相关联的第一时间戳,第一时间戳表示向讨论论坛提供第一帖子的时间。包括在一个或多个第二资源中的一个或多个其它帖子在包括在第一资源中的帖子的时间之前或之后的时间被提供。总的来说,可以将本说明书中描述的主题的另一个方面具体化在包括下述动作的方法中接收请求对讨论论坛进行搜索的请求和搜索查询;从搜索引擎接收识别符合搜索查询的多个资源的信息;识别多个资源之中的多个讨论话题网页;从多个讨论话题网页识别多个讨论论坛;从多个讨论话题网页提取有关多个讨论论坛中的每一个的信息;以及将所提取的信息与指向多个讨论论坛中的每一个的链接一起提供给用户设备以作为对搜索查询的响应的一部分向用户显示。这些和其它实施例每一个可以可选地包括下述特征中的一个或多个。从多个讨论话题网页识别多个讨论论坛包括下述操作识别指向第一讨论话题网页的第一链接;识别指向第二讨论话题网页的第二链接,其中第一链接和第二链接指向相同讨论论坛;以及确定第一讨论话题网页包括指向第二讨论话题网页的链接,将第一讨论话题网页和第二话题网页指定为来自相同讨论论坛。每一个讨论话题网页包括相应讨论论坛的一个或多个帖子,以及搜索引擎已确定包括在讨论话题网页中的至少一个帖子符合搜索查询。搜索引擎提供针对多个讨论话题网页的相应多个排名,以及操作进一步包括按照多个排名的降序形式显示包括指向多个讨论论坛中的每一个的链接的多个链接,以使指向包括带有最高排名的讨论话题网页的讨论论坛的链接被最先显示。可以实现在本说明书中描述的主题的特定实施方式来实现下述优势中的一个或多个。用户看见可以包括许多相关帖子的讨论话题的集成视图,否则其可能在搜索引擎提供的结果中被示出为分散的网页。此外,用户看见包括带有与用户的搜索查询相关的帖子的页面的多个讨论话题。在附图和下面的描述中阐述了本说明书的一个或多个实施方式的细节。本说明书的其它特征、方面和优势从描述、附图以及权利要求将变得显而易见。


图1图示了用于提取有关包括针对讨论论坛话题的帖子的资源的信息的示例过程。图2图示了用于识别包括针对讨论论坛话题的帖子的资源的示例系统。图3图示了用于确定包括帖子的两个资源属于相同讨论论坛话题的示例过程。图4图示了用于提供从包括在搜索结果中的资源提取的、有关包括针对讨论论坛话题的帖子的资源的信息的示例过程。图5图示了在其中展现有关讨论论坛的讨论话题网页的信息的示例显示设备。各附图中的相同参考数字和标记指示相同元素。
具体实施例方式搜索引擎爬取(crawl)在多个内容主机处的资源以收集信息并且生成计算机可搜索的资源索引。在接收到搜索查询后,搜索引擎识别搜索引擎确定最符合搜索查询的资源。搜索引擎生成搜索结果以展现所识别的资源。在一些情况下,搜索引擎识别的资源是包括针对讨论话题的一个或多个帖子的讨论话题网页。讨论话题通常由讨论论坛维护。在一些实施方式中,使用稍后描述的技术,识别与讨论论坛主题有关的其它讨论话题网页,以及获取并且提供有关论坛的信息例如以在显示设备中显示。在一些实施方式中,对搜索结果进行过滤以识别讨论话题网页,以及与所识别的讨论话题网页所属的讨论论坛话题有关的信息或两者被提供以在显示设备中展现。讨论论坛可以包括可以接收来自博客查看者的评论的个体的因特网博客;共享例如主题的共同的题目的消息被分组在其中的话题讨论; 其中用户发送包括文本、音频、图像等的简短更新用于发布的微博;等等。参考图1描述了用于执行这些功能的示例过程。图1图示了用于提取有关包括针对讨论论坛话题的帖子的因特网可寻址的资源的信息的示例过程100。过程100接收识别已由搜索引擎识别为符合搜索查询的多个资源的信息(步骤10幻。例如,搜索引擎响应于搜索查询已经识别搜索引擎确定最符合搜索查询的多个资源。所识别的资源可以包括存储在一个或多个内容主机中并且对搜索引擎而言可访问的网页、图像、视频等,针对其搜索引擎已经运行了它的爬取和信息检索过程。通常, 资源在因特网上是可通过URL(统一资源定位符)寻址的。过程100接收这样的所识别的资源。过程100将多个资源中的第一资源识别为包括针对讨论论坛话题的帖子(步骤 110)。为了将例如网页的资源归类为包括针对讨论论坛话题的帖子的资源,过程100依赖于与网页的特性和网页的内容相关联的多个标准。特别地,通常在讨论话题网页中找到某些关键词。这样的关键词包括“论坛”、“主题”、“话题”、“帖子”、“发帖者(posted by)”、“回复”等。这样的关键词的存在是过程100使用来确定网页是否是讨论论坛话题的一部分的一个标准。可以被使用的其它标准包括网页是否具有包括针对讨论话题的帖子的页面的文档结构特征、存在指示提供帖子的时间的多个日期、存在表示提供这样的帖子的作者的多个用户名、存在指回论坛根页面的大量链接等。在一些实施方式中,为了归类特定网页,过程100评估多项式,其中变量根据在页面中存在或不存在特定特征一例如,在页面上存在“下一页(next)”和“上一页 (previous) ”链接,或存在词“话题”一来取值,以及系数是根据经验确定的与各个特征相关联的权重。如果多项式的值满足预定阈值,则过程100将页面归类为是包括针对讨论话题的一个或多个帖子的页面。在一些实施方式中,在机器学习系统的帮助下来确定特征和权重。确定了第一资源是讨论话题网页后,过程100识别也包括针对讨论论坛话题的帖子的一个或多个额外、不同的第二资源(步骤11 。例如,每一个第二资源通过“下一帖子” 或“上一帖子”链接被直接或间接链接到第一资源。这些网页中的每一个可以例如取决于论坛的实现或每一个帖子的长度包括一个或多个帖子。在识别链接到第一资源使得为相同话题的一部分的一个或多个第二资源后,过程 100从第一资源和一个或多个第二资源提取有关话题的信息(步骤120)。例如,讨论论坛可以接收来自多个作者的针对讨论话题的多个帖子。讨论论坛可以将指示作者提供针对讨论论坛话题的帖子的时间的时间戳与每一个帖子进行关联。由过程100提取的信息可以包括有关下述的数据话题中的帖子的数量、提供了帖子的作者的数量、相同作者的帖子的数量、每一个帖子的时间戳、每一个帖子的作者、针对话题的最近帖子的时间戳、作者的最近帖子的时间戳等。过程100将所提取的信息与指向第一资源的链接一起提供(步骤12 。例如,除响应于搜索查询而提供的其它信息外,过程100还可以将所提取的信息提供给用户设备以向用户显示。搜索引擎可以生成有关包括在搜索结果中的每一个资源的信息的摘录。例如, 如果所识别的资源是包含文本的文档,则摘录可以包括该文本的匹配搜索查询中的文本的部分。搜索引擎可以提供例如URL的指向搜索结果中的每一个资源的链接,以及提供与每一个资源相关联的摘录以邻近与资源相关联的链接显示。过程100可以提供所提取的信息以与第一资源的摘录和URL —起显示。链接和所提取的信息可以在可操作地耦接到计算机系统的显示设备上的用户界面中显示,所述计算机系统和显示设备例如类似于图2中所图示的显示设备和系统。图2图示了用于识别包括针对讨论论坛话题的帖子的资源的示例系统200。系统 200包括搜索引擎205,其用来响应于从通过例如因特网的一个或多个网络220可操作地耦接到搜索引擎205和内容主机210的例如计算机系统215的用户设备接收搜索查询而识别存储在多个内容主机210中的多个资源。并且,系统200包括话题识别模块225,其用来识别包含讨论论坛的帖子的讨论话题网页。在一些实施方式中,话题识别模块225是在一个或多个计算机上实现并且被配置为执行参考图1描述的方法以及将描述的方法的软件。例如,话题识别模块225识别包括针对与包括在搜索结果中的网页相同讨论论坛话题的帖子的一个或多个讨论话题网页,以及提取有关话题的信息。随后,话题识别模块225将所提取的信息提供给搜索引擎205,其将指向搜索结果中的资源的链接和所提取的信息两者提供给从之接收搜索查询的用户设备。链接和所提取的信息可以在用户设备的例如LCD(液晶显示器)的显示器中显示,使得所提取的信息邻近指向搜索引擎205所识别的讨论话题网页的链接显示。在一些情况下,搜索引擎205可以将包括针对相同讨论论坛话题的帖子的多于一个讨论话题网页识别为符合所接收的搜索查询。在这样的情况下,所提取的信息可以邻近指向由搜索引擎205识别的每一个讨论话题网页的链接显示。替选地,即使在发现有关话题的多个网页符合搜索查询时,仅将单个搜索结果项与指向话题或话题的页面的链接一起提供给用户。例如,搜索引擎205可以将其中每一个包括相同讨论话题论坛的帖子的多个讨论话题网页包括在符合搜索查询的搜索结果中。指向讨论论坛话题的链接可以在单个搜索结果中与话题信息、摘录等一起展现以向显示设备上的用户显示,而不是单独展现指向所识别的讨论话题网页中的每一个的链接。图3图示了用于确定包括帖子的两个资源属于相同讨论论坛话题的示例过程 300。例如讨论话题网页的包括针对相同讨论论坛话题的帖子的多个资源可以是共享某些相似性的超文本标记语言(HTML)文档,所述相似性例如包括帖子的文档的结构相似性、识别每一个讨论话题网页的共同属性等。此外,讨论论坛话题中的每一个讨论话题网页包括指向相同讨论论坛话题中的另一个讨论话题网页的至少一个链接。以这种方式,多个讨论话题网页相互链接。在一些实施方式中,话题识别模块225将多个讨论话题网页的URL接收为相应的多个记录并且将相同记录存储为例如计算机可读介质中的表。为了识别包括针对与搜索结果中的网页相同话题的帖子的讨论话题网页,可以识别候选讨论话题网页,以及可以确定每一个候选讨论话题网页包含指向其的链接的其它讨论话题网页。不但第一话题网页上的链接应当指向第二话题网页,而且第二话题网页上的类似链接应当指回第一网页。在一些实施方式中,候选讨论话题网页可以是搜索引擎205先前爬取来创建计算机可搜索的网页索引的相同网页。过程300接收第一资源(步骤30 并且确定第一资源是第一讨论话题网页(步骤310)。例如,第一资源是搜索结果中的还被识别为是讨论话题网页的资源。话题识别模块225识别其它讨论话题网页(步骤315)。由于搜索引擎可能已经确定其它话题网页中的帖子不符合搜索查询,所以其它讨论话题网页中的部分或全部不必包括在搜索结果中。所识别的讨论话题网页中的每一个可以包括指向其它资源的URL,即指向不包括针对话题的帖子的资源的URL。过程300从每一个所识别的讨论话题网页识别向外链接(outlink)(步骤320)。 例如,话题识别引擎225可以识别讨论话题网页上的所有链接。过程300检查第一资源上的向外链接是否将第一资源直接或间接地链接到另一个讨论话题网页(步骤32幻。向外链接是讨论话题网页上的指向其它资源的链接, 这样的资源包括包含在相同讨论论坛话题中的其它讨论话题网页。可以根据其来过滤所接收的记录的标准可以是第一资源和讨论话题网页中的每一个上指向对方的向外链接。由于针对讨论论坛话题的多个帖子跨越多个页面,所以例如通过由每一个页面上的页码表示的超链接、由例如“下一页”、“上一页”的特定文本表示的链接等来链接页面。例如,如果针对讨论论坛话题的帖子跨越十个页面,则第一页面可以包含超链接,即指向论坛中的第二页面的“下一页”或指向多个页面的超链接,即指向论坛中的相应页面的"1〃、丨‘2〃、丨‘3〃、丨‘10〃等。每一个超链接可以包括锚文本和目标URL。话题识别模块225确定如果第一资源和一个或多个讨论话题网页上的超链接列出相同的目的地锚,则第一资源和一个或多个讨论话题网页被直接链接。另外,如果第二讨论话题网页包括指向被直接链接到第一资源的另一个网页的向外链接,则话题识别模块225可以断定第二讨论话题网页和第一资源被间接链接。以这种方式,话题识别模块225可以识别包括包含在第一资源中的网页、被直接或间接地链接到对方以形成话题的多个讨论话题网页。包括针对相同讨论论坛话题的帖子的多个讨论话题网页只跨越单个网站。过程 300识别第一资源和所识别的讨论话题网页所属的网站(或更具体地,讨论论坛)(步骤 330)。为了这样做,话题识别模块225可以检查指向所识别的其它讨论网页中的每一个的 URL中的文本、每一个网页的内容主体等。例如,话题识别模块225可以检查URL的列出网页所属的网站的部分,并且识别包括讨论话题网页的网站。过程300检查所识别的讨论话题网页和第一资源是否属于相同网站(步骤335)。 话题识别模块225识别其链接包括对与指向第一资源的链接引用的网站相同的网站,例如域名,的引用的讨论话题网页。这是话题识别模块225可以根据其来确定两个讨论话题网页是否被链接到相同讨论论坛话题的另一个标准。在识别满足上述标准的第二资源后,过程300将第二资源指定为包括在与第一资源相同的讨论论坛话题中的讨论话题网页(步骤340)。如果网站不相同,则过程重复步骤330和335。在执行该步骤后,话题识别模块225可以对表中的记录进行过滤以包括指向符合该标准的仅仅那些讨论话题网页的URL。例如,话题识别模块225过滤不匹配上述标准的所有链接并且输出指向讨论话题网页的匹配标准的链接。在一些实施方式中,话题识别模块225将标识符分配给每一个第二资源,使得属于与第一资源相同的讨论论坛话题的所有第二资源可以由标识符识别。在一些实施方式中,话题识别模块225将资源标识符(例如,指向资源的链接)和话题标识符存储在非易失性存储器中,以维护哪些资源包括针对哪些已知话题的帖子以及资源被如何链接到对方的记录,以识别每一个话题的开始和结束。由于帖子可以被连续添加到讨论论坛话题,所以帖子跨越其分布的讨论话题网页的数量可以随时间增加。定期地,话题识别模块225可以执行步骤315、320、325、330、335和 340来识别任何新的讨论话题网页是否属于第一资源所属的讨论论坛话题。在识别新的讨论话题网页并且确定这样的新识别的网页包括针对已识别的话题的帖子后,话题识别模块 225可以根据每一个新识别的网页为其部分的话题将标识符分配给每一个新识别的网页, 并且将指向这些网页的链接添加到已知话题的已存储的记录。以这种方式,包括针对与第一资源相同的讨论论坛话题的帖子的所有讨论话题网页被识别。在搜索引擎将包含帖子的资源识别为待作为搜索结果提供的资源时,话题识别模块225可以为非常近的添加检查讨论中的话题的结束,以使该信息可以被包括在提供给用户的有关话题的信息中。在其它实施方式中,包含话题整体的资源在搜索引擎将包含帖子的资源识别为待作为搜索结果提供的资源时被动态识别。为了从第一资源和一个或多个第二资源提取有关讨论论坛话题的信息(步骤 120),话题识别模块225可以扫描包含话题的资源以确定作者的数量、话题中的帖子的数量、接收每一个帖子的时间戳等。讨论论坛通常收集这种类型的有关帖子的信息并且将其与已发布的帖子包括在一起。在一些实施方式中,话题识别模块225可以构建链接图,其中图的每一个节点是包括在记录表中的讨论话题网页的标识符。图中的链接表示从论坛中的一个讨论话题网页到另一个网页的链接。由于从另一个讨论话题网页访问一个讨论话题网页是可能的,反之亦然,所以链接是双向的。以这种方式,话题识别模块225可以构建分区图,其中每一个分区是一个讨论话题。在一些实施方式中,可以将讨论话题网页中的每一个包括在搜索引擎 205响应于接收搜索查询而搜索来识别搜索结果的计算机可搜索的索引中。可以将每一个讨论话题网页的标识符存储在例如用于页面的记录中的独特字段中。相同论坛的讨论话题网页可以共享标识符,其可以使搜索引擎205能够通过知道论坛中的页面中的仅仅一个的标识符来识别属于相同论坛的讨论话题网页的记录一例如,表中的行。识别了包括针对与搜索结果中的讨论话题网页相同话题的帖子的其它讨论话题网页并且提取了有关话题自身的信息后,话题识别模块225提供所提取的信息来添加到搜索结果以在显示设备中显示。在一些实施方式中,所提取的信息如图5中所图示在显示设备中邻近包括在搜索结果中的指向讨论话题网页的链接显示。在一些情况下,搜索结果可以包括包含针对相同话题的帖子的多于一个讨论话题网页。在一些情况下,搜索结果可以包括针对多于一个话题的讨论话题网页。话题识别模块225可以聚类包括针对每一个话题的帖子的讨论话题网页,并且提取有关各个话题的信息。此外,通过执行参考图4描述的操作,话题识别模块225可以通过聚类包括在搜索结果中的讨论话题网页来识别讨论论坛,并且在显示设备中的用户界面中向用户展现与话题有关的链接和信息。图4图示了用于响应于搜索而提供专门针对讨论论坛的信息的示例过程400。过程400接收搜索查询和对搜索讨论论坛话题的请求(步骤40 。例如,用户可以在可操作地耦接到计算机系统215的显示设备中的用户界面中呈递搜索查询以及呈递对符合搜索查询的资源的请求。计算机系统215可以通过例如因特网的一个或多个网络可操作地耦接到搜索引擎205和话题识别模块225。过程400从搜索引擎205接收识别符合搜索查询的多个资源的信息(步骤410)。过程400识别多个资源之中的多个讨论话题网页(步骤415)。例如,使用前述方法,话题识别模块225从多个资源中识别多个讨论话题网页。所识别的讨论话题网页表示包括针对相同讨论论坛话题的帖子的网页和包括针对不同讨论论坛话题的帖子的网页的组合。过程400从多个讨论话题网页提取有关多个讨论论坛话题中的每一个的信息(步骤420)。例如,话题识别模块225如前所述可以识别包括针对相同讨论论坛话题的帖子的多个话题网页。此外,话题识别模块225可以在多个讨论话题网页上执行前述操作以按照讨论论坛话题对网页进行分组。在分组后,话题识别模块225可以使用上述方法来提取有关每一个讨论论坛的信息。过程400将所提取的信息与指向多个讨论论坛话题中的每一个的链接一起提供 (步骤430)。如前所述,从搜索引擎205接收的搜索结果包括包含针对多个讨论论坛话题的帖子的多个讨论话题网页。在显示设备中展现的搜索结果包括指向多个讨论话题网页的链接和与多个讨论话题网页相关联的摘录。在一些实施方式中,所提取的有关相应话题的信息如图5中所示邻近指向话题中的话题网页的链接显示。图5图示了在其中展现有关讨论论坛话题的讨论话题网页的信息的示例显示设备500。显示设备500可以是通过一个或多个网络220可操作地耦接到搜索引擎205和话题识别模块225的计算机系统215中的组件。在显示设备500中例如通过web浏览器显示的用户界面505可以包括用户可以将搜索查询输入其中的文本框510。作为响应,可以在用户界面505中例如在文本框510之下显示指向搜索引擎205识别的资源的链接。在图5的示例中,将搜索结果515限制为讨论话题网页。在其它实施方式中,可以将这样的结果515 与例如新闻结果或常规web搜索结果的其它结果包括在一起。在用户界面505中显示指向搜索引擎205识别的讨论话题网页的链接,即链接1、链接2和链接3。在每一个链接下方, 显示有关讨论论坛的信息。例如,图5示出了链接1指向的讨论话题网页是包括四个作者发表的九个帖子、最新帖子在3月17日接收的讨论论坛。如果可获得,还可以显示时刻。例如,当用户选择链接1时,web浏览器打开链接1指向的讨论话题网页。使用位于讨论话题网页上的向外链接,用户可以导航到话题中的其它帖子。在本说明书中描述的主题和功能操作的实施方式可以在数字电子电路中,或者在计算机软件、固件或硬件,包括在本说明书中公开的结构以及其结构等同物中,或者在以上的一个或多个的组合中实现。可以将在本说明书中描述的主题的实施例实现为一个或多个计算机程序产品,即编码在计算机可读介质上、由数据处理装置执行或控制数据处理装置的操作的一个或多个计算机程序指令模块。计算机可读介质可以是机器可读存储设备、机器可读存储基片、存储器设备或以上的一个或多个的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备以及机器,包括例如可编程处理器、计算机、或多个处理器或计算机。除硬件外,装置可以包括创建用于讨论中的计算机程序的执行环境的代码,例如构成处理器固件、协议堆栈、数据库管理系统、操作系统或以上一个或多个的组合的代码。计算机程序(也称作程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言编写,所述编程语言包括编译或解释语言、或者说明性或过程性语言,并且其可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或适于在计算环境中使用的其它单元。计算机程序不必对应于文件系统中的文件。可以将程序存储在保持其它程序或数据的文件(例如,存储在标记语言文档中的一个或多个脚本)的一部分、专用于讨论中的程序的单个文件或者多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件) 中。可以将计算机程序部署为在一个计算机上或者在位于一个地点或跨多个地点分布并且由通信网络互连的多个计算机上执行。在本说明书中描述的过程和逻辑流可以由执行一个或多个计算机程序的一个或多个可编程处理器执行以通过操作输入数据并且生成输出来执行功能。过程和逻辑流还可以由专用逻辑电路执行,以及装置还可以被实现为专用逻辑电路,所述专用逻辑电路例如 FPGA (场可编程门阵列)或ASIC (专用集成电路)。适于执行计算机程序的处理器包括例如通用和专用微处理器两者,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的主要元件是用于执行或运行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还包括用于存储数据的一个或多个海量存储设备,例如磁盘、磁光盘或光盘,或可操作地耦接以从所述一个或多个海量存储设备接收数据或向所述一个或多个海量存储设备传送数据,或两者。然而,计算机不必具有这样的设备。此外,可以将计算机嵌入另一个设备中,所述设备例如移动电话、个人数字助理(PDA)、移动音频播放器、全球定位系统(GPQ接收器或便携式存储设备(例如,通用串行总线(USB)闪存驱动),仅列出一些。适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及CD-ROM和 DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充,或合并入专用逻辑电路。为了提供与用户的交互,本说明书中描述的主题的实施方式可以在具有下述的计算机上实现用于向用户显示信息的显示设备,例如CRT (阴极射线管)或LCD (液晶显示) 监视器,以及用户通过其可以向计算机提供输入的键盘和指示设备,例如鼠标或跟踪球。也可以使用其它类型的设备来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感知反馈,例如视觉反馈、听觉反馈或触觉反馈;以及可以以任何形式,包括声学的、话音或触觉的输入,接收来自用户的输入。另外,计算机可以通过将文档发送给用户所使用的设备以及从用户所使用的设备接收文档来与用户交互;例如,通过响应于从web浏览器接收的请求将网页发送给用户的客户端设备上的web浏览器。本说明书中描述的主题的实施方式可以在包括例如作为数据服务器的后端组件、 或者包括例如应用服务器的中间件组件、或者包括例如具有用户通过其可以与在本说明书
13中描述的主题的实施方式交互的图形用户界面或Web浏览器的客户端计算机的前端组件、 或者一个或多个这样的后端、中间件或前端组件的任何组合的计算系统中实现。系统的组件可以通过例如通信网络的任何形式或介质的数字数据通信互连。通信网络的示例包括局域网(〃 LAN")和广域网(“WAN"),例如因特网。虽然本说明书包含许多细节,但是这些细节不应当被解释为对本说明书或可以主张的内容的范围的限制,而应当被解释为对具体到本说明书的特定实施方式的特征的描述。还可以将在本说明书中在分立的实施方式的情境中描述的某些特征组合在单个实施方式中实现。相反地,也可以将在单个实施方式的情境中描述的各种特征分离地在多个实施方式中实现或在任何适当的子组合中实现。此外,尽管可能在上面将特征描述为在某些组合中起作用,甚至最初主张如此,但是可以在一些情况下将来自所主张的组合的一个或多个特征从组合中删去,并且可以将所主张的组合指向子组合或者子组合的变体。类似地,虽然在附图中以特定顺序描绘了操作,但是不应当将这理解为需要以所示的特定顺序或者以连续顺序执行这样的操作、或者需要执行所有图示的操作才能达到期望的结果。在某些情况下,多任务以及并行处理可以是有利的。此外,不应当将在上述实施方式中的各种系统组件的分离理解为在所有实施方式中均需要这样的分离,而应当理解的是,通常可以将所描述的程序组件和系统集成到一起成为单个软件产品或封装为多个软件产品。因此,已经描述了本说明书的特定实施方式。其它实施方式在所附权利要求的范围内。例如,可以以不同的顺序来执行权利要求中记载的动作并且仍然达到期望的结果。搜索引擎将排名与搜索结果中的资源进行关联,每一个排名表示资源与搜索查询的相关性。 因此,包括在搜索结果中的讨论话题网页具有相关联的排名。在将显示在用户界面上的搜索结果限制在讨论话题网页时,可以基于讨论话题网页的下降排名按照降序显示指向讨论话题网页的链接。
权利要求
1.一种系统,包括 一个或多个计算机;以及计算机可读介质,所述计算机可读介质有形地编码在被执行时可操作来促使所述一个或多个计算机执行操作的计算机程序,所述操作包括接收识别已由搜索引擎识别为符合搜索查询的多个资源的信息; 将所述多个资源中的第一资源识别为包括讨论论坛的帖子;识别每一个均不同于所述第一资源的一个或多个第二资源,每一个第二资源被直接或间接地链接到所述第一资源,每一个第二资源包括所述讨论论坛的一个或多个其它帖子; 从所述第一资源和所述一个或多个第二资源提取有关所述讨论论坛的信息;以及将所提取的信息与指向所述第一资源的链接一起提供给用户设备以作为对所述搜索查询的响应的一部分向用户显示。
2.根据权利要求1所述的系统,其中所述一个或多个第二资源至少部分基于所述第一资源和每一个第二资源共享的一个或多个属性来识别,用于识别所述一个或多个第二资源的所述操作进一步包括确定所述第一资源的属性的值; 识别与所述属性相关联的其它资源; 确定所述其它资源的所述属性的值;以及如果所识别的资源的所述属性的所述值等于所述第一资源的所述属性的所述值,则将所识别的资源指定为第二资源。
3.根据权利要求2所述的系统,其中所述一个或多个属性包括所述多个帖子被提供到所述讨论论坛的时间和提供所述多个帖子的作者。
4.根据权利要求3所述的系统,其中所提取的信息包括向所述讨论论坛提供所述帖子和一个或多个其它帖子的作者的数量、提供最近帖子的时间、由相同作者提供的帖子的数量以及对帖子的回复的数量。
5.根据权利要求3所述的系统,其中已由所述搜索引擎识别的所述多个资源包括所述一个或多个第二资源中的至少一个。
6.根据权利要求1所述的系统,其中包括在所述第一资源中的所述帖子包括相关联的第一时间戳,所述第一时间戳表示所述第一帖子被提供到所述讨论论坛的时间。
7.根据权利要求6所述的系统,其中包括在所述一个或多个第二资源中的所述一个或多个其它帖子在包括在所述第一资源中的所述帖子的所述时间之前或之后的时间被提供。
8.一种计算机实现的方法,包括接收识别已由搜索引擎识别为符合搜索查询的多个资源的信息; 将所述多个资源中的第一资源识别为包括讨论论坛的帖子;识别每一个均不同于所述第一资源的一个或多个第二资源,每一个第二资源被直接或间接地链接到所述第一资源,每一个第二资源包括所述讨论论坛的一个或多个其它帖子; 从所述第一资源和所述一个或多个第二资源提取有关所述讨论论坛的信息;以及将所提取的信息与指向所述第一资源的链接一起提供给用户设备以作为对所述搜索查询的响应的一部分向用户显示。
9.根据权利要求8所述的方法,其中所述一个或多个第二资源至少部分基于所述第一资源和每一个第二资源共享的一个或多个属性来识别,所述方法进一步包括 确定所述第一资源的属性的值; 识别与所述属性相关联的其它资源; 确定所述其它资源的所述属性的值;以及如果所识别的资源的所述属性的所述值等于所述第一资源的所述属性的所述值,则将所识别的资源指定为第二资源。
10.根据权利要求9所述的方法,其中所述一个或多个属性包括所述多个帖子被提供到所述讨论论坛的时间和提供所述多个帖子的作者。
11.根据权利要求10所述的方法,其中所提取的信息包括向所述讨论论坛提供所述帖子和一个或多个其它帖子的作者的数量、提供最近帖子的时间、由相同作者提供的帖子的数量以及对帖子的回复的数量。
12.根据权利要求10所述的方法,其中已由所述搜索引擎识别的所述多个资源包括所述一个或多个第二资源中的至少一个。
13.根据权利要求8所述的方法,其中包括在所述第一资源中的所述帖子包括相关联的第一时间戳,所述第一时间戳表示所述第一帖子被提供到所述讨论论坛的时间。
14.根据权利要求13所述的方法,其中包括在所述一个或多个第二资源中的所述一个或多个其它帖子在包括在所述第一资源中的所述帖子的所述时间之前或之后的时间被提 {共。
15.一种系统,包括 一个或多个计算机;以及计算机可读介质,所述计算机可读介质有形地编码在被执行时可操作来促使所述一个或多个计算机执行操作的计算机程序,所述操作包括 接收请求对讨论论坛进行搜索的请求和搜索查询; 从搜索引擎接收识别符合所述搜索查询的多个资源的信息; 识别所述多个资源之中的多个讨论话题网页; 从所述多个讨论话题网页识别多个讨论论坛;从所述多个讨论话题网页提取有关所述多个讨论论坛中的每一个的信息;以及将所提取的信息与指向所述多个讨论论坛中的每一个的链接一起提供给用户设备以作为对所述搜索查询的响应的一部分向用户显示。
16.根据权利要求15所述的系统,其中从所述多个讨论话题网页识别所述多个讨论论坛包括识别指向第一讨论话题网页的第一链接;识别指向第二讨论话题网页的第二链接,其中所述第一链接和所述第二链接指向相同讨论论坛;以及确定所述第一讨论话题网页包括指向所述第二讨论话题网页的链接,将所述第一讨论话题网页和所述第二话题网页指定为来自相同讨论论坛。
17.根据权利要求15所述的系统,其中每一个讨论话题网页包括相应讨论论坛的一个或多个帖子,以及其中所述搜索引擎已确定包括在讨论话题网页中的至少一个帖子符合所述搜索查询。
18.根据权利要求15所述的系统,其中所述搜索引擎提供针对所述多个讨论话题网页的相应多个排名,所述操作进一步包括按照所述多个排名的降序形式显示包括指向所述多个讨论论坛中的每一个的所述链接的多个链接,以使指向包括带有最高排名的讨论话题网页的讨论论坛的链接被最先显示 ο
19.一种计算机实现的方法,包括接收请求对讨论论坛进行搜索的请求和搜索查询; 从搜索引擎接收识别符合所述搜索查询的多个资源的信息; 识别所述多个资源之中的多个讨论话题网页; 从所述多个讨论话题网页识别多个讨论论坛;从所述多个讨论话题网页提取有关所述多个讨论论坛中的每一个的信息;以及将所提取的信息与指向所述多个讨论论坛中的每一个的链接一起提供给用户设备以作为对所述搜索查询的响应的一部分向用户显示。
20.根据权利要求19所述的方法,其中从所述多个讨论话题网页识别所述多个讨论论坛包括识别指向第一讨论话题网页的第一链接;识别指向第二讨论话题网页的第二链接,其中所述第一链接和所述第二链接指向相同讨论论坛;以及确定所述第一讨论话题网页包括指向所述第二讨论话题网页的链接,将所述第一讨论话题网页和所述第二话题网页指定为来自相同讨论论坛。
21.根据权利要求19所述的方法,其中每一个讨论话题网页包括相应讨论论坛的一个或多个帖子,以及其中所述搜索引擎已确定包括在讨论话题网页中的至少一个帖子符合所述搜索查询。
22.根据权利要求19所述的方法,其中所述搜索引擎提供针对所述多个讨论话题网页的相应多个排名,所述操作进一步包括按照所述多个排名的降序形式显示包括指向所述多个讨论论坛中的每一个的所述链接的多个链接,以使指向包括带有最高排名的讨论话题网页的讨论论坛的链接被最先显示 ο
23.—种编码有包括在由数据处理装置执行时促使所述数据处理装置执行操作的指令的计算机程序的计算机存储介质,所述操作包括接收识别已由搜索引擎识别为符合搜索查询的多个资源的信息; 将所述多个资源中的第一资源识别为包括讨论论坛的帖子;识别每一个均不同于所述第一资源的一个或多个第二资源,每一个第二资源被直接或间接地链接到所述第一资源,每一个第二资源包括所述讨论论坛的一个或多个其它帖子; 从所述第一资源和所述一个或多个第二资源提取有关所述讨论论坛的信息;以及将所提取的信息与指向所述第一资源的链接一起提供给用户设备以作为对所述搜索查询的响应的一部分向用户显示。
24.一种编码有包括在由数据处理装置执行时促使所述数据处理装置执行操作的指令的计算机程序的计算机存储介质,所述操作包括接收请求对讨论论坛进行搜索的请求和搜索查询; 从搜索引擎接收识别符合所述搜索查询的多个资源的信息; 识别所述多个资源之中的多个讨论话题网页; 从所述多个讨论话题网页识别多个讨论论坛;从所述多个讨论话题网页提取有关所述多个讨论论坛中的每一个的信息;以及将所提取的信息与指向所述多个讨论论坛中的每一个的链接一起提供给用户设备以作为对所述搜索查询的响应的一部分向用户显示。
全文摘要
用于响应于搜索查询而提供针对讨论话题的帖子的系统、方法和装置,包括计算机程序产品。方法包括接收识别已由搜索引擎识别为符合搜索查询的多个资源的信息;将多个资源中的第一资源识别为包括讨论论坛的帖子;以及识别每一个均不同于第一资源的一个或多个第二资源。每一个第二资源被直接或间接地链接到第一资源并且包括讨论论坛的一个或多个其它帖子。此外,方法包括从第一资源和一个或多个第二资源提取有关讨论论坛的信息;以及将所提取的信息与指向第一资源的链接一起提供给用户设备以作为对搜索查询的响应的一部分向用户显示。
文档编号G06F17/30GK102171689SQ200980138710
公开日2011年8月31日 申请日期2009年7月31日 优先权日2008年8月1日
发明者乔纳森·威尔森, 托米斯拉夫·纳德 申请人:谷歌公司

最新回复(0)