网页修复方法、终端、服务器及系统的制作方法
【技术领域】
[0001]本申请涉及计算机技术领域,具体涉及终端技术领域,尤其涉及网页修复方法、终端、服务器及系统。
【背景技术】
[0002]现有技术中,用户在使用浏览器进行浏览和搜索过程中,经常出现一些因为网络负载过大等原因造成的网页无法显示的问题,用户无法获知网页的信息;当用户希望访问的网页失效(例如网址发生变化或包含风险内容)时,用户也无法通过原网址获取信息。现有的浏览器只向用户返回错误代码,无法提供网页内容相关的信息,从而影响了用户通过浏览器搜索和浏览的效率。
【发明内容】
[0003]鉴于上述现有技术中的缺陷或不足,期望能够提供一种对无法访问的网页进行修复的方法。进一步地,还期望所修复的网页能够提供更多的有效信息。为了实现上述一个或多个目的,本申请提供了网页修复方法、终端、服务器及系统。
[0004]一方面,本申请提供了一种网页修复方法,包括:如果当前访问的网页为失效网页,向快照服务器发送快照请求信息,以供快照服务器查找匹配的网页;接收快照服务器反馈的匹配的网页;向智能服务器发送匹配的网页,以供智能服务器对所述匹配的网页进行安全过滤;检测从智能服务器接收的过滤后的网页内容中是否包含有效信息;以及如果从智能服务器接收的过滤后的网页内容中包含有效信息,向用户提供修复网页的接口。
[0005]在某些实现方式中,快照请求信息至少包括当前访问的网页的统一资源定位符以及访问时间。
[0006]在某些实现方式中,网页修复方法还包括:响应于用户修复网页的操作,对网页进行修复。
[0007]第二方面,本申请提供了一种网页修复方法,包括:接收终端发送的快照请求信息;基于快照请求查找匹配的网页;以及将查询结果发送至终端,以供终端将匹配的网页发送至智能服务器进行安全过滤。
[0008]在某些实现方式中,快照请求信息至少包括当前访问的网页的统一资源定位符以及访问时间。
[0009]在某些实现方式中,基于快照请求查找匹配的网页,包括:在已存储的网页中查询与当前访问的网页的URL相同且保存时间与所述访问时间最接近的网页。
[0010]第三方面,本申请提供了一种网页修复方法,包括:接收终端发送的网页;对网页进行安全过滤;以及将过滤后的网页发送至终端。其中,网页为快照服务器基于终端的快照请求信息查找到的匹配的网页,快照请求信息由终端响应于确定当前访问的网页为失效网页而发送。
[0011]在某些实现方式中,快照请求信息至少包括当前访问的网页的统一资源定位符以及访问时间。
[0012]在某些实现方式中,对网页进行安全过滤,包括:基于预先训练的模型计算网页的安全值;判断安全值是否超过预设安全阈值;以及如果未超过,则基于关键词库对网页进行过滤。
[0013]第四方面,本申请提供了一种终端,包括:第一发送单元,用于在当前访问的网页为失效网页时,向快照服务器发送快照请求信息,以供快照服务器查找匹配的网页;接收单元,用于接收快照服务器反馈的匹配的网页;第二发送单元,用于向智能服务器发送匹配的网页,以供智能服务器对匹配的网页进行安全过滤;检测单元,用于检测从智能服务器接收的过滤后的网页内容中是否包含有效信息;以及处理单元,用于响应于从智能服务器接收的过滤后的网页内容中包含有效信息,向用户提供修复网页的接口。
[0014]在某些实现方式中,快照请求信息至少包括当前访问的网页的统一资源定位符以及访问时间。
[0015]在某些实现中,终端还包括修复单元,用于响应于用户修复网页的操作,对网页进行修复。
[0016]第五方面,本申请提供了一种服务器,包括:接收单元,用于接收终端发送的快照请求信息;查找单元,用于基于快照请求查找匹配的网页;以及发送单元,用于将查询结果发送至终端,以供终端将匹配的网页发送至具有过滤功能的服务器进行安全过滤。
[0017]在某些实现方式中,快照请求信息至少包括当前访问的网页的统一资源定位符以及访问时间;查找单元用于按如下方式查找匹配的网页:在已存储的网页中查询与当前访问的网页的URL相同且保存时间与访问时间最接近的网页。
[0018]第六方面,本申请提供了一种服务器,包括:接收单元,用于接收终端发送的网页;过滤单元,用于对网页进行安全过滤;以及发送单元,用于将过滤后的网页发送至终端。其中,网页为基于终端的快照请求信息查找到的匹配的网页,快照请求信息由终端响应于确定当前访问的网页为失效网页而发送。
[0019]在某些实现方式中,快照请求信息至少包括当前访问的网页的统一资源定位符以及访问时间。
[0020]在某些实现方式中,过滤单元用于按如下方式对网页进行安全过滤:基于预先训练的模型计算网页的安全值;判断安全值是否超过预设安全阈值;如果未超过,则基于关键词库对网页进行过滤。
[0021]第七方面,本申请提供了一种网页修复系统,包括如本申请第四方面所提供的终端、第五方面所提供的服务器以及第六方面所提供的服务器。
[0022]本申请提供的网页修复方法、终端、服务器及系统,通过对失效网页进行快照查找和安全过滤,获取失效网页的信息,提升了浏览器获取信息的能力,并且可以保证所获取的信息安全有效,进而提升了用户通过浏览器搜索和浏览的效率。
【附图说明】
[0023]通过阅读参照以下附图所作的对非限制性实施例详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0024]图1示出了可以应用本申请实施例的示例性系统架构;
[0025]图2示出了根据本申请一个实施例的网页修复方法的示例性流程图;
[0026]图3示出了根据本申请另一个实施例的网页修复方法的示例性流程图;
[0027]图4示出了根据本申请再一个实施例的网页修复方法的示例性流程图;
[0028]图5示出了在浏览器中应用网页修复方法的效果示意图;
[0029]图6示出了根据本申请一个实施例的终端的结构示意图;
[0030]图7示出了根据本申请一个实施例的服务器的结构示意图;
[0031]图8示出了根据本申请另一个实施例的服务器的结构示意图;
[0032]图9示出了根据本申请一个实施例的网页修复系统的结构示意图;
[0033]图10示出了基于本申请一个实施例的网页修复系统中的数据交互示意图。
【具体实施方式】
[0034]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0035]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0036]图1示出了可以应用本申请实施例的示例性系统架构100。
[0037]如图1所示,系统架构100可以包括终端设备101、102、网络103和服务器104、105。网络103用以在终端设备101、102和服务器104、105之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0038]用户110可以使用终端设备101、102通过网络103与服务器104、105交互,以接收消息或发送指令。终端设备101、102上可以安装有浏览器,用户通过浏览器获取网络103所传送的消息。
[0039]终端设备101、102可以是各种电子设备,包括但不限于个人电脑、智能手机、智能手表、平板电脑、个人数字助理等等。
[0040]服务器104、105可以对接收到的数据进行存储、分析等处理,并将处理结果反馈给终端设备。
[
0041]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0042]请参考图2,其示出了根据本申请一个实施例的网页修复方法的示例性流程图。本实施例中以该方法应用于浏览器中来举例说明,该浏览器可以安装于具有网络连接功能的电子设备中,例如可以安装于智能手机、平板电脑、膝上型便携计算机和台式计算机中。
[0043]如图2所示,在步骤201中,如果当前访问的网页为失效网页,向快照服务器发送快照请求信息,以供快照服务器查找匹配的网页。
[0044]在本实施例中,当用户发起访问网页的请求时,终端可以根据请求中的网址在网页服务器中查找对应的网页,并将查找结果呈现给用户。如果用户所访问的网页为有效的网页,则终端可以从网页服务器中查找到对应的网页内容,将网页内容提供给用户。如果用户当前访问的网页为失效网页,例如用户当前访问的网页的网址发生了变化,或由于网页存在安全风险,网页服务器未返回结果,则终端可以向快照服务器发送快照请求信息,请求快照服务器在保存的网页快照中查询与当前访问的失效网页匹配的网页。
[0045]在一些可选的实现方式中,快照请求信息可以至少包括当前访问的网页的统一资源定位符(Uniform Resource Locator,URL)以及访问时间。则快照服务器可以查找与网页URL匹配的网页快照,并从与网页URL匹配的网页快照中选取快照保存时间与访问时间最接近的网页快照作为匹配的网页。
[0046]可选地,快照请求信息中还可以包括超文本传输协议状态码(HTTP状态码)。HTTP状态码是用以表示网页服务器HTTP响应状态的3位数字代码,可以包括五种状态:消息、成功、重定向、请求错误以及服务器错误。其中,重定向、请求错误以及服务器错误表示无法通过当前的网址访问网页。则快照服务器可以进一步根据HTTP状态码判断网页的失效原因,并根据失效原因进一步查找匹配的网页。例如当浏览器返回的HTTP状态码为403,则表示网页服务器拒绝对访问网页的请求进行处理。如果返回的HTTP连接状态中包含拒绝的原因,快照服务器可以根据网页服务器拒绝的原因对所查找到的与网页URL匹配的网页快照进行筛选,并向终端返回筛选后的结果。
[0047]在步骤202中,接收快照服务器反馈的匹配的网页。
[0048]在本实施例中,终端可以通过网络设备接收由快照服务器查找到的匹配的网页。具体地,快照服务器可以通过网络设备向终端发送连续的数据,终端在接收到数据后进行处理,将数据还原为快照服务器所查找到的匹配的网页。
[0049]在一些可选的实现方式中,终端可以对快照服务器返回的数据进行判断,如果快照服务器返回的数据中包含网页数据,则可以从中提取网页数据并还原网页;如果快照服务器返回的数据中不包含网页数据,则快照服务器未查找到匹配的网页,当前访问的网页无法修复。
[0050]在步骤203中,向智能服务器发送匹配的网页,以供智能服务器对匹配的网页进行安全过滤。
[0051]在本实施例中,终端可以根据快照服务器的反馈结果,向智能服务器发起过滤请求,以过滤网页中不合法的内容。
[0052]可选地,终端向智能服务器发送的过滤请求中可以包含过滤关键字,例如“赌博”、“恐怖主义”等,以便浏览器基于过滤关键字对网页内容进行过滤。
[0053]智能服务器接收到终端发送的匹配的网页之后,可以对首先对网页的内容进行解析。例如可以将网页中的文字内容、图片内容和视频内容分别提取出来。之后,可以基于不同的方法对解析后的网页内容进行安全过滤。例如,可以基于关键字匹配技术查找网页的文字内容中包含的过滤关键字,可选地,还可以采用模糊匹配的方法对文字内容中包含的与关键字相近的词过滤。又例如,可以对图片内容进行特征提取和纹理分析,基于预设的非法图像特征集合对图片内容进行过滤。具体地,可以将提取出的图像特征与预设的非法图像特征集合中的图像特征进行匹配,然后滤除匹配的图像纹理或包含该图像纹理的图片内容。也可以对网页中的视频链接是否合法进行判断,如果视频链接为不合法的链接,则可以将该视频链接从网页中过滤。可选地,过滤的方式可以为删除或覆盖。
[0054]在一些可选的实现方式中,智能服务器可以采用机器学习的方法对网页内容进行安全过滤。例如,智能服务器可以基于数据库中的合法网页、不合法网页以及经人工过滤的网页建立样本集,分别对合法网页、不合法网页和经人工过滤的网页的内容进行分析,然后基于网页的内容进行训练,得出过滤模型。在实际应用时,可以对当前访问的网页内容进行分析,将网页内容输入该过滤模型进行过滤,得出安全、合法的网页内容。
[0055]在步骤204中,检测从智能服务器接收的过滤后的网页内容中是否包含有效信息。
[0056]在本实施例中,终端可以从智能服务器接收数据,并检测接收到的数据中是否包含匹配的网页的有效信息。具体地,如果步骤202中快照服务器查找到的匹配的网页在步骤203中被智能服务器全部过滤,即匹配的网页中的信息被完全屏蔽,则智能服务器可以向终端发送消息,该消息中不包含网页的有效信息。如果步骤202中快照服务器查找到的匹配的网页在步骤203中被智能服务器部分过滤,则终端从智能服务器接收的数据中可以包含经过滤的网页内容,其中包含网页的有效信息。
[0057]终端在接收到智能服务器发送的数据后,可以对数据进行解析,并分析其中是否包含与网页内容相关的信息,即有效信息。可选地,智能服务器返回的数据中还可以包括状态信息。状态信息可以用于指示网页的过滤结果,例如网页是否被完全屏蔽。终端还可以根据智能服务器返回的状态信息判断过滤后的网页内容中是否包含有效信息。
[0058]在步骤205中,如果从智能服务器接收的过滤后的网页内容中包含有效信息,向用户提供修复网页的接口。
[0059]如果步骤204中终端检测到从智能服务器接收的过滤后的网页内容中包含有效信息,则可以确定网页可修复。这时,终端可以将接收到的网页内容添加至缓存中,并向用户提供修复网页的接口。该接口可以以弹窗形式呈现在终端的浏览器中。例如在浏览器的边缘位置配置“修复网页”的弹出窗口。
[0060]在一些实施例中,上述网页修复方法还可以包括:响应于用户修复网页的操作,对网页进行修复。
[0061]用户可以通过终端所提供的接口获知当前访问的失效网页可以修复。如果用户希望进一步获取相关的信息,则可以执行修复网页的操作。该操作可以通过终端所提供的修复网页的接口来实现。具体地,当用户选择修复网页(例如点击“修复网页”)时,终端可以向用户展示缓存的网页内容,从而实现网页的修复。
[0062]本申请上述实施例提供的网页修复方法,终端可以接收快照服务器查找到的与失效网页匹配的网页,并通过智能服务器对匹配的网页进行安全过滤,可以获取失效网页的信息,实现网页的修复,提升了浏览器获取信息的能力,并且可以保证所获取的信息安全有效。
[0063]进一步参考图3,其示出了根据本申请另一个实施例的网页修复方法的示例性流程图。
[0064]如图3所示,在步骤301中,接收终端发送的快照请求信息。
[0065]搜索引擎在收录网页时可以将网页的备份保存在快照服务器中。在本实施例中,当终端检测到用户当前访问的网页为失效网页时,可以向快照服务器发送快照请求信息,以获取当前访问的网页的快照。快照服务器可以通过网络设备从终端接收快照请求信息。该网络设备可以包括网线、无线路由器、光纤电缆等传输数据的设备。
[0066]在一些实现中,快照请求信息可以至少包括当前访问的网页的URL以及访问时间。进一步地,快照请求信息还可以包括HTTP状态码。在一些实现中,快照请求信息中还可以包括访问网页的网络互联协议(Internet Protocol,IP)地址。
[0067]在步骤302中,基于快
照请求信息查找匹配的网页。
[0068]在本实施例中,快照服务器可以根据快照请求在已存储的网页快照中进行查找。当快照请求中包含当前访问的网页的URL以及访问时间时,快照服务器可以在已存储的网页中查找与当前访问的网页的URL相同的网页。由于快照服务器可以保存不同时间的网页备份,即保存同一网页的多个不同时间的备份,因此快照服务器可以根据失效的网页的URL查找到多个网页快照。进一步地,快照服务器可以基于访问时间从查找到的多个网页快照中选择保存时间与访问时间最接近的网页最为匹配的网页。
[0069]在一些实现中,快照服务器可以在已存储的网页中查找与当前访问的网页的URL相似的网页。网页URL的相似度计算可以如下进行:提取URL中的站点特征和目录特征,基于站点特征和目录特征计算URL间的相似度。这样,可以得出与当前访问的网页URL相似的网页。之后,快照服务器可以基于网页内容的特征对相似的网页进行筛选,例如可以基于网页的标题、关键词等筛选出与当前访问的网页最匹配的网页。
[0070]在步骤303中,将查询结果发送至终端,以供终端将匹配的网页发送至智能服务器进行安全过滤。
[0071 ] 在本实施例中,快照服务器可以将查询的结果通过网络发送至终端。如果步骤302中快照服务器未查找到匹配的网页,则可以向终端发送消息,该消息可以指示快照服务器的查询结果为无匹配的网页。终端可以根据接收到的消息确定网页无法修复。
[0072]如果步骤302中快照服务器查找到一个或多个匹配的网页,则可以将查找到的网页作为查询结果发送给终端。终端在接收到查询结果之后,可以将一个或多个匹配的网页发送至智能服务器进行安全过滤。可选地,快照服务器还可以向终端发送消息,告知终端查找到匹配的网页。则终端可以根据该消息向智能服务器发起网页过滤请求。
[0073]智能服务器可以根据过滤关键词等预设的过滤规则对终端发送的网页进行过滤。具体地,可以首先对网页内容进行分析处理,例如分词处理,然后基于过滤关键词库进行匹配,将匹配的关键词从网页中滤除。过滤的方式可以为覆盖或删除。也可以提取网页中的图片和视频,基于预设的图片库和视频库对图片和视频进行过滤。在一些实现中,网页中可能包含不合法的链接,智能服务器可以提取网页中的链接,检测链接是否与不合法链接库中的链接匹配,如果匹配,则将链接从网页中滤除。
[0074]进一步地,智能服务器可以采用合法的网页内容替换不合法的网页内容。例如可以选取与网页内容相关的合法的词语、图片、视频和链接替换不合法的词语、图片、视频和链接。从而尽可能地恢复网页原来的信息,并保证信息的合法性和安全性。
[0075]本申请的上述实施例中,在用户当前访问的网页失效时,快照服务器可以基于终端发送的快照请求查找到失效的网页匹配的网页快照,并进一步将查找到的网页快照返回终端,以供终端将网页快照发送至智能服务器进行过滤,实现对失效的网页的修复,从而使用户通过快照服务器的查询结果获取更多的信息。
[0076]进一步参考图4,其示出了根据本申请再一个实施例的网页修复方法的示例性流程图。
[0077]如图4所示,在步骤401中,接收终端发送的网页。
[0078]终端发送的网页可以为快照服务器基于终端的快照请求信息查找到的匹配的网页。快照请求信息可以由所述终端响应于确定当前访问的网页为失效网页而发送。
[0079]在本实施例中,如果用户当前访问的网页为失效网页,则终端可以向快照服务器发出快照请求信息。快照请求信息可以包括失效网页的相关信息以及访问的相关信息,例如失效网页的HTTP状态码、用户IP地址等。在一些实现中,快照请求信息至少可以包括当前访问的网页的统一资源定位符以及访问时间快照服务器可以基于快照请求信息中的URL、时间以及IP地址查找与失效网页匹配的网页。查找到之后,快照服务器可以向终端发送匹配的网页。终端可以将匹配的网页发送给智能服务器。智能服务器可以通过网络接收终端发送的匹配的网页。
[0080]在步骤402中,对网页进行安全过滤。
[0081]在本实施例中,智能服务器可以基于过滤关键词等预设的过滤规则对终端发送的网页进行过滤。具体地,可以首先对网页内容进行分析处理,例如分词处理,然后基于过滤关键词库进行匹配,将匹配的关键词从网页中滤除。对网页的分析处理也可以为提取网页中的图片和视频。然后可以基于预设的图片库和视频库对图片和视频进行过滤。在一些实现中,智能服务器可以提取网页中的链接,检测链接是否与不合法链接库中的链接匹配,如果匹配,则可以将链接从网页中滤除。
[0082]在一些可选的实现方式中,对网页进行安全过滤可以通过如下方式进行:首先基于预先训练的模型计算所述网页的安全值,然后判断安全值是否超过预设安全阈值,如果未超过,则基于关键词库对网页进行过滤;如果超过,则可以将网页发送至过滤服务器,以进行人工分析。可以利用大量未经过滤的网页和经过人工过滤的网页作为训练样本进行训练。其中,人工过滤的网页可以被划分为低安全等级、中安全等级和高安全等级。低安全等级的网页可以为风险较高的网页,需要深度分析和人工分析。中安全等级的网页可以为可基于关键词库、关键图片库、关键视频库以及关键链接库过滤的网页,尚安全等级的网页可以为无需过滤的网页。每个安全等级对应不同的安全值区间。在应用时,可以首先基于训练好的安全值计算模型计算待过滤的网页的安全值,然后根据安全值所属的区间确定待过滤网页的安全等级。可选地,当待过滤网页的安全值未超过预设安全阈值时,可以认为待过滤的网页为中安全等级的网页。该预设安全阈值可以基于大数据量的样本训练得出。可以基于关键词库、关键图片库、关键视频库和关键链接库对网页中的关键词、关键图片、关键视频和关键链接进行过滤,删除或覆盖网页中的关键词、关键图片、关键视频以及关键链接。
[0083]当待过滤网页的安全值超过预设安全阈值时,可以认为待过滤的网页为低安全等级的网页,这时可以将网页发送至后台的过滤服务器,以对网页进行人工分析。
[0084]进一步地,智能服务器可以选取与网页内容相关的其他词语,图片、视频和链接替换网页中的关键词、关键图片、关键视频和关键链接。从而尽可能地恢复网页原来的信息,并保证信息的合法性和安全性。
[0085]在步骤403中,将过滤后的网页发送至终端。
[0086]在本实施例中,智能服务器在对网页进行安全过滤之后,可以通过网络将过滤后的网页发送至终端。过滤后的网页可以包含用户感兴趣的有效信息,且安全性高。终端在接收到智能服务器反馈的网页之后,可以向用户提供修复网页的接口。当用户通过接口发出修复网页的指令时,终端可以将从智能服务器接收到的过滤后的网页显示在浏览器界面中,从而为用户提供与失效网页内容相关的信息。
[0087]上述结合图4描述实施例中,智能服务器对终端从快照服务器获取的失效网页的网页快照进行安全过滤,可以实现对失效网页的修复,同时保证修复的网页信息的安全性和合法性。
[0088]需要说明的是,上述结合图2、图3、图4所描述的实施例中,快照服务器和智能服务器可以为同一服务器。这个服务器可以集成快照查找功能和安全过滤功能。这时,服务器在基于快照请求查找出的匹配的网页之后,可以向终端发送匹配的网页,之后由终端对网页的内容是否有效进行检测之后反馈给服务器。在一些实现中,服务器也可以直接对查找出的匹配的网页进行安全过滤,并将过滤后的网页发送给终端,无需将查找结果反馈给终端。
[0089]进一步参考图5,其示出了在浏览器中应用网页修复方法的效果示意图。如图5所示,浏览器510在打开网页时,网页服务器向浏览器510返回连接状态511。连接状态511中,当前访问的网页的HTTP状态码为“404 Not Found”,即浏览器510未从网页服务器获取所请求的网页信息。这时,可以认为用户所请求的网页为失效网页。浏览器510可以向快照服务器发起
请求,快照服务器可以基于请求查找与用户请求的网页最相似的网页并将查找结果反馈给浏览器510。之后浏览器可以将快照服务器返回的网页发送至智能服务器进行过滤,并接收由智能服务器过滤后的网页。这时,浏览器510可以在网页中生成弹出窗口 512,提示用户该网页可以修复,并询问是否查看修复的网页。当用户选择“是”时,浏览器510可以在当前的页面中显示从智能服务器接收的网页。
[0090]进一步参考图6,其示出了根据本申请一个实施例的终端的结构示意图。如图6所示,终端可以包括第一发送单元601、接收单元602、第二发送单元603、检测单元604以及处理单元605。其中,第一发送单元601可以用于在当前访问的网页为失效网页时,向快照服务器发送快照请求信息,以供快照服务器查找匹配的网页。接收单元602可以用于接收快照服务器反馈的匹配的网页。第二发送单元603可以用于向智能服务器发送匹配的网页,以供智能服务器对匹配的网页进行安全过滤。检测单元604可以用于检测从智能服务器接收的过滤后的网页内容中是否包含有效信息。处理单元605可以用于响应于从智能服务器接收的过滤后的网页内容中包含有效信息,向用户提供修复网页的接口。可选地,智能服务器和快照服务器可以为同一服务器。该服务器可以具有快照查找功能和安全过滤功能。
[0091]第一发送单元601发送的快照请求信息可以包括用户当前访问的网页的相关信息,例如HTTP状态码、IP地址等。在一些实现中,快照请求信息可以至少包括所述当前访问的网页的统一资源定位符以及访问时间。
[0092]在一些实现中,接收单元602还可以通过网络接快照服务器返回的消息,并根据接收到的消息判断快照服务器是否查询到匹配的网页。在确定快照服务器查询到匹配的网页时通过网络接收快照服务器发送的网页数据。处理单元605可以在浏览器中配置接口。用户可以通过处理单元605配置的接口选择修复网页。
[0093]在一些实施例中,终端600还可以包括修复单元606(未示出)。修复单元606可以用于响应于用户修复网页的操作,对网页进行修复。
[0094]上述实施例提供的终端,通过向快照服务器发起快照请求,接收快照服务器返回的匹配的网页,之后将匹配的网页发送至智能服务器进行安全过滤,最后从智能服务器接收过滤后的网页,能够实现对由于网页过期、网页服务器负载过大等原因而无法访问的网页的修复,获取失效网页的信息,提升了浏览器获取信息的能力,并且可以保证所获取的信息安全有效。
[0095]进一步参考图7,其示出了根据本申请一个实施例的服务器的结构示意图。如图7所示,服务器700可以包括接收单元701、查找单元702以及发送单元703。其中接收单元701可以用于接收终端发送的快照请求信息。查找单元702可以用于基于接收单元701接收到的快照请求信息查找匹配的网页。发送单元703可以用于将查询结果发送至终端,以供终端将匹配的网页发送至具有过滤功能的服务器进行安全过滤。
[0096]在一些可选的实现方式中,快照请求信息可以至少包括当前访问的网页的统一资源定位符以及访问时间。查找单元702可以用于按如下方式查找匹配的网页:在已存储的网页中查询与当前访问的网页的URL相同且保存时间与访问时间最接近的网页,将查找到的网页作为匹配的网页。
[0097]上述结合图7描述的实施例所提供的服务器,可以对终端发送的快照请求进行处理,查找与用户访问的失效网页相匹配的网页,并将相匹配的网页发送给终端。可以获取与失效网页相关的信息,提升了浏览器获取信息的能力。
[0098]进一步参考图8,其示出了根据本申请另一个实施例的服务器的结构示意图。如图8所示,服务器800可以包括接收单元801、过滤单元802以及发送单元803。接收单元801可以用于接收终端发送的网页。过滤单元802可以用于对网页进行安全过滤。发送单元803可以用于将过滤后的网页发送至终端。其中接收单元801所接收的网页可以为基于终端的快照请求信息查找到的匹配的网页。快照请求信息可以由终端响应于确定当前访问的网页为失效网页而发送。在一些实现中,快照请求信息可以至少包括所述当前访问的网页的统一资源定位符以及访问时间。
[0099]在一些实现中,过滤单元802可以用于按如下方式对网页进行安全过滤:基于预先训练的模型计算网页的安全值;判断安全值是否超过预设安全阈值;如果未超过,则可以基于关键词库对网页进行过滤;如果超过,则可以将网页发送至指定的服务器,以进行人工分析。这样,可以保证过滤后的网页中包含有效、安全、可靠的内容。
[0100]上述结合图8描述的实施例所提供的服务器,可以通过对终端发送的与失效网页相匹配的网页进行安全过滤,能够修复失效网页。使得用户在网页失效时也能够获取有效的网页信息。
[0101]应当理解,终端600、服务器700和服务器800中记载的诸单元分别与参考图2、3、4描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于终端600、服务器700和服务器800及其中包含的单元,在此不再赘述。
[0102]在一些实现中,服务器700和服务器800的各单元可以集成在同一个服务器中。即可以由同一个服务器来执行快照查找和安全过滤的操作。该服务器可以包括服务器700和800中的单元。
[0103]请参考图9,其示出了根据本申请一个实施例的网页修复系统的结构示意图。如图9所示,网页修复系统900可以包括终端600、服务器700以及服务器800。
[0104]终端600可以包括第一发送单元、接收单元、第二发送单元、检测单元以及处理单元。第一发送单元可以用于在当前访问的网页为失效网页时,向服务器700发送快照请求信息,以供服务器700查找匹配的网页。接收单元可以用于接收服务器700反馈的匹配的网页。第二发送单元可以用于向服务器800发送匹配的网页,以供服务器800对匹配的网页进行安全过滤。检测单元可以用于检测从服务器800接收的过滤后的网页内容中是否包含有效信息。处理单元可以用于响应于从服务器800接收的过滤后的网页内容中包含有效信息,向用户提供修复网页的接口。
[0105]服务器700可以包括接收单元、查找单元以及发送单元。其中接收单元可以用于接收终端600发送的快照请求信息。查找单元可以用于基于接收单元接收到的快照请求信息查找匹配的网页。发送单元可以用于将查询结果发送至终端600,以供终端600将匹配的网页发送至服务器800进行安全过滤。
[0106]服务器800可以包括接收单元、过滤单元以及发送单元。接收单元可以用于接收终端600发送的网页。过滤单元可以用于对接收到的网页进行安全过滤。发送单元可以用于将过滤后的网页发送至终端600。其中接收单元所接收的网页可以为服务器700基于终端600的快照请求信息查找到的匹配的网页。快照请求信息可以由终端600响应于确定当前访问的网页为失效网页而发送。
[0107]在一些实现中,服务器700和服务器800中的单元可以集成在同一个服务器中,则网页修复系统可以包括终端600和集成了服务器700和800中的单元的服务器。
[0108]进一步参考图10,其示出了基于本申请一个实施例的网页修复系统中的数据交互示意图。在本实施例中,快照服务器1002可以用于查找网页快照,智能服务器1003可以用于对快照服务器查找到的网页进行过滤。
[0109]如图10所示,当用户通过终端1001访问某个网址或在搜索引擎中检索时,终端1001可以对网页服务器返回的内容进行检测。当网页由于网址过期、服务器负载过大、流量控制等因素而无法访问时,终端1001可以向快照服务器1002发起快照请求1010,快照服务器在接收到快照请求1010之后,可以根据快照请求中的访问网页的相关信息(如URL、访问时间等)进行快照查找,如果查找到匹配的网页快照,则快照服务器1002可以向终端1001发送反馈匹配的网
页的消息1020。随后,终端1001可以向智能服务器1003发起过滤请求1030,将匹配的网页发送给智能服务器1003,智能服务器1003可以基于预设的规则对网页内容进行过滤,之后向终端1001返回反馈过滤结果的消息1040。如果反馈过滤结果的消息1040中包含网页的有效信息,则网页可以被修复。终端1001可以响应于用户修复网页的请求,将从反馈过滤结果的消息1040中提取出的网页内容展示给用户,实现网页的修复。
[0110]本申请上述实施例提供的网页修复系统,通过对失效网页进行快照查找,并对查找到的网页进行安全过滤,可以在终端上获取失效网页的信息,提升了浏览器获取信息的能力,并且可以保证所获取的信息的安全性和有效性。
[0111]作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端设备中的计算机可读存储介质。该计算机可读存储介质存储有一个或者一个以上程序,该程序可以包含用于执行流程图所示的方法的程序代码。
[0112]附图中的流程图和框图,图示了按照本发明各种实施例的系统、装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0113]以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
【主权项】
1.一种网页修复方法,其特征在于,所述方法包括: 如果当前访问的网页为失效网页,向快照服务器发送快照请求信息,以供快照服务器查找匹配的网页; 接收所述快照服务器反馈的匹配的网页; 向智能服务器发送所述匹配的网页,以供所述智能服务器对所述匹配的网页进行安全过滤; 检测从所述智能服务器接收的过滤后的网页内容中是否包含有效信息;以及如果从所述智能服务器接收的过滤后的网页内容中包含有效信息,向用户提供修复网页的接口。2.根据权利要求1所述的方法,其特征在于,所述快照请求信息至少包括所述当前访问的网页的统一资源定位符以及访问时间。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括: 响应于用户修复网页的操作,对网页进行修复。4.一种网页修复方法,其特征在于,所述方法包括: 接收终端发送的快照请求信息; 基于所述快照请求信息查找匹配的网页;以及 将查询结果发送至终端,以供终端将所述匹配的网页发送至智能服务器进行安全过滤。5.根据权利要求4所述的方法,其特征在于,所述快照请求信息至少包括所述当前访问的网页的统一资源定位符以及访问时间; 所述基于所述快照请求查找匹配的网页,包括: 在已存储的网页中查询与所述当前访问的网页的URL相同且保存时间与所述访问时间最接近的网页。6.一种网页修复方法,其特征在于,所述方法包括: 接收终端发送的网页; 对所述网页进行安全过滤;以及 将过滤后的网页发送至所述终端; 其中,所述网页为快照服务器基于终端的快照请求信息查找到的匹配的网页,所述快照请求信息由所述终端响应于确定当前访问的网页为失效网页而发送。7.根据权利要求6所述的方法,其特征在于,所述快照请求信息至少包括所述当前访问的网页的统一资源定位符以及访问时间。8.根据权利要求6或7所述的方法,其特征在于,所述对所述网页进行安全过滤,包括: 基于预先训练的模型计算所述网页的安全值; 判断所述安全值是否超过预设安全阈值;以及 如果未超过,则基于关键词库、关键图片库、关键视频库和关键链接库对所述网页进行过滤。9.一种终端,其特征在于,所述终端包括: 第一发送单元,用于在当前访问的网页为失效网页时,向快照服务器发送快照请求信息,以供快照服务器查找匹配的网页; 接收单元,用于接收所述快照服务器反馈的匹配的网页; 第二发送单元,用于向智能服务器发送所述匹配的网页,以供所述智能服务器对所述匹配的网页进行安全过滤; 检测单元,用于检测从所述智能服务器接收的过滤后的网页内容中是否包含有效信息;以及 处理单元,用于响应于从所述智能服务器接收的过滤后的网页内容中包含有效信息,向用户提供修复网页的接口。10.根据权利要求9所述的终端,其特征在于,所述快照请求信息至少包括所述当前访问的网页的统一资源定位符以及访问时间。11.根据权利要求9或10所述的终端,其特征在于,还包括: 修复单元,用于响应于用户修复网页的操作,对网页进行修复。12.一种服务器,其特征在于,所述服务器包括: 接收单元,用于接收终端发送的快照请求信息; 查找单元,用于基于所述快照请求信息查找匹配的网页;以及发送单元,用于将查询结果发送至终端,以供终端将所述匹配的网页发送至具有过滤功能的服务器进行安全过滤。13.根据权利要求12所述的服务器,其特征在于,所述快照请求信息至少包括所述当前访问的网页的统一资源定位符以及访问时间; 所述查找单元用于按如下方式查找匹配的网页: 在已存储的网页中查询与所述当前访问的网页的URL相同且保存时间与所述访问时间最接近的网页。14.一种服务器,其特征在于,所述服务器包括: 接收单元,用于接收终端发送的网页; 过滤单元,用于对所述网页进行安全过滤;以及 发送单元,用于将过滤后的网页发送至所述终端; 其中,所述网页为基于终端的快照请求信息查找到的匹配的网页,所述快照请求信息由所述终端响应于确定当前访问的网页为失效网页而发送。15.根据权利要求14所述的服务器,其特征在于,所述快照请求信息至少包括所述当前访问的网页的统一资源定位符以及访问时间。16.根据权利要求14或15所述的服务器,其特征在于,所述过滤单元用于按如下方式对所述网页进行安全过滤: 基于预先训练的模型计算所述网页的安全值; 判断所述安全值是否超过预设安全阈值;以及 如果未超过,则基于关键词库对所述网页进行过滤。17.—种网页修复系统,其特征在于,所述系统包括如权利要求9-11任一所述的终端、如权利要求12或13所述的服务器以及如权利要求14-16任一所述的服务器。
【专利摘要】本申请公开了网页修复方法、终端、服务器及系统。网页修复方法的一【具体实施方式】包括:如果当前访问的网页为失效网页,向快照服务器发送快照请求信息,以供快照服务器查找匹配的网页;接收快照服务器反馈的匹配的网页;向智能服务器发送匹配的网页,以供智能服务器对所述匹配的网页进行安全过滤;检测从智能服务器接收的过滤后的网页内容中是否包含有效信息;如果从智能服务器接收的过滤后的网页内容中包含有效信息,向用户提供修复网页的接口。该实施方式通过对失效网页进行快照查找和安全过滤,获取失效网页的信息,提升了浏览器获取信息的能力,并且可以保证所获取的信息安全有效。
【IPC分类】G06F17/30
【公开号】CN104899320
【申请号】CN201510342371
【发明人】郭俊杰, 陈庆伟, 李华冈
【申请人】安一恒通(北京)科技有限公司
【公开日】2015年9月9日
【申请日】2015年6月18日