确定网络位置的唯一访问者的制作方法

xiaoxiao2020-7-22  2

【专利下载】Tel:18215660330

确定网络位置的唯一访问者的制作方法
【专利摘要】本发明公开了一种系统和计算机实现的方法,用于确定来自地理区域的对于网络位置的唯一访问者的估计数量。利用非线性近似,来确定网络位置的唯一访问者的估计数量。非线性近似至少基于该地理区域内的用户的估计数量、该地理区域内的唯一用户标识符的估计数量以及在该网络位置处观测到的来自该地理区域的唯一用户标识符的数量。
【专利说明】确定网络位置的唯一访问者
[0001]相关申请的交叉引用
[0002]本申请要求2011年4月12日提交的美国临时申请第61/474,552号的权益。上 述申请的全部内容通过引用包含于此。
【技术领域】
[0003]本公开主要涉及信息管理,尤其涉及用于确定网络位置(例如网页或者网页集)的 唯一访问者的数量的系统和方法。
【背景技术】
[0004]本部分提供不必定是现有技术的与本公开相关的背景信息。
[0005]可以以许多方式利用网络位置的唯一访问者的数量以及与这些用户相关的信息 (人口统计信息等)。诸如网页、流媒体源、联网应用或者移动或嵌入式设备等网络位置可 以寻求间接估计其唯一访问者的数量,同时保护各个用户信息的隐私。

【发明内容】

[0006]本部分提供对本公开的一般总结,而不是对其完整范围或者其所有特征的全面公 开。
[0007]在本公开的各个实施例中,公开了一种计算机实现的方法。该方法包括:在估计服 务器处获得地理区域内的网络用户的估计数量、所述地理区域内的唯一用户标识符的估计 数量和在所述网络中的网络位置处观测到的来自所述地理区域的唯一用户标识符的数量。 该方法还包括:所述估计服务器处至少基于所述地理区域内的用户的估计数量、所述地理 区域内的唯一用户标识符的估计数量以及在所述网络位置处观测到的来自所述地理区域 的唯一用户标识符的数量,利用非线性近似,确定来自所述地理区域的对所述网络位置的 唯一访问者的估计数量。该方法还包括:将来自所述地理区域的对所述网络位置的唯一访 问者的估计数量存储在所述估计服务器处的存储器上。
[0008]在本公开的各个实施例中,公开了一种系统,该系统包括:估计服务器处的一个或 更多个处理器,可操作以进行多个操作。所述操作包括:获得地理区域内的网络用户的估计 数量;获得所述地理区域内的唯一用户标识符的估计数量;以及获得在所述网络中的网络 位置处观测到的来自所述地理区域的唯一用户标识符的数量。所述操作还包括:至少基于 所述地理区域内的用户的估计数量、所述地理区域内的唯一用户标识符的估计数量以及在 所述网络位置处观测到的来自所述地理区域的唯一用户标识符的数量,利用非线性近似, 确定来自所述地理区域的对所述网络位置的唯一访问者的估计数量。所述操作还包括:将 来自所述地理区域的对所述网络位置的唯一访问者的估计数量存储在所述估计服务器处 的存储器上。
[0009]在本公开的各个实施例中,公开了一种计算机可读存储介质,该计算机可读存储 介质在其上存储有指令,当由估计服务器处的处理器执行所述指令时,所述计算机可读存储介质使所述处理器进行操作。所述操作包括:获得地理区域内的网络用户的估计数量; 获得所述地理区域内的唯一用户标识符的估计数量;以及获得在所述网络中的网络位置处 观测到的来自所述地理区域的唯一用户标识符的数量。所述操作还包括:至少基于所述地 理区域内的用户的估计数量、所述地理区域内的唯一用户标识符的估计数量以及在所述网 络位置处观测到的来自所述地理区域的唯一用户标识符的数量,利用非线性近似,确定来 自所述地理区域的对所述网络位置的唯一访问者的估计数量。所述操作还包括:将来自所 述地理区域的对所述网络位置的唯一访问者的估计数量存储在所述估计服务器处的存储 器上。
[0010]在本公开的各个实施例中,公开了另一计算机实现的方法。该方法包括:在估计服 务器处获得与地理区域内的网络用户相对应的多个人口统计类别。该方法还包括:对于所 述多个人口统计类别中的至少一个人口统计类别:(I)在所述估计服务器处获得在所述人 口统计类别内并且在所述地理区域内的用户的估计数量;(2)在所述估计服务器处获得在 所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量;(3)在所述估 计服务器处获得在所述网络中的网络位置处观测到的在所述人口统计类别内并且来自所 述地理区域的唯一用户标识符的数量;(4)在所述估计服务器处至少基于在所述人口统计 类别内并且在所述地理区域内的用户的估计数量、在所述人口统计类别内并且在所述地理 区域内的唯一用户标识符的估计数量以及在所述网络位置处观测到的在所述人口统计类 别内并且来自所述地理区域的唯一用户标识符的数量,利用非线性近似,确定在所述人口 统计类别内并且来自所述地理区域的对所述网络位置的唯一访问者的估计数量;以及(5) 将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数量存储在所述估计服 务器处的存储器上。
[0011]在本公开的各个实施例中,公开了另一系统,该系统包括:估计服务器处的一个或 更多个处理器,所述一个或更多个处理器可操作以进行多个操作。所述操作包括:获得与地 理区域内的网络用户相对应的多个人口统计类别。所述操作还包括:对于所述多个人口统 计类别中的至少一个人口统计类别:(I)获得在所述人口统计类别内并且在所述地理区域 内的用户的估计数量;(2)获得在所述人口统计类别内并且在所述地理区域内的唯一用户 标识符的估计数量;(3)获得在所述网络中的网络位置处观测到的在所述人口统计类别内 并且来自所述地理区域的唯一用户标识符的数量;(4)至少基于在所述人口统计类别内并 且在所述地理区域内的用户的估计数量、在所述人口统计类别内并且在所述地理区域内的 唯一用户标识符的估计数量以及在所述网络位置处观测到的在所述人口统计类别内并且 来自所述地理区域的唯一用户标识符的数量,利用非线性近似,确定在所述人口统计类别 内并且来自所述地理区域的对所述网络位置的唯一访问者的估计数量;以及(5)将所述来 自所述地理区域的对所述网络位置的唯一访问者的估计数量,存储在所述估计服务器处的 存储器上。
[0012]在本公开的各个实施例中,公开了另一计算机可读存储介质,该计算机可读存储 介质在其上存储有指令,当由估计服务器处的处理器执行所述指令时,所述计算机可读存 储介质使所述处理器进行操作。所述操作包括:获得与地理区域内的网络用户相对应的多 个人口统计类别。所述操作还包括:对于所述多个人口统计类别中的至少一个人口统计类 别:(1)获得在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)获得在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量;(3)获得在所 述网络中的网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用 户标识符的数量;(4)至少基于在所述人口统计类别内并且在所述地理区域内的用户的估 计数量、在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量以及 在所述网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标 识符的数量,利用非线性近似,确定在所述人口统计类别内并且来自所述地理区域的对所 述网络位置的唯一访问者的估计数量;以及(5)将所述来自所述地理区域的对所述网络位 置的唯一访问者的估计数量,存储在所述估计服务器处的存储器上。
[0013]在本公开的各个实施例中,公开了另一计算机实现的方法。该方法包括:在估计服 务器处获得与地理区域内的网络用户相对应的多个人口统计类别。该方法还包括:对于所 述多个人口统计类别中的每个人口统计类别:(I)在所述估计服务器处获得在所述人口统 计类别内并且在所述地理区域内的用户的估计数量;(2)在所述估计服务器处获得在所述 人口统计类别内并且在所述地理区域内的多个唯一用户标识符;(3)在所述估计服务器处 获得在所述人口统计类别内并且在所述地理区域内的每个用户的唯一用户标识符的数量 的第一分布;(4)在所述估计服务器处创建在所述人口统计类别内并且在所述地理区域内 的伪用户的集合,其中,所述伪用户的集合包括近似等于在所述人口统计类别内并且在所 述地理区域内的用户的估计数量的数量的伪用户;(5)在所述估计服务器处对所述伪用户 的集合内的每个伪用户分配在所述人口统计类别内并且在所述地理区域内的所述唯一用 户标识符中的至少一个,以创建近似于所述第一分布的每个伪用户的唯一用户标识符的数 量的第二分布,以使得对所述伪用户的集合内的伪用户分配在所述人口统计类别内并且在 所述地理区域内所述多个唯一用户标识符中的每一个;以及(6)将所述来自所述地理区域 的对所述网络位置的唯一访问者的估计数量,存储在所述估计服务器处的存储器上。
[0014]在本公开的各个实施例中,公开了另一系统,该系统包括:估计服务器处的一个或 更多个处理器,可操作以进行多个操作。所述操作包括:获得与地理区域内的网络用户相 对应的多个人口统计类别。所述操作还包括:对于所述多个人口统计类别中的每个人口统 计类别:(1)获得在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)获 得在所述人口统计类别内并且在所述地理区域内的多个唯一用户标识符;(3)获得在所述 人口统计类别内并且在所述地理区域内的每个用户的唯一用户标识符的数量的第一分布;
(4)创建在所述人口统计类别内并且在所述地理区域内的伪用户的集合,其中,所述伪用户 的集合包括近似等于在所述人口统计类别内并且在所述地理区域内的用户的估计数量的 数量的伪用户;(5)对所述伪用户的集合内的每个伪用户分配在所述人口统计类别内并且 在所述地理区域内的所述唯一用户标识符中的至少一个,以创建近似于所述第一分布的每 个伪用户的唯一用户标识符的数量的第二分布,以使得对所述伪用户的集合内的伪用户分 配在所述人口统计类别内并且在所述地理区域内的所述多个唯一用户标识符中的每一个; 以及(6)将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数量,存储在所 述估计服务器处的存储器上。
[0015]在本公开的各个实施例中,公开了另一计算机可读存储介质,该计算机可读存储 介质在其上存储有指令,当由估计服务器处的处理器执行所述指令时,所述计算机可读存 储介质使所述处理器进行操作。所述操作包括:获得与地理区域内的网络用户相对应的多个人口统计类别。所述操作还包括:对于所述多个人口统计类别中的每个人口统计类别: (I)获得在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)所述估计 服务器处获得在所述人口统计类别内并且在所述地理区域内的多个唯一用户标识符;(3) 获得在所述人口统计类别内并且在所述地理区域内的每个用户的唯一用户标识符的数量 的第一分布;(4)创建在所述人口统计类别内并且在所述地理区域内的伪用户的集合,其 中,所述伪用户的集合包括近似等于在所述人口统计类别内并且在所述地理区域内的用户 的估计数量的数量的伪用户;(5)对所述伪用户的集合内的每个伪用户分配在所述人口统 计类别内并且在所述地理区域内的所述唯一用户标识符中的至少一个,以创建近似于所述 第一分布的每个伪用户的唯一用户标识符的数量的第二分布,以使得对所述伪用户的集合 内的伪用户分配在所述人口统计类别内并且在所述地理区域内所述多个唯一用户标识符 中的每一个;以及(6)将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数 量,存储在所述估计服务器处的存储器上。
[0016]在本公开的各个实施例中,公开了另一计算机实现的方法。该方法包括:在估计服 务器处获得与地理区域内的网络用户相对应的多个人口统计类别。该方法还包括:通过如 下步骤,在所述估计服务器处生成多个伪用户的集合,所述步骤包括:对于所述多个人口统 计类别中的每个人口统计类别:(I)在所述估计服务器处获得在所述人口统计类别内并且 在所述地理区域内的用户的估计数量;(2)在所述估计服务器处获得在所述人口统计类别 内并且在所述地理区域内的多个唯一用户标识符;(3)在所述估计服务器处创建在所述人 口统计类别内并且在所述地理区域内的伪用户的集合,其中,所述伪用户的集合包括近似 等于在所述人口统计类别内并且在所述地理区域内的用户的估计数量的数量的伪用户;以 及(4)在所述估计服务器处对所述伪用户的集合内的每个伪用户分配在所述人口统计类 别内并且在所述地理区域内的所述唯一用户标识符中的至少一个,使得对所述伪用户的集 合内的伪用户分配在所述人口统计类别内并且在所述地理区域内的所述多个唯一用户标 识符中的每一个。该方法还包括:利用所述多个伪用户的集合,确定来自所述地理区域的对 所述网络中的网络位置的唯一访问者的估计数量;以及将所述来自所述地理区域的对所述 网络位置的唯一访问者的估计数量,存储在所述估计服务器处的存储器上。
[0017]在本公开的各个实施例中,公开了另一系统,该系统包括:估计服务器处的一个或 更多个处理器,一个或更多个处理器可操作以进行多个操作。所述操作包括:获得与地理区 域内的网络用户相对应的多个人口统计类别。所述操作还包括:通过如下步骤,生成多个 伪用户的集合,所述步骤包括:对于所述多个人口统计类别中的每个人口统计类别:(I)获 得在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)获得在所述人口 统计类别内并且在所述地理区域内的多个唯一用户标识符;(3)创建在所述人口统计类别 内并且在所述地理区域内的伪用户的集合,其中,所述伪用户的集合包括近似等于在所述 人口统计类别内并且在所述地理区域内的用户的估计数量的数量的伪用户;以及(4)对所 述伪用户的集合中的每个伪用户分配在所述人口统计类别内并且在所述地理区域内的所 述唯一用户标识符中的至少一个,以使得对所述伪用户的集合内的伪用户分配在所述人口 统计类别内并且在所述地理区域内的所述多个唯一用户标识符中的每一个。所述操作还包 括:利用所述多个伪用户的集合,来确定来自所述地理区域的对所述网络中的网络位置的 唯一访问者的估计数量;以及将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数量,存储在所述估计服务器处的存储器上。
[0018]在本公开的各个实施例中,公开了另一计算机可读存储介质,该计算机可读存储 介质在其上存储有指令,当由估计服务器处的处理器执行所述指令时,所述计算机可读存 储介质使所述处理器进行操作。所述操作包括:获得与地理区域内的网络用户相对应的多 个人口统计类别。所述操作还包括:通过如下步骤,生成多个伪用户的集合,所述步骤包括: 对于所述多个人口统计类别中的每个人口统计类别:(I)获得所述人口统计类别内的所述 地理区域内的估计的用户数量;(2)获得所述人口统计类别内的所述地理区域内的多个唯 一用户标识符;(3)创建所述人口统计类别内的所述地理区域内的伪用户的集合,其中,所 述伪用户的集合包括近似等于所述人口统计类别内的所述地理区域内的估计的用户数量 的数量的伪用户;以及(4)对所述伪用户的集合中的每个伪用户分配所述人口统计类别内 的所述地理区域内的所述唯一用户标识符中的至少一个,使得对所述伪用户的集合内的伪 用户分配所述人口统计类别内的所述地理区域内的所述多个唯一用户标识符中的每一个。 所述操作还包括:利用所述多个伪用户的集合,来确定来自所述地理区域的所述网络中的 网络位置的唯一访问者的估计数量;以及将所述来自所述地理区域的所述网络位置的唯一 访问者的估计数量,存储在所述估计服务器处的存储器上。
[0019]在本公开的各个实施例中,公开了另一计算机实现的方法。该方法包括:在估计服 务器处获得与地理区域内的网络的用户相对应的多个人口统计类别。该方法还包括:通过 如下步骤,在所述估计服务器处生成多个伪用户的集合,所述步骤包括:对于所述多个人口 统计类别中的每个人口统计类别:(I)在所述估计服务器处获得在所述人口统计类别内并 且在所述地理区域内的用户的估计数量;(2)在所述估计服务器处获得在所述人口统计类 别内并且在所述地理区域内的多个唯一用户标识符;(3)在所述估计服务器处创建在所述 人口统计类别内并且在所述地理区域内的伪用户的集合,其中,所述伪用户的集合包括近 似等于在所述人口统计类别内并且在所述地理区域内的用户的估计数量的数量的伪用户; 以及(4)在所述估计服务器处对所述伪用户的集合中的每个伪用户分配在所述人口统计 类别内并且在所述地理区域内的所述唯一用户标识符中的至少一个,以使得对所述伪用户 的集合内的伪用户分配在所述人口统计类别内并且在所述地理区域内的所述多个唯一用 户标识符中的每一个。该方法还包括:利用所述多个伪用户的集合,来确定在至少一个人口 统计类别内并且来自所述地理区域的对所述网络中的网络位置的唯一访问者的估计数量; 以及将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数量,存储在所述估 计服务器处的存储器上。
[0020]在本公开的各个实施例中,公开了另一系统,该系统包括:估计服务器处的一个或 更多个处理器,一个或更多个处理器可操作以进行多个操作。所述操作包括:获得与地理区 域内的网络用户相对应的多个人口统计类别。所述操作还包括:通过如下步骤,生成多个伪 用户的集合,所述步骤包括:对于所述多个人口统计类别中的每个人口统计类别:(I)获得 在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)获得在所述人口统 计类别内并且在所述地理区域内的多个唯一用户标识符;(3)创建所述人口统计类别内的 所述地理区域内的伪用户的集合,其中,所述伪用户的集合包括近似等于在所述人口统计 类别内并且在所述地理区域内的用户的估计数量的数量的伪用户;以及(4)对所述伪用户 的集合中的每个伪用户分配在所述人口统计类别内并且在所述地理区域内的所述唯一用户标识符中的至少一个,以使得对所述伪用户的集合内的伪用户分配在所述人口统计类别 内并且在所述地理区域内的所述多个唯一用户标识符中的每一个。所述操作还包括:利用 所述多个伪用户的集合,来确定在至少一个人口统计类别内并且来自所述地理区域的所述 网络中的网络位置的唯一访问者的估计数量;以及将所述来自所述地理区域的所述网络位 置的唯一访问者的估计数量,存储在所述估计服务器处的存储器上。
[0021]在本公开的各个实施例中,公开了另一计算机可读存储介质,该计算机可读存储 介质在其上存储有指令,当由估计服务器处的处理器执行所述指令时,所述计算机可读存 储介质使所述处理器进行操作。所述操作包括:获得与地理区域内的网络用户相对应的多 个人口统计类别。所述操作还包括:通过如下步骤,生成多个伪用户的集合,所述步骤包括: 对于所述多个人口统计类别中的每个人口统计类别:(I)获得在所述人口统计类别内并且 在所述地理区域内的用户的估计数量;(2)获得在所述人口统计类别内并且在所述地理区 域内的多个唯一用户标识符;(3)创建在所述人口统计类别内并且在所述地理区域内的伪 用户的集合,其中,所述伪用户的集合包括近似等于在所述人口统计类别内并且在所述地 理区域内的用户的估计数量的数量的伪用户;以及(4)对所述伪用户的集合中的每个伪用 户分配在所述人口统计类别内并且在所述地理区域内的所述唯一用户标识符中的至少一 个,以使得对所述伪用户的集合内的伪用户分配在所述人口统计类别内并且在所述地理区 域内的所述多个唯一用户标识符中的每一个。所述操作还包括:利用所述多个伪用户的集 合,来确定在至少一个人口统计类别内并且来自所述地理区域的对所述网络中的网络位置 的唯一访问者的估计数量;以及将所述来自所述地理区域的对所述网络位置的唯一访问者 的估计数量,存储在所述估计服务器处的存储器上。
[0022]根据这里提供的描述,其它适用的领域将变得明显。本
【发明内容】
中的描述和具体 示例仅旨在用于进行说明,而不旨在限制本公开的范围。
【专利附图】

【附图说明】
[0023]这里描述的附图仅用于对选择的实施例、而不是所有可能实现方式的说明目的, 并且不旨在限制本公开的范围。
[0024]图1是用于确定网络中的网络位置的唯一访问者的数量的示例系统的框图;
[0025]图2是网络的示例用户的框图;
[0026]图3是示例地理区域和相关联的统计因素的框图;
[0027]图4是确定来自地理区域的对于网络位置的唯一访问者的估计数量的示例方法 的流程图;
[0028]图5是示出根据网络的多个用户创建伪用户的集合的伪用户模块的框图;
[0029]图6是示出与特定数量的唯一用户标识符相关联的用户的数量的分布的框图;
[0030]图7是示出与特定数量的唯一用户标识符相关联的伪用户的数量的分布的框图;
[0031]图8是根据地理区域针对多个人口统计类别中的每一个生成一组伪用户的示例 方法的流程图;
[0032]图9是根据地理区域针对多个人口统计类别中的每一个生成一组伪用户的示例 方法的流程图;以及
[0033]图10是用于确定网络中的网络位置的唯一访问者的数量的示例装置的框图。[0034]在贯穿附图的若干个视图,相应的附图标记指示相应的部分。
【具体实施方式】
[0035]现在,参考附图,更充分地描述示例实施例。
[0036]提供示例实施例,使得本公开是彻底的,并且向本领域技术人员充分传达范围。叙 述了大量具体细节,例如具体部件、设备和方法的示例,以提供对本公开的实施例的透彻理 解。对于本领域技术人员很明显的是,不一定利用具体细节,可以以许多不同的形式来实施 示例实施例,并且都不应当被解释为限制本公开的范围。在一些示例实施例中,不详细描述 公知的处理、公知的设备结构和公知的技术。
[0037]这里使用的技术仅用于描述特定示例实施例的目的,而不旨在进行限制。除非上 下文另外清楚地指出,否则如这里所使用的,单数形式“一”、“一个”和“该”可能旨在同样包 括复数形式。术语“和/或”包括列出的相关联的项目中的一个或更多个的任意和全部组 合。术语“包括”、“包含”、“含有”和“具有”是包含性的,因此指明陈述的特征、整体、步骤、 操作、元素和/或部件的存在,但是不排除一个或更多个其它特征、整体、步骤、操作、元素、 部件和/或其组的存在或者附加。除非作为执行顺序明确指出,否则这里描述的方法步骤、 处理和操作不应当被解释为一定需要其按照讨论或示出的特定顺序执行。还应当理解,可 以利用附加或者替代步骤。
[0038]虽然这里可能使用术语第一、第二、第三等,来描述各种元素、部件、区域、层和/ 或部分,但是这些元素、部件、区域、层和/或部分应当不受这些术语限制。这些术语可能 仅用来区分一个元素、部件、区域、层或部分与另一区域、层或部分。除非上下文清楚地指 出,否则诸如“第一”、“第二”的术语和其它数字术语在这里使用时,不暗示序列或者顺序。 因此,下面讨论的第一元素、部件、区域、层或部分可以被称为第二元素、部件、区域、层或部 分,而不脱离示例实施例的宗义。
[0039]如这里所使用的,术语模块可能是指专用集成电路(ASIC);电子电路;组合逻辑 电路;场可编程门阵列(FPGA);执行存储在联网集群或者数据中心中的由分布式处理器网 络执行的代码或者处理的处理器(共享、专用或者组);提供所描述的功能的其它合适的部 件;或者诸如在片上系统中的上述内容的一部分或全部的组合,术语模块可能是上述内容 的一部分,或者包括上述内容。术语模块可以包括存储由一个或更多个处理器执行的代码 的存储器(共享、专用或者组)。
[0040]如上面所使用的,术语代码可以包括软件、固件、字节代码和/或微码,并且可以 是指程序、例程、函数、类和/或对象。如上面所使用的,术语共享意为使用单个(共享)处 理器执行来自多个模块的一部分或所有代码。另外,可以由单个(共享)存储器存储来自 多个模块的一部分或所有代码。如上面所使用的,术语组意为使用一组处理器来执行来自 单个模块的一部分或所有代码。另外,可以使用一组存储器来存储来自单个模块的一部分 或所有代码。
[0041]可以通过由一个或更多个处理器执行的一个或更多个计算机程序来实现这里描 述的装置和方法。计算机程序包括存储在诸如非易失性有形计算机可读介质的计算机可读 存储介质上的处理器可执行指令。计算机程序还可以包括存储的数据。计算机可读存储介 质的非限制性示例是非易失性存储器、磁存储器和光存储器。[0042]现在参考图1,示出了用于确定网络位置的唯一访问者的数量的示例系统100。系 统100连接到例如局部网络、诸如因特网的广域网或者它们的组合等网络102。多个单独 用户104-1、104-2、...、104-m(统称为用户104)经由网络102连接到多个单独网络位置 106-1,106-2,...、106-n(统称为网络位置106)。用户104通过网络102从网络位置106 存取内容或者“访问”网络位置106。网络位置106的示例包括、但不限于网页、网页集、联 网应用、流媒体源、联网设备(移动设备、嵌入式设备等)和其它网络资源。如这里所使用 的,术语“用户” 104不仅可以指单独的用户,还指诸如一组个人(例如作为单独的单元进行 行为或者另外动作的个人)等其它实体。
[0043]在用户104访问一个或更多个网络位置106时,用户104可以获取部分或全部存 储在用户104的位置(例如在用户104的计算设备(个人计算机、膝上型电脑、智能电话 等)的存储器中)的诸如c00kie(浏览器、闪速(flash)本地存储对象、HTML5存储或者其它 方式)、应用本地存储、诸如基于Kerberos的票证联合识别系统令牌(kerberized ticket federated identity system token)的身份令牌、表示用户身份的移动秘钥等用户标识符 110(图2)。任选地,用户标识符110可以包括与其所属的特定用户104相关的人口统计信 息112或者其它信息,诸如例如特定设备或网络地址。如这里所使用的,人口统计信息112 包括可以对一个或更多个用户104进行分组的任意信息(年限、收入水平、性别、关注的话 题等)。用户104中的每一个可能获得许多用户标识符110。在用户104访问特定网络位 置106时,网络位置106可以观测存储在用户104位置的用户标识符110。特定网络位置 106可能仅能够存取与网络位置106本身相关联的用户标识符110,而不能存取与其它非关 联网络位置106相关联的用户标识符110。用户标识符110可能通过联合识别系统或者通 过用户网络,与一个或更多个网络位置106直接相关。如下面所描述的,系统100可以利用 这些用户标识符110,来准确地估计网络位置106的唯一访问者的数量,即已经从网络位置 106存取信息或者“访问”网络位置106的唯一用户104的数量。优选地,网络位置106可 以利用一种或更多种方法,来保护用户104和用户标识符110的保密性,该方法包括、但不 限于保密性政策、用户数据的假匿名和掩蔽、对人口统计数据和用户之间的关联的限制、用 户数据的加密和哈希、时间窗之后数据的删除、非个人用户数据的聚集以及对用户数据共 享的限制。
[0044]例如可以由网络位置106直接测量对网络位置106的访问(或者“页面浏览”)的 数量。然而,在一些实例中无法直接测量网络位置106的唯一访问者的数量,以及单个用户 104可能多次和/或从多个IP地址访问网络位置106、单个用户104可能与多个唯一用户 标识符110相关联、多个用户104可能从同一 IP地址访问网络位置106等的事实。因此, 可能必须通过利用与唯一访问者的数量相关的并且可以直接测量的项目或者对象,来间接 估计不可能/不能实行直接测量的对网络位置106的唯一访问者的数量。在一些实施方式 中,可以利用在网络位置106处观测到的唯一用户标识符110的数量,来准确地估计网络位 置106的唯一访问者的数量。
[0045]现在参考图3,示出了示例地理区域120和其关联因素的表示。虽然本领域技术人 员应当理解,可以利用任意地理区域120或者子区域(诸如例如地理边界、法定边界、人口 统计边界、邮政编码或者根据用户使用模式推算的地理边界),但是在该示例中,表示的地 理区域120是美国。基于例如从自愿/匿名提供的浏览数据、普查数据和/或其它数据源收集的数据,例如通过统计学或者其它分析,已知或者可以确定地理区域120的网络102的估计出的用户的总数量122以及地理区域120的唯一用户标识符的总数量124。此外,将地理区域120专用的参数a 126与地理区域120相关联。如下面所描述的,可以通过非线性近似或者通过对例如由用户104的虚拟面板108提供的数据的分析,来确定地理区域专用参数a 126。如下面将更充分地描述的,基于这些因素,可以估计来自地理区域120的对网络位置106的唯一访问者的数量。
[0046]在本公开的一些实施例中,利用非线性近似来估计网络位置106的唯一访问者的数量,即从地理区域120访问网络位置106的唯一用户104的数量。除了在网络位置106 处观测到的唯一用户标识符110的数量,非线性近似还利用其它因素的数量,例如地理区域120内的总用户数量122以及地理区域120内的唯一用户标识符的总数量124。已经确定可以以I参数近似(1-parameter approximation)来利用这些因素,以提供对来自地理区域120的、对网络位置106的唯一访问者的准确估计。由a表示的参数专用于所关注的地理区域120,并且如下面所描述的,可以以多种方式得出该参数。
[0047]在一些实施例中,非线性近似利用下面的方程:
【权利要求】
1.一种计算机实现的方法,包括:在估计服务器处获得地理区域内的网络用户的估计数量;在所述估计服务器处获得所述地理区域内的唯一用户标识符的估计数量;在所述估计服务器处获得在所述网络中的网络位置处观测到的来自所述地理区域的唯一用户标识符的数量;在所述估计服务器处至少基于所述地理区域内的用户的估计数量、所述地理区域内的唯一用户标识符的估计数量以及在所述网络位置处观测到的来自所述地理区域的唯一用户标识符的数量,利用非线性近似,确定来自所述地理区域的对所述网络位置的唯一访问者的估计数量;以及将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数量存储在所述估计服务器处的存储器上。
2.根据权利要求1所述的方法,其中,所述非线性近似包括:
3.根据权利要求2所述的方法,其中,所述唯一用户标识符包括cookie。
4.根据权利要求2所述的方法,其中,a是根据来自所述地理区域的用户的虚拟面板来确定的。
5.根据权利要求2所述的方法,其中,a是根据包括如下方程的非线性近似来确定` 的:
6.根据权利要求5所述的方法,其中,P等于0.9。
7.根据权利要求1所述的方法,其中,所述唯一用户标识符包括cookie。
8.一种系统,包括:估计服务器处的一个或更多个处理器,所述一个或更多个处理器可操作以进行包括以下步骤的操作:获得地理区域内的网络用户的估计数量;获得所述地理区域内的唯一用户标识符的估计数量;获得在所述网络中的网络位置处观测到的来自所述地理区域的唯一用户标识符的数至少基于所述地理区域内的用户的估计数量、所述地理区域内的唯一用户标识符的估计数量以及在所述网络位置处观测到的来自所述地理区域的唯一用户标识符的数量,利用非线性近似,确定来自所述地理区域的对所述网络位置的唯一访问者的估计数量;以及将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数量存储在所述估计服务器处的存储器上。
9.根据权利要求8所述的系统,其中,所述非线性近似包括:
10.根据权利要求9所述的系统,其中,所述唯一用户标识符包括cookie。
11.根据权利要求9所述的系统,其中,a是根据来自所述地理区域的用户的虚拟面板来确定的。
12.根据权利要求9所述的系统,其中,a是根据包括如下方程的非线性近似来确定的:
13.根据权利要求12所述的系统,其中,P等于0.9。
14.根据权利要求8所述的系统,其中,所述唯一用户标识符包括cookie。
15.—种计算机实现的方法,包括:在估计服务器处获得与地理区域 内的网络用户相对应的多个人口统计类别;以及对于所述多个人口统计类别中的至少一个人口统计类别:(1)在所述估计服务器处获得在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)在所述估计服务器处获得在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量;(3)在所述估计服务器处获得在所述网络中的网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量;(4)在所述估计服务器处至少基于在所述人口统计类别内并且在所述地理区域内的用户的估计数量、在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量以及在所述网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量,利用非线性近似,确定在所述人口统计类别内并且来自所述地理区域的对所述网络位置的唯一访问者的估计数量;以及(5)将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数量存储在所述估计服务器处的存储器上。
16.根据权利要求15所述的方法,其中,所述非线性近似包括:
17.根据权利要求16所述的方法,其中,所述唯一用户标识符包括cookie。
18.根据权利要求16所述的方法,其中,a是根据来自所述地理区域的用户的虚拟面板来确定的。
19.根据权利要求16所述的方法,其中,a是根据包括如下方程的非线性近似来确定的:
20.根据权利要求19所述的方法,其中,P等于0.9。
21.根据权利要求15所述的方法,其中,所述唯一用户标识符包括cookie。
22.根据权利要求15所述的方法,还包括:对于所述多个人口统计类别中的每个人口统计类别:(1)在所述估计服务器处获得在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)在所述估计服务器处获得在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量;(3)在所述估计服务器处获得在所述网络中的网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量;以及(4)在所述估计服务器处至少基于在所述人口统计类别内并且在所述地理区域内的用户的估计数量、在所述人口统计类别内并且所述地理区域内的唯一用户标识符的估计数量以及在所述网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量,利用非线性近似,确定在所述人口统计类别内并且来自所述地理区域的对所述网络位置的唯一访问者的估计数量。
23.根据权利要求22所述的方法,还包括:在所述估计服务器处通过对来自所述多个人口统计类别中的每个人口统计类别并且来自所述地理区域的对所述网络位置的唯一访问者的估计数量求和,来确定来自所述地理区域的对所述网络位置的唯一访问者的总估计数量。
24.根据权利要求23所述的方法,其中,所述非线性近似包括:
25.根据权利要求24所述的方法,其中,所述唯一用户标识符包括cookie。
26.根据权利要求24所述的方法,其中,a是根据来自所述地理区域的用户的虚拟面板来确定的。
27.根据权利要求24所述的方法,其中,a是根据包括如下方程的非线性近似来确定的:
28.根据权利要求27所述的方法,其中,P等于0.9。
29.根据权利要求23所述的方法,其中,所述唯一用户标识符包括cookie。
30.一种系统,包括:估计服务器处的一个或更多个处理器,所述一个或更多个处理器可操作以进行包括以下步骤的操作:获得与地理区域内的网络用户相对应的多个人口统计类别;以及对于所述多个人口统计类别中的至少一个人口统计类别:(1)获得在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)获得在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数(3)获得在所述网络中的网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量;(4)至少基于在所述人口统计类别内并且在所述地理区域内的用户的估计数量、在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量以及在所述网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量, 利用非线性近似,确定在所述人口统计类别内并且来自所述地理区域的对所述网络位置的唯一访问者的估计数量;以及(5)将所述来自所述地理区域的对所述网络位置的唯一访问者的估计数量,存储在所述估计服务器处的存储器上。
31.根据权利要求30所述的系统,其中,所述非线性近似包括:
32.根据权利要求31所述的系统,其中,所述唯一用户标识符包括cookie。
33.根据权利要求31所述的系统,其中,a是根据来自所述地理区域的用户的虚拟面板来确定的。
34.根据权利要求31所述的系统,其中,a是根据包括如下方程的非线性近似来确定的:其中,“c”是所述地理区域内的唯一用户标识的估计符数量;“p”是所述地理区域内的用户的估计数量;以及“ P ”是根据用户的虚拟面板确定的、独立于所述地理区域的参数。
35.根据权利要求34所述的系统,其中,P等于0.9。
36.根据权利要求30所述的系统,其中,所述唯一用户标识符包括cookie。
37.根据权利要求30所述的系统,其中,所述操作还包括:对于所述多个人口统计类别中的每个人口统计类别:(1)获得在所述人口统计类别内并且在所述地理区域内的用户的估计数量;(2)获得在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数(3)获得在所述网络中的网络位置 处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量;以及(4)至少基于在所述人口统计类别内并且在所述地理区域内的用户的估计数量、在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量以及在所述网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量, 利用非线性近似,确定在所述人口统计类别内并且来自所述地理区域的对所述网络位置的唯一访问者的估计数量。
38.根据权利要求37所述的系统,其中,所述操作还包括:通过对来自所述多个人口统计类别中的每个人口统计类别并且来自所述地理区域的对所述网络位置的唯一访问者的估计数量求和,来确定来自所述地理区域的对所述网络位置的唯一访问者的总估计数量。
39.根据权利要求38所述的系统,其中,所述非线性近似包括:息 ,(l+tt)#nmkies其中,“#pe0ple”是在所述人口统计类别内并且来自所述地理区域的对于所述网络位置的唯一访问者的估计数量;“#c00kieS”是在所述网络位置处观测到的在所述人口统计类别内并且来自所述地理区域的唯一用户标识符的数量;“c”是在所述人口统计类别内并且在所述地理区域内的唯一用户标识符的估计数量;“P”是在所述人口统计类别内并且在所述地理区域内的用户的估计数量;以及“ a ”是所述地理区域专用的参数。
40.根据权利要求39所述的系统,其中,所述唯一用户标识符包括cookie。
41.根据权利要求39所述的系统,其中,a是根据来自所述地理区域的用户的虚拟面板来确定的。
42.根据权利要求39所述的系统,其中,a是根据包括如下方程的非线性近似来确定的:其中,“c”是所述地理区域内的唯一用户标识符的估计数量;“p”是所述地理区域内的用户的估计数量;以及“ P ”是根据用户的虚拟面板确定的、独立于所述地理区域的参数。
43.根据权利要求42所述的系统,其中,P等于0.9。
44.根据权利要求38所`述的系统,其中,所述唯一用户标识符包括cookie。
【文档编号】G06F17/30GK103518200SQ201280022936
【公开日】2014年1月15日 申请日期:2012年4月12日 优先权日:2011年4月12日
【发明者】叶夫根尼·斯克沃尔佐夫, 卡尔·弗雷德里克·许比内特, 塔伊兰·耶尔德兹, 张鲁 申请人:谷歌公司

最新回复(0)