一种精准推荐中的频次控制方法及装置的制造方法
【技术领域】
[0001] 本发明设及计算机视频领域,尤其设及一种精准推荐中的频次控制方法及装置。
【背景技术】
[0002] 频次控制是控制一个用户在指定的时间内看到的一个素材的最多次数,是精准定 向技术的核屯、手段之一。其中,素材可W是广告投放系统投放的广告或推送的信息。例如 Publisher可W限制一个用户最多只能一天(24小时)内看到同一个素材Ξ次,Publisher为 广告主刊登广告的人。本文中的频次控制是严格的频次控制,即达到所设的次数上限的时 候,会完全不展示该素材。
[0003] 在精准推荐中,并不是频次越高越好。一方面,过少的接触诚然不会在用户屯、中产 生印象;另一方面,过多的接触反而会使接触的用户产生不快与厌恶。1972年,美国屯、理学 家化rbert E. Krugman经过研究提出了著名的"Ξ打理论",确立了消费者接触广告Ξ次的 屯、理学关系:第一次好奇:"运个广告是什么?";第二次是认识:"干什么用的?";第Ξ次是判 断:"对广告产生什么印象?"。当然,因为产品、市场、品牌、竞争、创意W及媒体等不同,在频 次设置上也会有所不同,不过,对广告的有效接触频次限定一般都是W3次为底限的。对于 互联网广告,技术手段能够记录到的展示,在广告位置差异的影响下,离有效展示有相当大 的距离,因此无法直接套用"Ξ打理论"。但是,一般情况下,随着用户看到同一个创意频次 的上升,点击率一般都是呈下降趋势的。因此,在按照CPM采买流量时,广告主有时会要求根 据频次控制某个用户接触到某创意的次数,W达到提高性价比的目的,CPM Cost Per Mille为千次展示收入。特别是在视频广告运样有效曝光程度较高的广告产品中,频次控制 的意义和重要性尤为显著。
[0004] 频次控制的实现有两种方式,客户端方式和服务端方式。客户端方式主要是利用 用户浏览器中的cookie信息,存储访问的素材的次数。当请求服务器的时候,将该信息传递 到服务器,服务器根据解码之后的次数,来判断是否达到频次的上限,从而实现过滤部分 素材的功能。具体细节可W参考专利《一种广告投放频次控制方法及装置》。客户端方式的 缺点是扩展性不好,但是,在移动应用广告中利用SDK做前端投放控制的场景,客户端的方 案是非常好的选择。服务端方式需要在后台设置存储访问次数的缓存,当访问到来时,从缓 存中获取到访问的频次,根据设置的频次上限,从而过滤掉达到上限的素材。
[0005] 当投放系统需要查询某一个终端guid达到上限的素材itemID时,有两种方法,一 是利用类似guid:*的模糊查询方式,如果是guid:*的方式,KV数据库大多会需要全表扫描, 对于数据达到亿级别的数量的话,时间上是不能容忍的。二是利用guid: itemIDl,guid: itemID2等,一个一个的查询每个itemID的情况,即使是运种方式,也是需要o(n)的时间复 杂度,η是itemID的数量。
[0006] 由于投放系统集群对响应时间要求非常高,频次控制的部分需要在5ms之内得出 需要被过滤掉的item。采用上述存储结构的情况下,超时率大约在20%左右,基本处于不可 用状态。
[0007]综上所述,现有技术存在W下缺陷:使用客户端cookie的方案,cookie变得很重, 记录的量也有限。由于精准推荐系统要支持多种客户端,]?〇13;[16-'\¥613(手机端¥613)、曰9口等, 如果采用客户端的方案,需要每个地方都做修改,成本也比较高,而采用服务端的方案扩展 性好,只用修改一个地方,对于新的推广位也不用再次开发。另外,现有的投放系统查询速 度慢,降低了用户体验。
【发明内容】
[000引为了解决上述技术问题,本发明提供了一种精准推荐中的频次控制方法,包括:
[0009] S1、提取服务器中记录的视频访问日志信息,所述日志信息包括视频访问终端的 终端信息、所述视频访问终端所访问的素材的信息和所述视频访问终端访问所述素材的访 问次数;所述日志信息还包括所述视频访问终端访问所述素材的访问时间;
[0010] S2、存储所述日志信息,其中,所述终端信息包括终端标识,所述素材的信息包括 素材标识;存储所述日志信息包括将所述终端标识、素材标识及访问次数对应存储;
[0011] S3、建立索引结构,所述索引结构用于存储在预定时间内,访问次数超过预设的 访问上限时对应的终端标识和素材标识;
[0012] S4、查找所述索引结构中对应于目标终端标识的素材标识,在向目标终端投放素 材时,滤除查找到的素材标识对应的素材。
[0013 ]进一步地,步骤S2中所述的将所述终端标识、素材标识及访问次数对应存储包括: 将一个终端标识与该终端访问的一个素材的素材标识及该终端访问该素材的访问次数对 应存储。
[0014] 进一步地,步骤S2中所述的存储所述日志信息包括:将所述日志信息存入Key-Value数据库中,其中,将所述终端标识和素材标识作为k巧值,将所述访问次数作为ralue 值。
[0015] 进一步地,所述将所述终端标识和素材标识作为key值包括:将一个终端标识与该 终端访问的一个素材的素材标识作为一组key值。
[0016] 进一步地,所述终端标识为web端的cookie或移动终端的设备唯一 ID。
[0017] 本发明提供了一种精准推荐中的频次控制装置,包括:
[0018] 提取模块,用于提取服务器中记录的视频访问日志信息,所述日志信息包括视频 访问终端的终端信息、所述视频访问终端所访问的素材的信息和所述视频访问终端访问所 述素材的访问次数;
[0019] 存储模块,用于存储所述日志信息,其中,所述终端信息包括终端标识,所述素材 的信息包括素材标识;存储所述日志信息包括将所述终端标识、素材标识及访问次数对应 存储;
[0020] 索引模块,用于建立索引结构,所述索引结构用于存储在预定时间内,访问次数超 过预设的访问上限时对应的终端标识和素材标识;
[0021 ]过滤模块,用于查找所述索引结构中对应于目标终端标识的素材标识,在向目标 终端投放素材时,滤除查找到的素材标识对应的素材。
[0022]进一步地,存储模块中所述的将所述终端标识、素材标识及访问次数对应存储包 括:将一个终端标识与该终端访问的一个素材的素材标识及该终端访问该素材的访问次数 对应存储。
[0023] 进一步地,存储模块中所述的存储所述日志信息包括:将所述日志信息存入Key-Value数据库中,其中,将所述终端标识和素材标识作为k巧值,将所述访问次数作为ralue 值。
[0024] 进一步地,所述将所述终端标识和素材标识作为key值包括:将一个终端标识与 该终端访问的一个素材的素材标识作为一组key值。
[0025] 进一步地,所述终端标识为web端的cookie或移动终端的设备唯一 ID。
[0026] 有益效果:本发明通过提取服务器中记录的视频访问日志信息,获取视频访问终 端的终端信息、视频访问终端所访问的素材的信息和视频访问终端访问素材的访问次数; 并将终端标识、素材标识及访问次数对应存储;建立索引结构,索引结构用于存储在预定时 间内,访问次数超过预设的访问上限时对应的终端标识和素材标识;查找索引结构中对应 于目标终端的素材的信息,在向目标终端投放素材时,滤除查找到的素材的信息。本发明针 对一层的Key-Value数据结构,加了一层索引的结构,大大提升了查询的速度,从而能够有 效地提高用户的观看体验,增加受众数量,可W让更多的浏览者看到素材,不至于使某些素 材过多地曝光给某些浏览者。本发明还能够提高广告主的运营控制能力,广告主可W针对 推荐计划自由的设置素材的过期周期和具体的频次N,达到提高性价比的目的。
【附图说明】
[0027] 为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施 例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅 仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下, 还可W根据运些附图获得其它附图。
[0028] 图1是本发明实施例提供的精准推荐中的频次控制方法的实现流程图;
[0029] 图2是本发明实施例提供的精准推荐中的频次控制方法的控制逻辑图;
[0030] 图3是本发明实施例提供的精准推荐中的频次控制系统框图。
【具体实施方式】
[0031] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其 他实施例,都属于本发明保护的范围。
[00创实施例;
[0033 ]请参见图1,本发明提供了一种精准推荐中的频次控制方法,包括:
[0034] S1、提取服务器中记录的视频访问日志信息,所述日志信息包括视频访问终端的 终端信息、所述视频访问终端所访问的素材的信息和所述视频访问终端访问所述素材的访 问次数;
[0035] S2、存储所述日志信息,其中,所述终端信息包括终端标识,所述素材的信息包括 素材标识;存储所述日志信息包括将所述终端标识、素材标识及访问次数对应存储;
[0036] S3、建立索引结构,所述索引结构用于存储在预定时间内,访问次数超过预设的访 问上限时对应的终端标识和素材标识;
[0037] S4、查找所述索引结构中对应于目标终端标识的素材标识,在向目标终端投放素 材时,滤除查找到的素材标识对应的素材。
[0038] 频次控制的服务端的实现方式主要利用的是系统中生成的日志中的相关信息,日 志中会记录每个视频访问终端对应的访问素材的。如表1所示,本实施例中,利用storm提取 线上服务器集群中的日志信息,将视频访问终端和对应的访问素材信息存入KV数据库中, KV数据库是Key-Value数据库的简写,优选使用red
iseguid代表视频访问终端,每个终端对 应一个guid,item_id代表访问素材,对素材进行编号如itemIDl、;[161]1102、;[161]1103。并把 guid: item_id作为k巧值,访问次数作为value值。例如第一次设置的时候,键值对<旨111(1: item_id,l>将存入KV数据库中,并设置好过期时间。W预先设定的时间范围为周期,在该时 间范围内统计访问次数,超过该时间范围则过期,重新统计访问次数。当日志中再次出现该 guid和item_id的时候,将会自增guid: item_id对应的value值。KV数据库中的数据内容如 下表1所示:
[0039] 表1 KV数据库存储内容
[0040]
[0041] 投放系统集群,在投放过程中,会从KV数据库中,查询该guid的各个item的频次的 情况,将value值中达到预定上限的item过滤掉。频次控制的实现图如图2所示。
[0042] 现有技术中,当投放系统需要查询某一个guid达到上限的itemID时,有两种方 法,一是利用类似guid:*的模糊查询方式,如果是guid:*的方式,KV数据库大多会需要全表 扫描,对于数据达到亿级别的数量的话,时间上是不能容忍的。二是利用guid: itemlDl, guid: itemID2等,一个一个的查询每个i temID的情况,即使是运种方式,也是需要ο (η)的时 间复杂度,η是itemID的数量。
[0043] 由于投放系统集群对响应时间要求非常高,频次控制的部分需要在5ms之内得出 需要被过滤掉的item。采用上述存储结构的情况下,超时率大约在20%左右,基本处于不可 用状态。
[0044] 鉴于上述原因,进一步对频次控制的KV存储部分进行了优化,加入了一层索引结 构,只存储用户的超过频次控制的item_id,投放系统直接从KV存储中获取到需要被过滤掉 的item_id。
[0045] 建立索引结构原理的伪代码如下:
[0046] key =邑uid: item_id;
[0047] boolean isExist = exist化ey);//判断KV存储中,是否存在key值guid: item_id
[004引 if (isExist) {//如果存在表明该key值还未过期
[0049] result = incr化巧,1);//针对该k巧值的count,自增1,返回结果是自增完之后的 结果
[0050] if(result〉= frequency){/7自增完之后,如果大于设置的频次,则放入索引结构 中
[0化1 ] setex(guid, item_id, time);//可W利用redis的hash结构,time存储过期的时 间,此处键为guid
[0化 2] }
[0053] }else{//不存在该k巧值的时候,可能是第一次访问,也可能是之前的访问过期了
[0054] deKguid, item_id);//先对hash结构中的guid, item_id项进行删除操作 [0055] setex化ey, 1 ,time);//设置count为1,并设置好过期时间
[0化6] }
[0057]建立索引结构之后,KV数据库中某一时间存储的内容如下表2所示:
[0化引表2加入索引之后KV数据库存储内容 [0化9]
[0061]假设预设的访问次数上限为3的话,则投放系统查询达到频次控制上限的i加寸,贝U 只需要Wguid为Key值,查询对应的Value,并取itemID中对应的时间大于当前时间的 itemID。如表2中所示的话,则只需要查询KV数据库一次,即可得到了需要过滤掉的itemID 为itemID3和itemID4。且由表2可见,索引结构中不设置过期日期。
[0062 ]相应地,本发明提供了一种精准推荐中的频次控制装置,包括:
[0063] 提取模块,用于提取服务器中记录的视频访问日志信息,所述日志信息包括视频 访问终端的终端信息、所述视频访问终端所访问的素材的信息和所述视频访问终端访问所 述素材的访问次数;
[0064] 存储模块,用于存储所述日志信息,其中,所述终端信息包括终端标识,所述素材 的信息包括素材标识;存储所述日志信息包括将所述终端标识、素材标识及访问次数对应 存储;
[0065] 索引模块,用于建立索引结构,所述索引结构用于存储在预定时间内,访问次数超 过预设的访问上限时对应的终端标识和素材标识;
[0066] 过滤模块,用于查找所述索引结构中对应于目标终端标识的素材标识,在向目标 终端投放素材时,滤除查找到的素材标识对应的素材。
[0067] 本发明通过提取服务器中记录的视频访问日志信息,获取视频访问终端的终端信 息、视频访问终端所访问的素材的信息和视频访问终端访问素材的访问次数;并将终端标 识、素材标识及访问次数对应存储;建立索引结构,索引结构用于存储在预定时间内,访问 次数超过预设的访问上限时对应的终端标识和素材标识;查找索引结构中对应于目标终端 的素材的信息,在向目标终端投放素材时,滤除查找到的素材的信息。本发明针对一层的 Key-Value数据结构,加了一层索引的结构,大大提升了查询的速度,从而能够有效地提高 用户的观看体验,增加受众数量,可W让更多的浏览者看到素材,不至于使某些素材过多地 曝光给某些浏览者。本发明还能够提高广告主的运营控制能力,广告主可W针对推荐计划 自由的设置素材的过期周期和具体的频次N,达到提高性价比的目的。
[0068] W上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员 来说,在不脱离本发明原理的前提下,还可W做出若干改进和润饰,运些改进和润饰也视为 本发明的保护范围。
【主权项】
1. 一种精准推荐中的频次控制方法,其特征在于,包括: 51、 提取服务器中记录的视频访问日志信息,所述日志信息包括视频访问终端的终端 信息、所述视频访问终端所访问的素材的信息和所述视频访问终端访问所述素材的访问次 数; 52、 存储所述日志信息,其中,所述终端信息包括终端标识,所述素材的信息包括素材 标识;存储所述日志信息包括将所述终端标识、素材标识及访问次数对应存储; 53、 建立索引结构,所述索引结构用于存储在预定时间内,访问次数超过预设的访问上 限时对应的终端标识和素材标识; 54、 查找所述索引结构中对应于目标终端标识的素材标识,在向目标终端投放素材时, 滤除查找到的素材标识对应的素材。2. 根据权利要求1所述的精准推荐中的频次控制方法,其特征在于,步骤S2中所述的将 所述终端标识、素材标识及访问次数对应存储包括:将一个终端标识与该终端访问的一个 素材的素材标识及该终端访问该素材的访问次数对应存储。3. 根据权利要求1或2所述的精准推荐中的频次控制方法,其特征在于,步骤S2中所述 的存储所述日志信息包括:将所述日志信息存入Key-Value数据库中,其中,将所述终端标 识和素材标识作为key值,将所述访问次数作为value值。4. 根据权利要求3所述的精准推荐中的频次控制方法,其特征在于,所述将所述终端标 识和素材标识作为key值包括:将一个终端标识与该终端访问的一个素材的素材标识作为 一组key值。5. 根据权利要求1、2或4所述的精准推荐中的频次控制方法,其特征在于,所述终端标 识为web端的cookie或移动终端的设备唯一ID。6. -种精准推荐中的频次控制装置,其特征在于,包括: 提取模块,用于提取服务器中记录的视频访问日志信息,所述日志信息包括视频访问 终端的终端信息、所述视频访问终端所访问的素材的信息和所述视频访问终端访问所述素 材的访问次数; 存储模块,用于存储所述日志信息,其中,所述终端信息包括终端标识,所述素材的信 息包括素材标识;存储所述日志信息包括将所述终端标识、素材标识及访问次数对应存储; 索引模块,用于建立索引结构,所述索引结构用于存储在预定时间内,访问次数超过预 设的访问上限时对应的终端标识和素材标识; 过滤模块,用于查找所述索引结构中对应于目标终端标识的素材标识,在向目标终端 投放素材时,滤除查找到的素材标识对应的素材。7. 根据权利要求6所述的精准推荐中的频次控制装置,其特征在于,所述存储模块中所 述的将所述终端标识、素材标识及访问次数对应存储包括:将一个终端标识与该终端访问 的一个素材的素材标识及该终端访问该素材的访问次数对应存储。8. 根据权利要求6或7所述的精准推荐中的频次控制装置,其特征在于,所述存储模块 中所述的存储所述日志信息包括:将所述日志信息存入Key-Value数据库中,其中,将所述 终端标识和素材标识作为key值,将所述访问次数作为value值。9. 根据权利要求8所述的精准推荐中的频次控制装置,其特征在于,所述将所述终端标 识和素材标识作为key值包括:将一个终端标识与该终端访问的一个素材的素材标识作为
【专利摘要】本发明公开了一种精准推荐中的频次控制方法和装置。本发明通过提取服务器中记录的视频访问日志信息,获取视频访问终端的终端信息、视频访问终端所访问的素材的信息和视频访问终端访问素材的访问次数;并将终端标识、素材标识及访问次数对应存储;建立索引结构,索引结构用于存储在预定时间内,访问次数超过预设的访问上限时对应的终端标识和素材标识;查找索引结构中对应于目标终端的素材的信息,在向目标终端投放素材时,滤除查找到的素材的信息。本发明针对一层的Key-Value数据结构,加了一层索引的结构,大大提升了查询的速度,从而能够有效地提高用户的观看体验,增加受众数量,可以让更多的浏览者看到更多的素材。
【IPC分类】H04N21/45, H04N21/466
【公开号】CN105491454
【申请号】CN201510829136
【发明人】杨志中, 蔡振宇, 吕红亮, 单明辉, 尹玉宗, 顾思斌, 潘柏宇, 王冀
【申请人】合一网络技术(北京)有限公司
【公开日】2016年4月13日
【申请日】2015年11月25日