对于产品来说,用户通过什么渠道进入产品,是每一位产品都必须搞清楚的问题,而渠道归因成为了数据分析的重要方法。
渠道归因,通常是指每一个设备的激活会对应于某次点击。举例来说,在广告投放过程中,广告主为了投放效果,会同时选择多个渠道投放广告;这就使得一个目标用户可能在一天内先后点击了多个渠道的广告,最后下载安装并启动了该产品。
我们通过内置SDK 获得了这次激活数据,却并不知道这个设备的激活是基于什么渠道的点击,这就需要进行渠道归因。目前移动广告生态系统是由 lastclick归因模型驱动,在此模型中,安装归功于提供最后点击的渠道。
一、激活归因逻辑
要采取lastclick归因模式,先来了解下如何将点击设备和激活设备进行一一对应。下图是TrackingIO进行渠道归因的流程图,分别通过数据上报收集每次点击数据、激活数据,再根据设备信息进行匹配lastclick。匹配成功,该设备的激活将被归于对应点击渠道的推广活动。
实际上,我们获得点击数据和激活数据的方式是不同的:点击数据是通过热云提供的追踪短链来获取每一次点击的设备信息(ip、ua、部分渠道提供设备id);每个短链会关联具体的渠道、推广活动信息;激活信息是通过内置热云SDK,通过SDK上报得到设备信息(ip、ua、设备id)。
正常情况下,我们通过设备id进行激活归因,精准性是比较高的。但因为渠道不同,每一次点击我们一定可以获取到的是ip和ua,部分合作渠道会上报设备id。在渠道方不上报设备id的前提下,我们就需要利用可以获取到的ip和ua信息进行激活归因。通过比对ip及ua信息中的手机型号、系统版本等确定唯一设备。其中,系统版本因为会设计升级等情况,所以通常要求为激活系统版本大于等于点击系统版本即可。
二、归因回溯窗口设
为了市场投放人员灵活的根据实际情况对推广活动进行检测,TrackingIO提供了可配置的归因回溯窗口。在推广参数管理中,数据有效期设置可以对激活匹配点击有效期进行配置。如下图,为配置界面。
那么什么是归因回溯窗口,又为什么要进行归因回溯窗口的配置呢?
1.什么是归因回溯窗口
归因回溯窗口,也就是激活匹配点击的回溯天数;一次广告点击和一次安装启动之间经过的时长,超过这个时长,将不会归因于该次点击。比如,一个用户2017.8.1号通过渠道A点击了广告,2017.8.6号安装了该应用;假设该用户在点击A渠道广告后并未点击其他渠道广告。那么在进行归因操作时,如果设置的回溯窗口为一天,则该次安装不会归因于该渠道的推广活动;如果设置的回溯窗口为七天,则该次安装归因于该渠道的推广活动。
2.为什么进行归因回溯配置
根据不同时期广告投放属性的不同,对归因回溯周期也会有不同需求,就需要进行配置。比如:
- 如果短期投放,对于投放周期为1天的推广,可以将回溯周期调整为1天。
- 如果是投放周期较长的一些应用,在用户安装之前,需要进行多个推广活动的互动。例如,售价较高或初始下载文件较大的应用通常具有很长的引导周期。延长归因回溯窗口位投放员在各个渠道提供了更广阔的视野和更多分析信息。
- 如果是配合某个活动的长期推广,可以将回溯周期适当调整与活动时间一致。
三、数据处理
1.数据的排重处理
通过以上2步,我们可以初步获得每个渠道-推广活动的点击数、激活数。然而实际应用中,我们还需要对数据进行排重处理。比如,同一用户可能在一天内多次点击某个广告,或者将某开发者的app安装卸载,再安装再卸载;如果不进行排重,就无法确切知道,实际上有多少设备发生了点击、激活行为。
TrackingIO提供可配置的排重窗口,以结合产品特性、广告投放特性进行排重设置。如下图,为排重窗口配置界面。
点击有效期/激活有效期,是指在设定有效期内,同一设备多次点击/激活计为1个点击设备/激活设备,若超出这个有效期计为一个新的点击设备/激活设备,此规则用于排重点击/排重激活设备数的计算。通常情况下,点击有效期长短的设置会与广告投放周期相匹配,激活有效期回相对后延,根据产品特性确定。
2.防作弊模型配置
在广告投放过程中,有些渠道为了自身利益,会选择刷量作弊以获取更多的广告费用。为了帮助广告主省钱,提供防作弊模型配置功能,将推广过程中的假量分辨出来。我们提取作弊数据特征,建立防作弊模型,并可以进行开放配置。如下图,为作弊数据设备界面。
- 针对点击到激活时间特征,通过配置点击到激活时间差值的最小值上限,过滤出不符合实际情况的点击和激活。
- 针对作弊数据ip离散度密集这一特征,我们提供基于ip段的防作弊策略,设置1天内单个ip激活产品个数,1天内单ip点击广告个数来过滤出异常的点击和激活。
关于防作弊的具体方法及特征,之后会有文章进行具体说明,这里不再详述。
3.指标说明
通过对数据有效期和作弊数据的设置,我们可在推广活动详情中,看到原始数据值和经过处理后的数据值。如下图,排重点击数、排重激活设备数、异常点击总数、异常激活设备数都是根据设置的参数值,得到对应参数下的点击、激活数据。点击总数为所有点击上报的总数,有效点击总数为去除异常点击数后的值。所以,点击总数=有效点击总数+异常点击总数。
四、结语
通过以上流程,我们能够获得不同渠道的点击、激活数据;而当目标用户首次启动并开始使用该产品后,我们会通过SDK获取该渠道下激活的设备后续操作,如登录、付费及付费金额等数据,这就为我们的数据分析提供了基础。TrackingIO提供Track和IO两个维度的分析,即广告效果监测(包括来源分析、渠道效果对比、注收比等功能)和用户行为分析(漏斗分析、留存分析、事件分析等多维分析),这些功能的原理及使用案例和场景我们会在后续文章里陆续给予说明。