问:Google Adsense fraud clicking(欺骗点击作弊)的分析有哪些?
答:随着在线广告的流行,pay by per click(每次点击付钱)的模式逐渐被大家接受。可是随之而来的问题就是fraudclicking(欺骗点击作弊)的预防迫在眉捷,因为这将直接关系到这种广告模式能否长久生存和能否成为一种真正的网站拥有者的收入来源。
下面介绍Google Adsense系统如何从系统角度出发防止点击欺骗,希望对其他的在线广告系统防止虚假点击能有很好的指导作用:
1.点击率=点击次数/共浏览的次数 #of Click/# of Viewed 点击率是一个判断是否有无fraud clicks的关键的方法,可以想像一个网站上的广告的点击率超过10%将意味这什么。
2.点击覆盖率/独立IP Ratio VS IP distribution 这个分布里如果有单个IP的(点击/浏览)=点击覆盖率超出了3倍的系统误差范围内将有作弊的嫌疑。例子,例如来自211.157.36.13的用户浏览了16个网页,点击了4个广告,而整个广告的点击率“从(1.)里计算的到”是5%,那么计算得到:5%×16=1,方差为Sqrt(1)=1,点击覆盖率=4/1=4 ,根据数学上高斯分布,这种概率小于万分之一。
3.点击覆盖率/IP/时间 Ratio VS time 根据时间序列对点击率进行分析,如果在某一个时间段上有明显的峰值,那么这将以为着有潜在的欺骗点击的可能。
4.网页读取的时间和广告点击时间差的分析 [time of loading - time of click] distribution VS Possion 网页读取的时间和广告点击时间差应该是一个泊松分布possion/distribution。
5.每两次点击之间时间差序列的分析 [time difference of two clicks] distribution VS Possion/Gaussion 每两次点击之间的时间差也应该是一个Possion distribution,如果这个时间用秒记,大于25秒的话基本上呈现高斯分布的形状。
6.针对Proxy点击的分析 Reverse Proxy check 改变IP进行点击可以说在以往是最难以解决最难以发现作弊方式,大概国人进行Alexa的Boost时就多半采用了Proxy进行虚假点击的方法,可是这里只要通过反向监查IP的来源是否是带有Proxy功能的服务器就可以知道了。
7.针对http_agent的分析 Http_agent/时间的时间序列的分析,峰值超过3方差需要审查。
8.针对http_referral的分析 referral/时间的时间序列的分析,峰值超过3方差需要审查。
9.每千次展示费用的均值/独立IP Overall Ratio VS IP 这个将能更加直接找到作弊点击的运行计算机并且予以封杀。
2008年11月8日星期六
订阅:
博文评论 (Atom)
没有评论:
发表评论