近日,在百度统计后台管理中广告宣传泛滥成灾,包含收流量、代开票、SEO、云服务器这些广告宣传,严重的影响到了日常的数据分析,因此 想办法彻底解决这个问题,分享给网站站长们。
百度统计被刷广告的表现
假如你的百度统计被故意刷广告的情况下,你就会在百度统计后台管理里的搜索关键词、来源于等见到各种各样广告宣传,包含收流量、代开票、SEO、云服务器这些广告宣传,比如我下面的截屏,许多真正的流量被刷找不到,并且流量也会导致统计分析不准确,很有可能觉得近期几日流量暴增,但具体真正流量并并没有那么大。
百度统计被刷广告的原理
要想药到病除,就必须知彼知己,搞清楚这些人实际操作的原理之后,就可以合理的抵制这些人无底线的刷广告。
这些人是这样做的,先写一个机器爬虫,抓取网页页面內容,找到「hm.baidu.com/hm.js」如果找到就表明你使用了百度统计,随后再取后边的主要参数,就获得了你的百度统计ID,随后储存到数据库查询,取得你的的百度统计ID之后,就可以开展下一步,使用程序流程大批量的给百度统计接口传送数据,换句话说这种內容这些人压根并不是真得去你的网站,反而是直接给百度统计的接口提交了数据信息,对你的网站流量并没有任何贡献,你只有看广告宣传的份。
我是被刷广告刷的很严重,是在恨之入骨,必须彻底解决一下这些人了。
百度统计被刷广告的解决方案
大家懂了这些人的原理,现在就开始一招制敌,破译这些人的刷广告的方式。
首先,你的旧的统计代码ID早已被这些人获得到,储存到这些人的数据库查询,因此 建议旧的编码就舍弃吧,去百度统计删掉掉,再增加网站,你就会得到一个新的统计代码。
随后,为了更好地让这些人的网页爬虫鉴别不上百度统计编码,大家必须将百度统计的URL详细地址做一个转换,我的方法是将原来的百度统计URL详细地址打撒成一个一个的字符串数组,随后再组装起來,案例如下:
百度统计让我们的编码:
(function(){
varhm=document.createElement("script");
hm.src="https://hm.baidu.com/hm.js?ee1f19877cfc9bcd61a1d260f5be41e1";
vars=document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(hm,s);
})();
将百度统计的特点,也就是详细地址打撒成数组,再拼装使用:
(function(){
varhm=document.createElement("script");
varanalytics_bd='ee1f19877cfc9bcd61a1d260f5be41e1';
hm.src=['ht','t','ps',':/','/h','m','.','ba','i','d','u.c','o','m/','h','m','.j','s?',analytics_bd].join('');
vars=document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(hm,s);
}
)();
必须修改的就只有一行,留意「hm.src=”https://hm.baidu.com/hm.js?ee1f19877cfc9bcd61a1d220asdals21hkjhh”;」这行编码,被拆开为数组,随后再组装起來使用。这样这些人的网页爬虫就无法识别到你一直在使用百度统计了。
来源:https://www.renfei.net/posts/1003425