如何排除Google Analytics数据中的垃圾流量?

无论是查看网站流量数据,还是根据流量数据调整AdWords广告投放,Google Analytics都是不可或缺的工具。
很多耀阳会群友问David锅「微信:32661099」,在GA中发现,有很多点击网站,但又没有浏览时间(工况阶段时长在GA显示00:00:00)、且直接跳出的流量,无法判定用户行为。
我们正在耀阳会「知识星球」,和会员朋友们讨论有趣的话题,你一起来向David锅提问切磋吧?点此加入「耀阳会知识星球」!
其实,这些都是所谓的“垃圾流量”,如果不想办法进行排查和排除,很容易对站点的流量判断造成困扰和误导。

GA垃圾流量的构成
✓ 幽灵流量
严格定义为Ghost traffic, or ghost referral, 这种流量其实未曾点击你的站点任何页面,也没有pass你站点的服务器,但呈现在你的GA数据,非常之可恶!
✓ 爬虫流量
爬虫既有搜索引擎的官方爬虫,也有Spam来源的爬虫,「David锅微信:32661099」,与幽灵流量不同,爬虫流量会有网站驻留市场数据,也会影响你的跳出率数据,也是极为困扰。

GA垃圾流量的成因
幽灵流量成因主要是有其他站点使用了与你站点雷同的媒体资源ID,造成各种数据异常,工作时间00:00:00 + 跳出率100%这两个数据特征,基本可以判定为垃圾流量;
而爬虫流量在GA的流量类型,显示为Referral,看到引荐流量的归因,千万不要窃喜,GA基本还会标记为100%的新会话,自然也是100%的跳出率了。
举例一个常见场景,爬虫流量也可能是因为大量文章内容刮取工具,「David锅微信:32661099」,强奸你的网站批量采集内容,通过伪原创大量复制内容,被搜索引擎判定为雷同,又会恶性循环增加优良流量数据.....

最臭名昭著的垃圾流量Spam Traffic
其中最臭名昭着的是darodar和semalt,还有许多与他们类似玩法的流量流氓们。 
这不是真正的流量,只是垃圾邮件,让你访问他们的crappy网站,植入各种针对网站管理员权限的服务,加上随机的病毒/恶意感染(这就是你不应该访问它们的原因!)。
这是虚假流量,「David锅微信:32661099」,仅在Google Analytics中可见。 
而此流量并未真正hit你的服务器。 

如何剔除垃圾流量?
- Filter ghost traffic过滤

以下被“隐藏”内容,仅供耀阳会注册会员阅读,关注微信公众号(ID: 耀阳会),即可成为会员。

此处内容已经被作者无情隐藏,请输入验证码查看内容
验证码:
请关注耀阳会官方微信公众号,回复关键字“GoogleAnalytics_309”,获取验证码。
(1)用手机微信扫描公众号二维码,或直接搜索“耀阳会”即可关注哦!
(2)用手机微信扫描千聊二维码,即可观看本篇文章对应的完整视频教程。

以上被“隐藏”的内容,仅供耀阳会注册会员阅读,关注微信公众号(ID: 耀阳会),即可成为会员。

- 爬虫流量过滤
✓ 服务器爬虫类型定义
✓ 允许search engine爬虫
✓ 禁用非搜索引擎类爬虫
✓ define referral traffic
✓ define direct traffic「David锅微信:32661099」

我们正在耀阳会「知识星球」,和会员朋友们讨论有趣的话题,你一起来向David锅提问切磋吧?点此加入「耀阳会知识星球」!
David锅「微信:32661099」很奇怪,凭谷歌的技术能力,很容易在系统服务层面轻易的剔除这些垃圾流量,但为何放任这些数据去干扰外贸独立站长,匪夷所思,也可能担心机器的数据误杀吧...
然而,事已至此,那就见招拆招、遇佛杀佛了!

book
vx  耀阳会微信公众号 关注
声明:耀阳会网站文字及图片版权受法律保护,无David书面许可不得转载。若同意转载,必须以超链接形式标明文章原始出处和作者。