« 上一篇 Google analytics抽样数据:SEO祥子关于GA数据采样问题解答Google analytics受众特征:大多数网站用户特性被GA限制显示(年龄 性别 兴趣) 下一篇 »

Google Analytics笔记:GA显示通过移动网络访问的国外用户访问地区十分集中

昨天又在网站分析群里与数据分析师同行情解决了一个Google Analytics方面比较偏门的数据问题:网站数据库XX跟我一样,他们公司也使用GA做为网站分析工具,所不同的是,哥们儿这网站流量比较庞大而且是多语言站点。

这网站分析行遇到的在题是这样的:该网站包含多国语言,是典型的多语言网站,在分析西班牙用户访问地,发现该地区流量有异常。正常来说应该是印度占比超过80%,但是ga数据显示西班牙跟印度对等。该位网站分析师认为该批流量在GA里或存在偏差。

在听取了该网站流量情况后,本人SEO祥子建议其采用客户端语言做为辅助,结合GA给出的地区来定位用户所在地区。但是结果是不可行,因为该区多数用户使用“en-gb”语言编码,该编码为“英式英语”。

最终,我建议他尝试查看用户使用的ISP信息,即细分用户上网接入方式。果然,在此报表中发现,该地区用户多数通过移动端了手机访问网站,据网络公开信息查询,该地区许多用户仍使用2G网络上网,而一ISP包含“opera”信息。最终祥子结合曾经研究过的案例,认为这里该地区用户访问网站时,均使用了OPERA手机端浏览器,该浏览器使用了“网页加速”的技术,导致向其网站服务器发送请求的均为OPERA服务器而产生GA里用户所在地区十分集中的情况。

以下为昨天定位这个问题的交流记录:


网站分析师XX 17:17:21

我想知道ga是怎样判断用户地区的

网舟-宋希凯(1160810841) 17:17:16

ip

网站分析师XX 17:17:21

我网站有很多西班牙的流量。。。但是这个用户组成不合理

祥子@SEO<hcgltd@126.com> 17:17:48

有意思

网站分析师XX 17:17:49

如果使用vpn那就是判断的是vpn出口那个ip吗?

网舟-宋希凯(1160810841) 17:17:57

网站分析师XX 17:18:07

正常来说应该是印度占比超过80%

网站分析师XX 17:18:27
但是ga数据显示西班牙跟印度对等。。。求考证方向
网站分析师XX 17:20:03
我看看
老歪@WASNS.COM(113163846) 17:20:24
也有可能是用的代理服务器。
祥子@SEO<hcgltd@126.com> 17:21:06
这些用户使用什么语言操作系统,你可以用语言定位用户地域。做为一个辅助。

网站分析师XX 17:21:28


网舟-宋希凯(1160810841) 17:21:34
对,这个想法很棒
祥子@SEO<hcgltd@126.com> 17:21:38
主要维度 地区,次级维度语言
祥子@SEO<hcgltd@126.com> 17:22:12
再结合关键词,那应该就更准确罗
网站分析师XX 17:23:03

网站分析师XX 17:23:05
最多是en-gb

网站分析师XX 17:23:50
en也是印度人的一种通用语言
网站分析师XX 17:38:36
真的不知道en-gb这个是什么类型的编码

网站分析师XX 17:39:58
英式英语的编码

网站分析师XX 17:41:06
还是没法区分
网站分析师XX 17:41:11
祥子哥有啥办法
祥子@SEO<hcgltd@126.com> 17:41:22
没遇到过,想到再分享

网站分析师XX 17:43:20

我看地域出口都是集中在一个地方

网站分析师XX 17:43:57
这个会不会是欧洲一个比较集中放服务器的地方
祥子@SEO<hcgltd@126.com> 17:44:36
过于集中在两个点,就有点像机器流量了
网站分析师XX 17:45:02
细分下来看搜索词不集中的
祥子@SEO<hcgltd@126.com> 17:45:20
就算用代理或VPN,也不至于这么集中呀
网站分析师XX 17:45:42
印度那块正常也是一样的
网站分析师XX 17:45:51
我看trends印度用户都在一个区域。。。
祥子@SEO<hcgltd@126.com> 17:49:15
排除是移动网络么,国内的手机信号上网,显示本地局域网,不知在GA里是什么个情况

网站分析师XX 17:49:31
应该主要是移动网络
网站分析师XX 17:49:46
来源九成多都是移动的

祥子@SEO<hcgltd@126.com> 17:50:16
移动的可能存在这个问题,不过没研究过
网站分析师XX 17:50:41
恩,移动端口的ip估计不好拿吧
网站分析师XX 17:51:01
移动端输出的ip是一个局域算一个还是怎样呢。。。还是整个地区给一个总的呢
祥子@SEO<hcgltd@126.com> 17:51:46
国内应该存在这个问题,虽然我们手机上的IP是10.开头,但是在线路上可以知道是哪个地区

网站分析师XX 17:52:13

祥子@SEO<hcgltd@126.com> 17:52:14
你这数据做得很精细呀,很少人提出的问题
网站分析师XX 17:52:22
今晚哪个手机去坐公交车就知道了

网站分析师XX 17:52:35
没办法移动端流量很大。。。印度全是2g

网站分析师XX 17:55:28

网站分析师XX 17:55:35
trends的数据还真是集中在一点的

网站分析师XX 17:55:41
这是西班牙的
网站分析师XX 17:55:46
我搜索uc browser的关键词

祥子@SEO<hcgltd@126.com> 17:59:23
这个报表看能不能发现点什么(即建议该数据分析师试图通过用户上网方式来定位问题)


网站分析师XX 17:59:40

看看

网站分析师XX 18:01:28

网站分析师XX 18:01:44
你看都是啥opera的,我怀疑opera浏览器隐藏了很多东西。

祥子@SEO<hcgltd@126.com> 18:04:25

我想明白了
网站分析师XX 18:04:36
求解
祥子@SEO<hcgltd@126.com> 18:06:50
记得N年前,在WAP时代关注过一件事,用UC服务器的时候,UC会搞个什么网页压缩技术,意思是你请求的页面,到UC服务器上转一圈,把页面所有内容给压缩一遍,再传给你这客户端。所以在GA里,显示的IP其实是UC的服务器,因为它才向你的服务器发送请求。这就是所谓的云加速。

网站分析师XX 18:07:37
中间件

abbo@datapanda(328966783) 18:07:52
现在uc也有这个功能号称页面加速

网站分析师XX 18:07:59
webkit那些东东
祥子@SEO<hcgltd@126.com> 18:08:03
是的
wade@广州(793820970) 18:08:05
都不知道有多少流量没统计到
网站分析师XX 18:08:09
我去看看公司的科普文档
wade@广州(793820970) 18:08:14
js当广告过滤

网站分析师XX 18:08:28
解析完css+dom之后会做一个中间件处理的
网站分析师XX 18:08:37
其实就是服务器处理再返回给用户
wade@广州(793820970) 18:08:49
是的
网站分析师XX 18:08:59
那样可能返回的ip就是uc中间件触发到js的地址?
网站分析师XX 18:09:10
那看看那个地方是不是有中间件的集群就知道了
祥子@SEO<hcgltd@126.com> 18:09:18
我想是的,问下你们技术大大,他们应该很懂吧

网站分析师XX 18:21:03

浏览器那钟中间件的服务器是集群来的

所以有这个可能

被弄到集中一点了