最近在操作到一个门户网站的GA的问题时,发现trackPageview的问题很严重。不知为何google抓取了里面的虚拟页面,造成十万数量级的404错误页面,google抓取统计也非常不正常。。。百度没有统计,不过就google这点来说,需立即解决。
众所周知,搜索引擎是不爬取JS里面的文件的,可也仅仅代表过去,经过多方测试,百度、google都可以识别js里面的内容了,这也是那些通过js跳转的网站往往会被惩罚的原因。
正常的GA代码,我们一般是不设trackPageview里面的url的,直接都是默认的
_gaq.push([‘_trackPageview’]); 形式
而在实际案例中,因为需要统计每个页面的具体详情,设置了trackPageview后面的url。
具体分析了一下:
情况大致是前后符号不统一引起的。
<script type=”text/javascript”>
var _gaq = _gaq || [];
_gaq.push([‘_setAccount’, ‘UA-xxxxx-1’]);
_gaq.push([‘_setDomainName’, ‘hulian123.com’]);
_gaq.push([‘_addOrganic’, ‘baidu’, ‘word’]);
_gaq.push([‘_addOrganic’, ‘soso’, ‘w’]);
_gaq.push([‘_addOrganic’, ‘3721’, ‘name’]);
_gaq.push([‘_addOrganic’, ‘yodao’, ‘q’]);
_gaq.push([‘_addOrganic’, ‘vnet’, ‘kw’]);
_gaq.push([‘_addOrganic’, ‘sogou’, ‘query’]);
_gaq.push([‘_trackPageview’,”/江苏站/资讯/首页”]);
(function() {
var ga = document.createElement(‘script’); ga.type = ‘text/javascript’; ga.async = true;
ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’;
var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(ga, s);
})();
</script>
其中_gaq.push([‘_trackPageview’,”/江苏站/资讯/首页”]); 和里面的符号没有关系,google对此类url是有抓取的,以为是页面的一个相对url,造成了爬取,当然此页面不存在,导致了无数404,十万级的404,相对恐怖了。。。
————————此处后期更新——————————
2013年1月最新更新:经常查阅相关资料,google对于此类页面是有抓取的,无法避免此缺陷,可按照下面的方法来操作一下!
文档信息
- 版权声明:自由转载-非商用-非衍生-保持署名 | Creative Commons BY-NC-ND 3.0
- 原文网址: https://sunweiwei.com/778/
- 最后修改时间: 2013年03月01日 20:50:02
18 9 月, 2012 at 下午 9:58
thank you for your reading