Categorized | Life

关于GA代码里的trackPageview的url问题,代码404?

发布于 2012年08月25日

最近在操作到一个门户网站的GA的问题时,发现trackPageview的问题很严重。不知为何google抓取了里面的虚拟页面,造成十万数量级的404错误页面,google抓取统计也非常不正常。。。百度没有统计,不过就google这点来说,需立即解决。

众所周知,搜索引擎是不爬取JS里面的文件的,可也仅仅代表过去,经过多方测试,百度、google都可以识别js里面的内容了,这也是那些通过js跳转的网站往往会被惩罚的原因。

正常的GA代码,我们一般是不设trackPageview里面的url的,直接都是默认的

_gaq.push([‘_trackPageview’]); 形式

而在实际案例中,因为需要统计每个页面的具体详情,设置了trackPageview后面的url。

具体分析了一下:

情况大致是前后符号不统一引起的。

<script type=”text/javascript”>

var _gaq = _gaq || [];

_gaq.push([‘_setAccount’, ‘UA-xxxxx-1’]);

_gaq.push([‘_setDomainName’, ‘hulian123.com’]);

_gaq.push([‘_addOrganic’, ‘baidu’, ‘word’]);

_gaq.push([‘_addOrganic’, ‘soso’, ‘w’]);

_gaq.push([‘_addOrganic’, ‘3721’, ‘name’]);

_gaq.push([‘_addOrganic’, ‘yodao’, ‘q’]);

_gaq.push([‘_addOrganic’, ‘vnet’, ‘kw’]);

_gaq.push([‘_addOrganic’, ‘sogou’, ‘query’]);

_gaq.push([‘_trackPageview’,”/江苏站/资讯/首页”]);

(function() {

var ga = document.createElement(‘script’); ga.type = ‘text/javascript’; ga.async = true;

ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’;

var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(ga, s);

})();

</script>

其中_gaq.push([‘_trackPageview’,”/江苏站/资讯/首页”]); 和里面的符号没有关系,google对此类url是有抓取的,以为是页面的一个相对url,造成了爬取,当然此页面不存在,导致了无数404,十万级的404,相对恐怖了。。。

————————此处后期更新——————————

2013年1月最新更新:经常查阅相关资料,google对于此类页面是有抓取的,无法避免此缺陷,可按照下面的方法来操作一下!  

链接 https://sunweiwei.com/817/

看了此文的人貌似还看了这些:

  • URL中过多的参数是否会将google蜘蛛带入抓取死循环? 2012-09-18
  • 关于SEO工具反馈 2013-10-27
  • 一键突破VeryCD电驴搜索限制的批处理文件【本人原创】 2010-05-03
  • 关于网站备案的那些事 2014-03-08
  • google蜘蛛抓取频率被改为特殊抓取率,很人性化! 2011-02-22
  • 抓取频率被google改之后,文章都是被秒收录的啊! 2011-02-22
  • 杂记:从2016躺到2017 2017-01-16
  • 老鹰主机“搬家”记录 2013-12-20
  • 亲,中秋国庆福利来了~【2012版倒计时】 2012-10-01
  • 2012年5月26日晚间小记,另seo教程plan 2012-05-27
  • 1 Comments For This Post

    1. admin Says:

      thank you for your reading

    1 Trackbacks For This Post

    1. URL中过多的参数是否会将google蜘蛛带入抓取死循环? - SEO+SEM+WA=Simon博客 Says:

      […] 经过一段时间的研究发现,google确实会发生此种情况(百度对GA的JS应该是直接跳过的,根本不理睬~)。上次曾写过一篇此类的问题:关于GA代码里的trackPageview的url问题,代码404? 当时以为是因为格式符合的问题,目前看来不是那个问题,而是google自身的问题。 […]

    发表评论

    Time limit is exhausted. Please reload CAPTCHA.

       我相信你,不会发广告!

    斗牛SEO工具