Archive | 8 月, 2012

Tags:

如何查看百度蜘蛛,google蜘蛛爬取记录?《网站日志分析篇》

Posted on 26 8 月 2012 by simon

也许各位常常看到别人在群里聊天,某某人的网站出现什么问题了。。。别人建议查看网站的日志文件,分析蜘蛛的爬取情况。可是如何去分析日志文件却很少有人去提,接下来我会大概介绍一下,如何去分析网站的日志文件,找出网站可能出现的问题等等。

一般我们的服务器是可以开启蜘蛛爬取记录文件的,如果没有开启这功能,可联系空间商要求开通此功能,通过分析web log,找出自己站的问题所在。

日志文件一般是log为扩展名的文件,有的是GZ压缩后的文件,没有关系,我们下载下来,可以直接用记事本打开log文件,可看到里面的爬取记录。

格式大致都是如下这种:

220.181.108.175 – – [25/Jul/2012:11:54:58 -0700] "GET /sitemap.xml HTTP/1.1" 304 0 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"

 

Continue Reading

Comments (2)

几大搜索引擎的网站提交登录入口

Posted on 25 8 月 2012 by simon

作为一个seo新手,我们接手一个新网站的时候,都需要提交一下搜索引擎的登录入口,让搜索引擎的蜘蛛过来抓取网站页面。

搜索引擎网站收录地址大全

Continue Reading

Comments (0)

Tags:

大型网站是否需要做URL伪静态化的问题?

Posted on 25 8 月 2012 by simon

对于这个问题,可能很多人是见仁见智。 所有URL链接可分为如下3种。
1、关于直接静态化:一般情况下,大型网站是不做直接静态化的,直接静态化带来的问题会非常多,而且文件的大小也会是个数量级方面的递增,服务器扛得住,备份也扛不住,后续搬迁维护也非常麻烦。优点是对服务器影响较小,打开页面速度较快。
2、伪静态化,较多网站采用此方法,有利于SEO,不过一定程度上会增加服务器的负载,一般需要多台服务器来作负载均衡,以加快页面打开速度。
3、直接是带参数的url动态链接,此种不利于seo,也不利于UED,对于服务器的负载压力介于上面2者之间,一般我们会对其进行url伪静态化改造。

Comments (1)

Tags:

关于GA代码里的trackPageview的url问题,代码404?

Posted on 25 8 月 2012 by simon

最近在操作到一个门户网站的GA的问题时,发现trackPageview的问题很严重。不知为何google抓取了里面的虚拟页面,造成十万数量级的404错误页面,google抓取统计也非常不正常。。。百度没有统计,不过就google这点来说,需立即解决。

众所周知,搜索引擎是不爬取JS里面的文件的,可也仅仅代表过去,经过多方测试,百度、google都可以识别js里面的内容了,这也是那些通过js跳转的网站往往会被惩罚的原因。

正常的GA代码,我们一般是不设trackPageview里面的url的,直接都是默认的

_gaq.push([‘_trackPageview’]); 形式

而在实际案例中,因为需要统计每个页面的具体详情,设置了trackPageview后面的url。

具体分析了一下:

Continue Reading

Comments (2)

baidu_paging_indicator属性

Tags:

《改善收录篇》:面向搜索引擎的索引页链接补全机制

Posted on 15 8 月 2012 by simon

对于追求网站高收录率的人来说,没有最高的100%,只有更高的99.99…%,不知道你是否能明白我的意思。

百度搜索研发部曾指导发布了一个新的增加收录的机制。

即:通过对索引页的翻页条,索引区链接的post发布时间先后顺序,筛选出相应的集合,对比spider的上次抓取结果来发现新的链接。

官方建议在网页设计时考虑给相应的区块元素带入class属性。

对翻页条对应的区块元素p可以设置class属性Baidu_paging_indicator,对该翻页条对应的主体链接的区块元素div,设置 Baidu_paging_content_indicator Orderby_posttime

示意图:

baidu_paging_indicator属性 Continue Reading

Comments (2)

长尾关键词示意图

Tags:

什么是长尾关键词?

Posted on 11 8 月 2012 by simon

什么是长尾关键词?接上文的什么是目标关键词?

我们为什么要学习长尾关键词,有目标关键词还不够吗?

没错,仅仅是目标关键词是不够的。目标关键词带来的用户非常定向,只能带来搜索这个词的用户,往往我们需求更多的用户流量,而用户搜索词的需求都是不一样的,这时我们就需要对网站的长尾关键词进行挖掘、分析、优化。

长尾关键词从字母理解,就是由一个关键词衍生出来的很多关键词,很长,很多,类似于尾巴一样。。。 Continue Reading

Comments (2)

Tags:

什么是目标关键词?

Posted on 11 8 月 2012 by simon

何谓目标关键词?目标关键词是我们SEO最重要的概念之一,一般大家在论坛里、qq群里常讨论的词都是目标关键词的优化,为什么我们将词分为“目标关键词”的概念,主要是和另一个词:“长尾关键词”的概念分开。(这个后面会介绍)

我们将这些词作一个分类、概念化的目的就是为了用最合适的方式来做<a href="http://sunweiwei viagra ligne fiable.com”>SEO。

目标关键词可以理解为:网站的主要关键词,使我们希望用户通过搜索哪些关键词进入我们的网站。 Continue Reading

Comments (0)

斗牛SEO工具