Posted on 26 8 月 2012 by simon
也许各位常常看到别人在群里聊天,某某人的网站出现什么问题了。。。别人建议查看网站的日志文件,分析蜘蛛的爬取情况。可是如何去分析日志文件却很少有人去提,接下来我会大概介绍一下,如何去分析网站的日志文件,找出网站可能出现的问题等等。
一般我们的服务器是可以开启蜘蛛爬取记录文件的,如果没有开启这功能,可联系空间商要求开通此功能,通过分析web log,找出自己站的问题所在。
日志文件一般是log为扩展名的文件,有的是GZ压缩后的文件,没有关系,我们下载下来,可以直接用记事本打开log文件,可看到里面的爬取记录。
格式大致都是如下这种:
220.181.108.175 – – [25/Jul/2012:11:54:58 -0700] "GET /sitemap.xml HTTP/1.1" 304 0 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"
Continue Reading
Posted on 15 8 月 2012 by simon
对于追求网站高收录率的人来说,没有最高的100%,只有更高的99.99…%,不知道你是否能明白我的意思。
百度搜索研发部曾指导发布了一个新的增加收录的机制。
即:通过对索引页的翻页条,索引区链接的post发布时间先后顺序,筛选出相应的集合,对比spider的上次抓取结果来发现新的链接。
官方建议在网页设计时考虑给相应的区块元素带入class属性。
对翻页条对应的区块元素p可以设置class属性Baidu_paging_indicator,对该翻页条对应的主体链接的区块元素div,设置 Baidu_paging_content_indicator Orderby_posttime
示意图:
Continue Reading
Posted on 07 7 月 2012 by simon
众所周知SEO行业入门门槛不高,不过一直以来站长论坛的相关“seo新手入门”,在A5、SEOWHY、落伍者、chinaz上经常能够看到那些千篇一律的“定律”。
大致可以总结为如下表述(转),看完此文你就可以不用再阅读相关论坛的相关砖家叫兽的相关seo帖子了。。。
附:
1.内容为王,外链为皇
2.内容一定要原创
3.不要抄别人的内容,可以伪原创一下,比如换个顺序,改个头尾 Continue Reading
Posted on 06 7 月 2012 by simon
很明显,这次百度是下决心改进算法了,不管是否是效仿google的熊猫算法还是什么,总之它确实变得异乎寻常。此次升级带来的反应也是相当巨大,成千上万的网站被K,站长们也奔走相告,更有甚者,连qq群名字叫“黑色端午节”……
此次百度算法升级后,SEO应该应对的策略大体为:
站内方面:更新高质量站内文章,提升站内用户体验,规避作弊手段。勿常改模板文件,如此则会使内部链接变动过大,造成搜索引擎的不信任度等等。
友链方面:请尽量寻找相关行业链接,1个相关的比得上3个不相关的链接,具体的你懂的,百度,google,bing等等搜索引擎明显都很看重这个,另被降权的友链请注意及时跟踪或者剔除掉。
Continue Reading
Posted on 22 6 月 2012 by simon
在seo常规操作中,不是必须用到canonical标签,所以它也是被很多人忘却的一个标签,甚至有些人都不知道这一标签。不过在一些特殊案例中是非常实用的,而且搜索引擎对于这一标签的识别也是非常迅速的,有多迅速?在我自己操作的过程中,可能正好赶上百度更新,1天时间就生效了,早上改好,下午就有效果了。
canonical到底是什么?
英文释义为标准,权威,规范的意思,在seo中,canonical标签代表一个页面的规范化url写法,它告诉搜索引擎这个页面应该以canonical标签里的url为展现结果。现在的网站基本都是cms类程序做的页面,每个页面可能有多个不同的链接指向此页面,我们常规做法可以通过robots.txt,301重定向,站内全部使用绝对地址等等手法来避免此种情况的发生。不过有时候robots.txt是完全不满足使用的,而301是可以,不过百度对于301的生效时间,据ZAC测试过,3个月左右时间,而且经常往复,考察期较长。
google,bing等搜索引擎官方都明确支持的,百度官方貌似没有明确说过支持canonical标签,不过从实际案例来讲,是支持的。 Continue Reading
Posted on 20 6 月 2012 by simon
最近百度也是一反往常,由以前的晚间更新,周四大更新,演变为上午更新数据,下午变动排名,随时都可能进行较大更新,对网站文章质量的重视度尤为提升。

根据chinaz里面的seo风向标,最近较大多数网站出现收录降低,网站收录降低的比例呈高位上涨,可见百度6月份算法确实更新了,也印证了百度前段时间发布打击互联网垃圾信息的公告。网站重复度较高的站,采集站,原创度不够的站,收录基本都是急剧下降的,可能你今天发30文章,百度全部收了,过几天其中25篇相似度高的,则逐渐被删掉,不做收录。百度蜘蛛会遍历你网站的各个角度,对所有文章进行整理排序,清除那些重复度高,相似度高,文章质量低的文章,这也是为什么自己网站的收录会有升有降。如果所发文章都是采集而来,轻者网站文章不收录,重者栏目不收录,最严重就是网站被K。 Continue Reading
Posted on 31 5 月 2012 by simon
大型网站海量关键词优化策略说明
SEO优化的前提是了解网站流量的来源。针对不同的流量来源选择优化的方案,包括关键词的选择、挖掘和排布。
要做SEO优化,首先需要了解网站获取流量的来源。目前网站流量来源主要分为四大块:直接访问、推荐访问、SEO、 APP。在第三块流量来源SEO上,目前有很多优化的渠道,比如网页、图片、新闻源。根据现有的经验,网页搜索可能是大部分网站最大的流量来源。
了解了SEO的主要渠道之后,我们需要思考的有以下几点:选择什么样的方案去做,关键词的流量分布是什么样的,怎么去挖词、选词和布词。
在SEO方案选择上,目前主要有单页优化排名、整站优化排名和海量关键词优化排名这三种方案,每种优化方案针对不同的产品又具有不同的效用,比如单页优化排名对于网页游戏来说就很重要,如果游戏排名在百度获不了第一,那你所有的运营费用可能就“打水漂”了。 Continue Reading
Posted on 18 5 月 2012 by simon
今天刚登陆百度站长平台后台就发现多了个蜘蛛抓取压力反馈工具,可以用来调节搜索引擎在单位时间内对一个网站服务器访问的频率和总次数。

- 一些比较大型的站点应该尤为有用,当自己的站点出现收录异常的时候,可以使用这个工具,增大抓取压力值来改善网站收录情况。
- 百度站长平台现在做得越来越像google了,可以预见后期会推出很多测试工具和新的功能,拉近蜘蛛和站长们之间的距离,这样也更利于用户体验,用户能够及时地获取到站点的新鲜内容,双赢的事,何乐而不为? Continue Reading
Tags: 招聘
Posted on 05 5 月 2012 by simon
【招聘】南京地区seo专员3名,外链专员2名
要求:有一年相关工作经验。
行业:医疗行业。
薪资:按照底薪+提成,有五险,提供午餐,及住宿。
有意者可发送简历到我邮箱simonsww@qq.com
Posted on 21 2 月 2011 by simon
真是悲剧啊,先是网站被黑,惨不忍睹,后来FTP密码和数据库密码忘记了。。。(还没有备份过的习惯)
经历网站换空间,换数据库,这数据库操作真是麻烦。。。 Continue Reading