在从事网站SEO的过程中,SEO博客结合网络上其他流传的相关文章,总结了一些针对百度搜索引擎优化过程中需要注意的事项,希望对百度收录、排名不是很好的站点有帮助。
百度搜索引擎收录习惯
百度是全球最大的中文搜索引擎,对中文网页的搜索技术在某种程度上领先于Google,百度在某些方面与Google有相同或相似之处外它还有以下特点:
1、较重视第一次收录印象
网站给百度的第一印象比较重要,相对Google而言,百度搜索引擎的人为参与度较高,也就是说在某些层面上可能由人来决定是否收录网页而不是由机器来决定.所以,网站在登录百度搜索引擎之前最好把内容做得丰富点、原创内容多一点、网页关键词与内容的相关度高一点,这样才能给百度较好的初次印象。 与此同时,百度的首次收录时间一般周期会比Google稍微晚一些,其实主要是收录后由于需要认为的干涉,放出来的晚些。
2、对网页的更新较敏感
百度对网页的更新相对Google而言更加敏感,可能这与百度的本土性格有关.百度搜索引擎每周更新,网页视重要性有不同的更新率,频率在几天至一月之间.所以在百度的搜索结果中基本上都标明了收录时间,但是对于更新不是很勤快的小站,百度往往会比Google更新的慢一些,特别是一些访问量不是特别大的博客,Google更新的速度更是百度所无法比拟的。也许是Google更加注重原创的原因。
3、较重视首页
百度对首页的重视程度要比Google高得多,这与上面提到的“较重视第一次收录印象”一脉相承.百度在显示搜索结果时也常常把网站首页显示出来,而不具体到某个内容页(当其认为不够重要时).相对而言,其用户体验打了折扣,而增加了其“百度快照”的用户量。但是我们发现,百度其实正在慢慢的改变这个现状,在site一些网站的时候,有一些内页也会排名到主页的前面。
4、较重视绝对地址的链接
百度在收录网页时比较重视绝对地址的收录,百度提供的网页快照功能也没有解析相对地址的绝对路径,不知这是百度技术的疏忽还是其偏好的一大体现。 同时我们发现,统一路径的文章对Google可能会比较友好,但是把所有文章放到同一个文件夹却是对百度的一个大大不敬:百度真的不喜欢你这样。
5、较重视收录日期
百度对网页的收录日期非常看重,也是其搜索结果排名的参考点,被收录得越早排名会较高,有时甚至不考虑相关性地把它认为比较重要的内容放在首位,而点击进入之后才发现是早已过时的信息或者垃圾信息.这是百度需要改进的技术。 这一点也恰恰与Google不同,也许在相关度相同的页面,Google算法有时候收录早的会排到前面,也有些时候收录晚的会排到前面,关键是Google分析了用户搜索的意图,而百度似乎没有让我感觉到他在分析我为什么搜索。
百度使用的技术
百度使用以下技术:“一种互联网上镜像和准镜像网站的识别方法”,这个方法解决了搜索引擎对雷同信息的重复获取,节省网络资源和本地资源,提高系统服务的质量和效率;“一种基于词汇的计算机索引和检索方法”,该方法对一段连续的文字信息,经过词汇分析处理后,通过添加隐形词汇的手段,实现对基于词汇索引和检索系统的检索质量提升,使用户获得更加准确的检索结果;“一种使用快照的方式实现对网上信息进行记录和分析的方法”,该方法是通过对互联网上一个特定信息,多次进行快照的方式,将信息当时的状态进行保留.并通过对一系列快照信息的分析,得到有效数据,方便地得到网上信息的变动情况。
百度对作弊的判定条件
SEO作弊方式有很多种形式,比如:域名轰炸、弹出新窗口转向、制作Link Farm-链接养殖场等等。对于SEO作弊,百度搜索引擎公开的判定条件如下:
在网页源代码中任何位置,故意加入与网页内容不相关的关键词。当然包括<keywords><title>以及<description>等标签以及源码中的注释部分。
在网页源代码中任何位置,故意大量重复某些关键词。即使与网页内容相关的关键词故意重复也被视为作弊行为。
在网页中加入搜索引擎可识别但用户看不见的隐藏文字。无论是使用同背景色文字、超小字号文字、文字隐藏层、还是滥用图片ALT 等方法,都属于作弊行为。
故意制造大量链接指向某一网址的行为。
对同一个网址,让搜索引擎与用户访问到不同内容的网页(包括利用重定向等行为)。
作弊行为的定义是针对网站而不是网页的。一个网站内即使只有一个网页作弊,该网站也被认为是有作弊行为;有链接指向作弊网站的网站,负连带责任,也会被认为是作弊,只是当作弊网页比重相当少的时候,搜索引擎暂时不予追究。