SEO的概念及建议
一、SEO的概念
SEO是Search Engine Optimization的缩写,在国外97年就已经从事SEO方面的工作了,SEO已经比较成熟;在中国的SEO行业从2003年才正式起步,还是比较稚嫩存在一些问题。国外现在有专业的人员、专业的公司(而且是规模很大)从事搜索引擎研究、优化等工作。无论从哪方面来说都处于绝对的优势。在国内搜索引擎优化知识系统尚未出现一个全面而成熟的局面,所以好多对SEO的观点认识都不能得到统一,目前业界公认的最权威的SEO的概念是:
搜索引擎优化(SEO)指遵循搜索引擎的搜索原理,对网站结构、网页文字语言和站点间互动外交测略等进行合理规划部署,以改善网站在搜索引擎的搜索表现,进而增加客户发现并访问网站的可能性的这样一个过程。搜索引擎优化也是一种科学的发展观和方法论,它随着搜索引擎的发展而发展, 同时也促进了搜索引擎的发展。
可以看到,搜索引擎优化(SEO)的主要手段包括对网站结构进行合理部署、优化网页文字语言、合理规划网站间的互动外交策略等手段,目的是改善网站在搜索引擎的搜索表现,进而增加客户发现并访问网站的可能性。SEO成功实施之后的具体表现为在保证转化率的基础上,搜索引擎带来的流量大幅上升,最终实现利润的增长;简单的说,SEO是一种让网站在百度,谷歌,雅虎等搜索引擎获得较好的排名从而赢得更多潜在客户一种技术。
搜索引擎几乎每一天都在改变算法的细节,但是总的规律是不变的。Google工程副总裁,负责排名算法的Udi Manber,发表在Google官方博客的一个帖子说到:“2007年,我们做了450次以上的调整,差不多每个星期9次。比如今年1月份,我们对PR算法做了大幅调整。大多数时间我们都是寻找相关性改善的方法,有时我们也致力于简化算法,简单就是好的。”
和Google一样,其他搜索引擎也在不断的更新算法以获取更好的用户体验,这些算法的改变基本上都与反作弊有一定的联系,也就是说:通过不正当手法获取的排名,或许在下一个钟头就可能成为被惩罚的对象。由于搜索引擎算法的总的规律是有迹可寻的,因此就产生了这么一种人群:通过分析搜索引擎算法的规律,通过正常的、搜索引擎允许的手段,对网站的内部结构、关键词分布以及外部链接等方面进行改善,目的是在保证不操纵搜索引擎的前提下让制定的站点、页面获得更好的排名。那么这群人就叫做SEO(搜索引擎优化师),这些人所做的工作也称作SEO(搜索引擎优化)。
二、SEO(搜索引擎优化)的重要性
一切从效果出发,SEO的最终目标自然是赢得更多的用户,然而SEO到底能够有多大的效果呢?似乎从下面一些数据我们可以看到:
Yahoo!是最早使用seo技术的公司之一,那个时候,可能他们仍然没有估计到搜索产业巨大增长潜力在世纪之交即将来临。Yahoo的联合创始人大卫.费罗和杨致远那时候为了增加站点的暴光度,正在想办法让他们的网站能被互联网上其他搜索引擎所发现。通过对站点结构的优化和一些代码编写技巧,他们的网站变得很容易被那些新用户检索到。他们当时也没有考虑将这种服务商业化操作,因为当时没有人清楚这样做到底是符合商业道德的还是非法的,也没有可以参考的简单标准。这是1994年,综合雅虎的技术以及首个应用SEO的背景,雅虎于第二年上市,上市首日杨致远股票市值瞬间升到1.7亿美金。
而在杨致远将SEO技术整整应用了3年之后,美国的SEO行业才真正苏醒。
阿里巴巴!或许是中国最早使用SEO技术的公司之一,自1998年创立,阿里巴巴的行业分类在各大搜索引擎中从未有很差的表现,结合其服务,阿里巴巴的用户因为搜索引擎而爆炸性增长。并最终成为中国三大互联网公司之一。正式由于2003年阿里巴巴的不俗表现。让更多的互联网人士对阿里巴巴刮目相看,进而意识到SEO在阿里巴巴的成功应用。
而正是那一年,国内才有一群人正式开始研究SEO。
例子(咱暂略)
三、如何实施SEO
按照SEO的概念,SEO主要有对网站结构进行合理部署、优化网页文字语言、合理规划网站间的互动外交策略等手段,下面分别说明:
1、 如何对网站结构进行合理部署
由于是对现成的网站进行SEO,程序都是千辛万苦写出来的,因此更改网站的目录结构应该说相当不现实,因此这里所说的更改网站结构仅局限在更改页面结构、布局。例如使用div+css重新布局页面、增加页面间的导航(站内链接策略)等;
2、 如何优化网页文字语言
优化网页文字语言主要是使html、css代码更加规范【尽量使用W3C标准进行检测】,同时注意关键词的使用、突出等;
3、 如何规划网站间互动外交策略
规划站点间的互动外交策略主要体现在两个方面:一是友情链接的交换,另一个是通过软文等获取文章页面的链接。
SEO具体办法及介绍:
1. title的重要性:Title是整个html在搜索引擎搜索结果中返回的第一要素,在目前为止,它被证明是seo效果中最为重要的一项之一,里面拥有最为核心的关键字词, title的长度雅虎等搜索引擎的建议值是不超过100个字节;
2. 关键词在Meta Keywords中的使用,曾经在网页中很重要的,但现在已经被很多搜索引擎完全忽略。受限于技术,早先搜索引擎在探测网页内容的时候,是看这个标签内罗列了一组什么样的关键词,以便确定网页的内容。然而,这个标签非常容易被滥用,但是,如果加上这个标签也对网页的综合表现没有坏处,在使用关键字标签"Keywords"时,要注意以下几点:(1) 确信使用的关键词出现在网页文本中;(2) 不要重复使用关键词;(3) 每个网页的关键词应该不一样;(4) 一个网页的关键词标签里应该包含3-5个最重要的关键词,不要超过5个;(5)主流搜索引擎对其的建议是不超过160字节。
3. 关键词在Meta Description中的使用,Description:为搜索引擎提供参考,网页的描述信息;搜索引擎采纳后,作为搜索结果中的页面摘要显示,主流搜索引擎对其的建议是不超过400字节。
4. 图片的关键词优化:HTML标签中,对于图片img标签有帮助的还有alt属性,这个属性可以告诉浏览器,当图片无法显示的时候,用alt属性中的值来替代。同样这个属性搜索引擎也看得到。
5. 关键词在H1、H2、H3等Headline标签中的使用:H1、H2、H3等标签向搜索引擎表明他们包含的部分在整个页面的重要程度,但是应当记住:同一个页面不要出现两次及两次以上的H1、H2,否则会受到搜索引擎的惩罚。
6. 关键词在页面URL中的使用: url中的关键词对搜索引擎排名中的重要作用,但是在域名中包含关键字比在目录中包含关键字拥有更大的权重,这也促使很多网站使用大量的二级域名。
7. 页面内容和关键词的相关性(语义分析):这一点主要是搜索引擎为了提升搜索体验,并且惩罚滥用关键字的网站:如果网页中根本没有提到,千万不要使用这样的关键词。
8. 关键词在网页内容上的应用:搜索引擎推荐的关键字密度为2%-8%,这些关键字应当合理的分布在整个页面,而不是集中出现在一起,但是在页面的首、尾出现关键字将受到搜索引擎的重视
9. 网站内部链接结构:主要体现在各种导航栏、以及站内的相关导航、最新导航等等,这些导航的目的是在搜索引擎蜘蛛索引的时候把它引向更多的站内页面,同时在站内页面之间传递网页权重;应当保证的是:整个站群的任意一个网页都能够链接到主页;任何一个网页都能够链接到本行业(栏目)首页;任何一个企业页面都能够链向至少10个相关企业的页面;任何一个职位页面都应当被职位聚合页面索引,而且链向至少10个其他职位页面;任何一篇文章都应当能够链接到所在栏目、文章首页,并且至少链向10篇其他文章页面;任何一个专题页面至少链接到所有网站的主页以及至少10个相关专题页面;所有页面应当链向招聘页面:www.800hr.com/topic/baidu/;
10. 网站的结构层次:搜索引擎希望站点有更简单的结构,因此应当除以上的站内链接外,要同时保证:首页除重要的企业、职位、专题及文章外,不链向具体内容页面;首页链向所有栏目;栏目及专题页面除首页外,必须链向本栏目或者专题的所有页面。
11. URL中“/”符号的出现次数:在简化网站结构层次的同时,应当保证整站的目录层次尽量少,这样就可以具体页面少用一些/,搜索引擎对深层次的页面缺乏抓取的力度,除非该页面在首页或栏目页面有链接。
12. HTML代码是否通过W3C认证:通过W3C的网页,在搜索引擎蜘蛛(机器人)索引的时候,语法更为严谨,因此更能够获得指引蜘蛛进行深层次的索引。
13. 导出链接的质量和相关性:很多证据表明,链向作弊以及质量差的页面,会受到搜索引擎的连带处罚,同样道理,链向高质量、高相关性的页面会受到搜索引擎的喜欢。
14. 外部链接的锚文字:外部链接的锚文字与页面主题密切相关的时候,搜索引擎会对该页面给予正向的评价,但是如果外部链接的锚文字与页面主题毫不相干,甚至有可能被搜索引擎惩罚。
15. 外部链接页面本身的链接流行度:外部链接页面本身的链接流行度越广,该页面的权重越高,也就能够传递更多的页面权重。
16. 链接的周围文字:搜索引擎(特别是Google)通过链接周围的文字进行语义分析,来判断外链页面的相关性,相关性越高则会获得更高的权重。
17. 外部链接页面的主题性:同样是判断页面相关性的手段。
18. 外部链接页面在相关主题的网站社区中的链接流行度:用以判断外部链接页面是否采用了链接买卖等作弊手段,间接影响页面的排名。
19. 外部链接网站的PR值:外部链接网站的PR值越高,代表该网站的权重越高,则能够传递更多的页面权威度。
20. 同域名下外部链接页面的链接流行度:用以判断外链域名网站对该页面的认可程度以及流行程度。
21. 网站新外部链接产生的速率:应当平稳增长,否则可能引起搜索引擎的怀疑
22. 网站收录数量:百度的收录数量直接是网站评价等级的显示,百度按照自己的算法给每个网站评级,级别越高,显示的收录数越多,Google的搜索引擎都通用此做法。
23. 用户查询的关键词与网站主题的相关性:主要是评价搜索关键词以及网站主题是否吻合,将结果正确的获得更好的排名。
24. 用户行为:分析用户注册行为、浏览行为等,判断网站的质量
25. 用户搜索网站的次数:主要是表现网站知名度,搜索引擎当然是将知名度高的网站排名靠前。
26. 新页面产生的速率:网站的更新速度,所有搜索引擎都喜欢更新快的站点。
27. 网站的外部链接流行度、广泛度:主要是通过PR间接影响网站的排名。
28. 网站的外部链接页面内容与关键词的相关性:判断链接网站之间的相关性,与防买卖链接有关。
29. 网站在主题相关的网站群中的链接流行度:判断网站在所在行业的权威度。
30. 网站是否通过Google Webmaster Central的确认:通过确认的站点可以向Google提供sitemap。
影响Google排名的负面因素
1. 服务器经常无法回应:服务器经常无法回应,那么不可避免的在Google搜索引擎蜘蛛索引的时候也会“无法回应”,如果连续出现2-3次,搜索引擎会认为此网站已经不存在,而在索引中减少收录甚至删除。
2. 与搜索引擎中已经收录的内容高度重复:尤其是Google,为了保护原创的利益以及版权等权益,Google等搜索引擎提出了针对采集及复制的算法,在这种算法中,搜索引擎拒绝收录索引中已经存在的内容【页面相似度超过80%】。
3. 链向低质量或垃圾站点:在Google的概念中,有一个坏邻居的说法,就是说当链接到你的网站有相当一部分是低质量的网站的话,那么你的网站也会被认为是低质量的。同样道理,你的网站链向低质量或垃圾站点,也会得到相同的待遇。
4. 外部链接来自垃圾站点:同第三条
5. 网站大量页面存在重复的META标签:如果网站中大量页面存在相同的META,根据META标签的作用,搜索引擎在索引的时候不得不采用相同的描述,而且大量相同的keywords页面不可能都吻合页面的内容。
6. 过分堆砌关键词:过分堆砌关键词是很明显的作弊行为,在搜索引擎排名的时候会被视为负面的因素而降低排名。
7. 参与链接工厂或大量出售链接:Google、百度等搜索引擎自今年起比较重视这方面的惩罚。
8. 服务器响应时间非常慢:搜索引擎的蜘蛛需要索引的范围相当大,因此在尝试几次不能够正常索引的时候,往往选择放弃,而去索引其他的网站。
9. 非常低的流量,用户行为反映差:说明网站的质量低,搜索引擎为了提升用户体验,只能将这样的站点排名降低。
10. 所有的锚文字都相同,如果真个个网页的锚文字都相同,搜索引擎是不是会感觉烦呢?尽管他不是人。
11. 使用CSS或背景色隐藏内容,这是十恶不赦的大恶 ,如果你不希望自己的站被k掉,赶紧去掉这种不明智的做法。
12. 使用JavaScript跳转:主要针对一些作弊行为采用的跳转.大多数搜索引擎都会有类似的条款。
尽量避免的问题
地址中存在动态变量:地址中存在动态变量直接影响搜索引擎的抓取和收录,因此应当把这些链接尽量改成固定的、适合搜索引擎收录的链接结构。
四、SEO常见困惑
1.<table>是否一定要替换成div+css ?
般来说,table构架描述的页面,样式结构和内容信息大小比可能达到1:1甚至更高。而CSS+DIV构架的页面,虽然在客户端看来下载一个复杂的CSS也要占用差不多的带宽,然而搜索引擎可以很方便的绕过这个css,而直接抓去div中的内容,这便是div的优势所在。更何况一个冗余的table设计架构如果代码写的不好会占用更多的带宽。
重构页面的方便性:最经典的例子就是各大blog程序了。就如现在我用的z-log,以及流行的PJBLOG、O-blog、wordpress等等,都是采用div+css构架,内容和样式的分离使我们在重构页面布局(更换主题、模板)的时候,只用针对div元素重新定义其位置、样式就行了,但是如果在原来的table基础上进行改版,几乎必须改变所有的内容调用渠道,完全改变整个页面所有的内容。
当时,当w3c刚出的时候,三大门户十分不屑:清一色的table遍布整个首页。可是这样导致的问题不久就暴露出来了:搜索引擎爬虫难以解析复杂的table,而样式的改版也极为难受。但是现在,包括国际第一大门户雅虎,国内前三的新浪、网易、搜狐,这些门户所有页面只有在搜索框的位置以及极个别(好像就新浪有一个)次要广告的位置使用<table>,剩下的全部采用css定义样式、div承载内容。
最重要的一点是:当使用表格嵌套,尤其是层次较多的时候,搜索引擎通常会把一个表格视为一个整体,而忽略对其的索引,这样做将导致的结果是:网站不能够被完全索引/重要的内容不被搜索引擎索引。
当然,纯粹的表格数据输出则没有必要使用div+css,毕竟<table>是专门输出表格数据的,也就是说,对于不太重要,或者不太希望搜索引擎抓取的内容,仍然可以使用<table>输出。
2.文字链接和图片链接哪个好?
需要澄清的是,搜索引擎蜘蛛在索引页面的时候,对文字链接可以很容易的从文字本身以及链接的title属性了解目标页面的主题,进而很容易的抓取目标页面并让其获得较好的排名;但是蜘蛛遇到图片链接的时候无法从二进制的图片本身读到任何关于目标页面的有用信息,而即使在图片上加了Alt属性、链接加<title>属性,仍然比不过文字链接。因此单纯对搜索引擎来说文字链接优于图片链接。而且文字链接将节省网页占用的空间,并在用户访问的时候节省带宽资源。
3.如何平衡客户体验和搜索引擎?
这个问题其实很简单:搜索引擎是一个比较特殊的客户!应当把SEO看成是提升客户体验的一部分。但是要记住:搜索引擎只懂代码,看不到显示样式。也就是说,在搜索引擎面前,你做的更漂亮也没用,他关注的是关键词密度、关键词分布、页面架构、外部链接等因素。因此再漂亮的flash、Javascript、图片都白白浪费搜索引擎的读取时间,要提升搜索引擎的体验,就少用这些它读不懂的代码、文件吧,起码可以节省搜索引擎的下载时间。与访客其实也是相同道理,只要布局合理,功能能够体现出来,用户当然是希望网页打开的速度越快越好,节省时间。而且SEO行内有这么一句话:搜索引擎看不到,访问者就看不到。可以很形象的说明SEO的重要性。
4.css代码到底要不要全部分离出去?
为了更加语义化(样式和内容分离),包括我在内的大多SEO都主张css代码分离出来,外部调用,但是我们往往又看到新浪、网易等门户的首页一部分【甚至全部】css样式表其实都没有分离出去,于是很多人便倾向于不分离css样式,理由是三大门户没有分离。其实这一点和节省带宽、压缩等有密切的联系。例如网易,等门户的首页,信息量相当大而且同时在线的人数相当多,因此他们往往采取一种页面压缩传输的技术。一方面调用外部文件会导致压缩率下降而耗用更多的服务器带宽;另一方面,如果用户的网速很慢的话,采用外部调用的方式经常因为css部分下载延时而导致显示样式失真,因此这些门户将css不分离出来,是倾向于用户体验的做法而非SEO。
5.sitemap有多重要?
用最简单的话来说,Sitemap 就是网站上网页的列表。创建并提交 Sitemap 有助于确保 Google 等搜索引擎知道网站上的所有网页,包括 Google 的正常抓取过程可能无法找到的网址。
特别是使用PHP等语言的动态网站,蜘蛛很难通过正常途径将每一个深层目录的页面都索引起来,这个时候,Sitemap可以将二级、三级甚至四级目录中的页面直接提交给搜索引擎,效果相当于将其转移到二级目录中去。
6.外部链接有什么作用?
各大搜索引擎的排名算法中,以下因素都是至关重要并且互相影响的:的:①链接到某网页的外部链接的数量;指向一个网站的外部链接越多,这个网站就越重要。这也就是PageRank的重点之一。②外部链接的质量;而当一个重要的网站有一个链接指向你的网站的时候,你的网站也会被认为是重要的。这就是我所说的外部链接的质量。③外部链接的链接文字(anchor text)的写法,在网页的链接中,链接文字,是用户所能够看到的描述链接的文字,搜索引擎会分析这个文字,根据其同所指向的网页内容的相关性来考虑权重。
下附Google、百度、雅虎、搜狗对网站作弊的定义等
Google管理员指南对网站的建议
设计与内容指南
网站应具有清晰的层次结构和文本链接。每个网页应至少可以通过一个静态文本链接打开。
为用户提供网站地图,列出指向网站重要部分的链接。如果网站地图上的链接超过或大约为 100 个,则需要将网站地图拆分为多个网页。
网站应实用且信息丰富,网页文字应清晰、准确地表述要传达的内容。
要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。
尽量使用文字而不是图形来显示重要的名称、内容或链接。Google 抓取工具无法识别图形中所含的文字。
确保对 TITLE 和 ALT 标记属性的描述和表达准确无误。
检查链接是否损坏,并确保 HTML 格式正确。
如果您决定采用动态网页(即网址中包含"?"字符),请注意并非所有搜索引擎的抓取工具都能像抓取静态网页一样抓取动态网页。动态网页有助于缩短参数长度并减少参数数目。
将特定网页上的链接限制在合理的数量内(少于 100 个)。
技术指南
由于大部分搜索引擎 Spider 查看网站的方式与 Lynx 一样,所以可以使用 Lynx 之类的文本浏览器来查看您的网站。如果因应用了 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎 Spider 在抓取您的网站时可能会遇到麻烦。
允许搜索漫游器在不采用会跟踪其在网站上浏览路径的会话 ID 或参数的情况下抓取您的网站。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,则可能会导致对网站的检索不完整,因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。
确保您的网络服务器支持 If-Modified-Since HTTP 标头。通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。该功能可以节省您的带宽和开销。
利用网络服务器上的 robots.txt 文件。该文件会告诉抓取工具哪些目录能够抓取,哪些不能抓取。确保该文件是网站的最新版本,以免意外拦截 Googlebot 抓取工具。请访问http://www.robotstxt.org/wc/faq.html ,了解如何在漫游器浏览您的网站时对其进行指示。您可以使用 Google 网站管理员工具中的 robots.txt 分析工具测试 robots.txt 文件,以确保正确使用此文件。
如果您的公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎 Spider 可以抓取您的网站。
使用 robots.txt 可避免抓取搜索结果页或其他自动生成的页面,这些页面对来自搜索引擎的用户没有太多附加值。
质量指南-以下行为将导致网站从Google索引中删除
请不要使用隐藏文本或隐藏链接。
请不要使用隐藏真实内容或欺骗性的重定向手段。
请不要发送自动查询给 Google。
请不要加载使用无关字词的网页。
请不要创建包含大量重复内容的多个网页、子域名或域名。
请不要制作安装有病毒、特洛伊木马或其他有害软件的网页。
请不要专门针对搜索引擎创建"桥页",或使用其他联属计划这类原创内容很少或几乎没有原创内容的俗套 (cookie cutter) 方法。
如果您的网站参加联属计划,请确保您的网站可为其增添价值。请提供独特且相关的内容,使用户有理由首先访问您的网站。
如果 Google 认为自己有责任遵从法律的要求,或者网站没有达到 Google 的质量指南要求,或出于其他一些原因,如某些网站通过限制用户的使用来获取相关信息,Google 会从索引和搜索结果中临时或永久删除这些网站。我们无法对删除网页的具体原因发表评论。不过,某些行为,例如以搜索引擎能发现而用户无法发现的方式隐藏、编写文本,或只为欺骗搜索引擎而设置网页/链接等,都可能造成网页从我们的索引中删除。
以下情况如果被举报,将从Google索引目录中彻底删除
隐藏文字或链接
误导性或重复字词
网页不符合 Google 的说明
隐形页面
欺骗性重定向
桥页
重复的网站或网页
百度给站长的建站建议
只有当搜索引擎、站长、互联网用户之间,能有一种默契的利益均衡,这个行业才会顺畅发展。竭泽而渔式的网站建设,只会使您与用户、与搜索引擎越来越远。搜索引擎与站长之间,宜和谐发展,共同拥抱美好的愿景。
以下是我们给出的一些建站建议:
站点结构宜简洁明晰
答:不要让你的用户一进你的站点就因为纷繁芜杂而不知所措。从某种意义上来说,百度的Spider也是一个相对特殊的访客而已。每一个子域名,每一个目录,都最好有明确的内容区隔,避免不同子域名或者目录对相同内容的互相串用。
创造属于您自己的独特内容
答:百度更喜欢独特的原创内容。所以,如果您的站点内容只是从各处采集复制而成,很可能不会被百度收录。
保持经常的更新
答:经常的更新,蜘蛛程序就会经常的光顾;而长期不更新的网站,蜘蛛到访会日趋减少。
谨慎设置您的友情链接
答:如果您网站上的友情链接,多是指向一些垃圾站点,那么您的站点可能会受到一些负面影响。参与各类以SEO为目的的自助链接活动,很可能“过犹不及”。
把自己的网站做成常青树
答:如果没有搜索引擎,你的网站仍然访客盈门,那么你的网站就属于“常青树”了。面向用户做网站,而不要面向搜索引擎做网站,这是成为常青树网站的真谛。
如果您的网页长时间无法从百度搜索到,或者突然从百度的搜索结果中消失,可能的原因有:
A. 您的网站所在服务器不稳定,被百度暂时性去除;稳定之后,问题会得到解决
B. 您的网页内容有不符合国家法律和法规规定的地方
C. 您的网页不符合用户的搜索体验
D. 其他技术性问题
百度只收录百度认为有价值的网页。任何网页在搜索结果中的去留变化,都是机器算法计算和调整的结果。下述类型的网页,百度明确不会欢迎:
A. 网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用户产生受欺骗感觉。
如果您的网站中有较多这种页面,那么这可能会使您的整个网站的页面收录和排序受到影响。
B. 网页是复制自互联网上的高度重复性的内容。
C. 网页中有不符合中国法律和法规的内容。
雅虎中国的相关说明
如何让雅虎更多更快的收录我的网页?
您需要注意以下几点:
1、正确配置网站的robots.txt文件,错误的配置会导致我们无法抓取。
2、雅虎搜索喜欢独特原创内容的网站。
3、请维护并且经常更新您的网站,避免被人恶意利用群发垃圾信息。
4、尽量使用搜索引擎能够识别的文本信息,避免过多的Javascript、Cookie、框架、DHTML 或 Flash 等复杂技术。
5、与和您相关类型的网站交换链接。(请注意不要在BBS,blog,留言本等增加链接,这样会被雅虎搜索引擎认为是作弊行为。)
6、 欺骗用户以及采用作弊手段欺骗搜索引擎的行为,都会在雅虎搜索中删除。
7、 使用雅虎站长工具,制作提交网站sitemap,指导雅虎蜘蛛的抓取和索引。
如果您的网站存在以下行为,就有可能被雅虎搜索引擎判断为作弊网站,而不予收录:
一、在网页中存在隐藏文字或隐藏链接。
二、在网页中存在大量与网页内容不相关的查询词。
三、在网页中使用不必要的跳转或者重定向技术。
四、在页面中存在大量链向其他网站的链接。
五、在整个网站中存在大量重复内容的页面。
六、一个域名下存在大量不必要的子域名。
七、在页面中存在大量恶意广告、恶意代码或有害插件的网站。
八、在页面中存在主动链向已经被雅虎搜索引擎删除的网站。
九、在留言本、论坛等地方群发链接。
搜狗相关说明
什么样的站点会受到搜狗欢迎
站点应该是面向用户的,而不是面向搜索引擎的。一个受到用户欢迎的站点,最终也会受到搜索引擎欢迎;
反过来,如果你的站点做了很多针对搜狗的优化,但却给用户带来大量负面体验,那么,你的站点最终可能还是会受到搜狗的冷落。
搜狗更喜欢有独特内容的网页,而不是简单抄袭和重复互联网上已有内容的网页。对于已经被重复了千百遍的内容,搜狗可能会不予收录。
请谨慎使用你的站点链接。与一些垃圾站点做友情链接,很可能会使你的网站受到负面影响。因此,当有人很热情的要求你为他的站点提供友情链接时,请审视以下两点:
一、对方的站点在他那个领域是否是高质量的?站长间所谓的流量以及排名,很多都是用欺骗手段获取的,无法保持长久。
二、对方要求的链接名称是否和对方网站地位相称?用一个涵盖范围广泛的关键词来做一个内容非常局限的网站的链接名称,很可能会使你的网站受到负面影响。
经常保持内容更新。经常有新内容产生的站点,搜狗是会注意到,并且大力欢迎,而且会频繁造访。
对搜狗来说,以下行为都可能被认为是作弊:
隐藏文本或隐藏链接。在网页中加入搜索引擎可识别但用户看不见的文本内容或链接。包括使用与背景色相同或十分接近的文本或链接文字、超小号文字、文字隐藏层、页面底部下出现的多余内容、滥用图片 ALT 等;
滥用关键词。在网页源代码中大量堆积、重复某些关键词,或者加入与网站内容毫不相关的热门关键词。
恶意互换链接。在网页中互相建立大量指向对方网站的链接。
欺骗性重定向、欺骗性更换网页内容。故意制造大量链接指向某一网址或者使用跳转域名欺骗用户进入与搜狗描述不相符的网站。
建立大量镜像网站。复制网站或网页的内容并分配以不同域名和服务器,欺骗搜索引擎对同一页面内容进行多次索引。
页面包含恶意广告、恶意代码或恶意插件。
页面有链接指向作弊网站的,可能会被视为作弊网站。
搜狗反作弊系统会实时监控作弊网站,并根据作弊等级对作弊网站进行相应的处罚。
常见处罚:降低网站在搜狗的整体排名;
一般处罚:仅索引正常网页,其他网页不予收录;
严厉处罚:包含非法内容及恶意程序、用户集中投诉的网站,搜狗将拒绝收录整个网站。
sogou spider 喜欢收录什么样的页面?
1. 内容优良而独特的页面,如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。
2. 链接层次较浅的页面,过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
3. 如果是动态网页,请控制一下参数的数量和URL的长度。搜狗更偏好收录静态网页。
4. 重定向次数越多的页面,越有可能被 sogou spider 丢弃。