搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
全文搜索引擎(Full Text Search Engine)
在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。全文检索是指计算机索引程序(Spider)通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。
全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有百度搜索。
目录索引类搜索引擎(Search Index/Directory)
目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则一般是由标题字母的先后顺序决定(也有例外,例如搜狐目录是按sougou rank排序)。
目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用Open Directory目录提供分类查询。而象 Yahoo! 这些老牌目录索引则通过开发自己的全文搜索引擎以扩大扩大搜索范围并提高收录效率。
元搜索引擎(Meta Search Engine)
元搜索引擎,通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。“请求提交”负责实现用户“个性化”的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。“接口代理”负责将用户的检索请求“翻译”成满足不同搜索引擎“本地化”要求的格式;“结果显示”负责所有源搜索引擎检索结果的去重、合并、输出处理等。元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。使用元搜索引擎可以同时对几个搜索引擎进行检索,并获得分级编排的检索结果。