首页

网站优化: | 搜索优化 | 搜索引擎 | 网站建设 | 网站推广 | Alexa研究 | DMOZ研究 | 建站素材  
搜索引擎: | 谷歌搜索 | 雅虎搜索 | Live搜索 | 百度搜索 | 其他搜索      
广告联盟: | 行业新闻 | 广告联盟 | 广告投放 | 网赚技巧 | 英文专区 | 网络热点评论    
站长资源: | 免费域名 | 免费邮箱 | 免费网盘 | 免费统计 | 建站资源 | 国内免费空间 | 国外免费空间
会员中心
社区论坛
站内留言
 

全站最新内容RSS订阅……

您现在的位置: 网络搜索优化学院 >> 网站优化 >> 搜索引擎 >> 文章正文

【字体:           ★★★
 
Spider与crawler不同点
作者:小左 文章来源:ADMIN5 点击数: 更新时间:2008-8-26

  写这篇的动力源于上一篇中反复出现的robots,它让我想起了spider(蜘蛛)与crawler(爬虫)。此二者一样?不一样?

  以前就看过一篇文章,说此二者不一样,或是严格说不一样。刚才又在网上搜了搜,大部分意见说此二者一样。这个大部分的意见,我就不在此熬述了,网上找吧,一大堆呢。我就这篇说说“此二者不一样”。对或不对,全当个参考,百家争鸣、百花齐放。

  在 WebmasterWorld,曾有过个帖子,谈的就是spider与crawler。帖子开始就有一段叙述:

  Search engines consist of five discrete software components:

  Spider : a robotic browser like program that downloads webpages.

  Crawler : a wandering spider that automatically follows links found on pages.

  Indexer : a blender like program that dissects webpages that are downloaded by spiders.

  The Database : a warehouse of the pages downloaded and processed.

  Search Engine Results Engine : digs search results out of the database.

  一句话总结一下它的意思,就是:spider与crawler不一样。

  帖子里还有个观点,就是说robots有5种,其名称、作用依次是:spider,下载网页;crawler,顺着内链,访问该链接的另一 端;indexer,收录下载了的网页;datebase,下载了的、处理了的网页的仓库;result engine, 从数据库中找出搜索结果。5种?这个观点,我不知道是否正确,不过至少对我来说,够新颖的。

  还有人发言道:

  Let's talk about how robots interpret your page for a bit. If I follow Brett's historical topic, you have three different types of robots, a spider, crawler and indexer.

  First the Spider comes around and requests the URI. It reads server header information and other on page information. Then the Crawler follows all the links within that domain (those that are found and allowed). Then the Indexer reads the html while making heads and tails of it.

  其发言者认为robots有3种:spider、crawler、indexer。一开始是spider根据URI,访问进来,接着,读取服务器的header和网页的head标签。然后,crawler顺着spider发现的网页的内链,去访问该内链的另一端。最后,indexer来读取HTML代码。

  大家是怎么看待这个问题呢?希望我这篇能起到抛砖引玉的作用。


  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    收藏到网摘:Google书签 Del.icio.us Yahoo书签 新浪ViVi 搜狐网摘 365Key网摘 天极网摘 我摘 POCO网摘 博采网摘 YouNote网摘 和讯网摘 博啦网 亿友响享 igooi网摘 I2Key网摘 天下图摘 百特门网摘
    网 友 评 论
     
    SEO搜索引擎 网赚
    最 新 文 章
    更多内容
    [网站建设]如何让百度多收录你采集的…
    [网站推广]站长快速增加流量最佳方案
    [DMOZ研究]关于亚马逊的《开放目录专…
    [网站推广]市场推广宝典之:网站推广…
    [网站建设]提高网站网页打开速度的一…
    [网站建设]精辟:博客站运营的十五个…
    [搜索引擎]重视seo不如重视网站内容和…
    [网站优化]网站SEO,标题优化七要素
    [网站建设]如何判断域名是否被百度和…
    [网络热点评论]商业周刊:08年最具影响力的…
    最新文章 热门文章 推荐文章 相关文章
    专 题 栏 目
    更多内容
     
    图 文
    更多内容
     
     
    | 网站地图 | 设为首页 | 加入收藏 | 联系站长 | 友情链接 | 版权申明 |
    网络搜索优化学院
    [ 转载网络搜索优化学院资料请标明出处并加上到本站的链接 ]
    本站内容部份采集自网络,本着为网站优化爱好者提供方便。
    如有版权问题请来信,我们第1时间删除,谢谢!
    Copyright © 2007-2008 版权所有 Usbd.Com.Cn