首页

网站优化: | 搜索优化 | 搜索引擎 | 网站建设 | 网站推广 | Alexa研究 | DMOZ研究 | 建站素材  
搜索引擎: | 谷歌搜索 | 雅虎搜索 | Live搜索 | 百度搜索 | 其他搜索      
广告联盟: | 行业新闻 | 广告联盟 | 广告投放 | 网赚技巧 | 英文专区 | 网络热点评论    
站长资源: | 免费域名 | 免费邮箱 | 免费网盘 | 免费统计 | 建站资源 | 国内免费空间 | 国外免费空间
会员中心
社区论坛
站内留言
 

全站最新内容RSS订阅……

您现在的位置: 网络搜索优化学院 >> 网站优化 >> 网站优化 >> 文章正文

【字体:           ★★★
 
让你的网站对百度开放
作者:kathy 文章来源:互联网 点击数: 更新时间:2008-8-18

  如何让你的网站对百度开放,让百度蜘蛛能够层层深入你的网站,使网站一览无遗?在此,我们需要知道一个知识点,那就是robots.txt.那么什么么是robots.txt文件?

  搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做robots.txt的纯文本文件。您可以在您的网站中创建一个纯文本文件robots.txt,在文件中声明该网站中不想被robot访问的部分或者指定搜索引擎只收录特定的部分。

  这里提醒一下,请注意:当你网站不希望搜索引擎全部收录时才用到robots.txt文件(比如你网站后台页面)如果你希望搜索引擎全部收录你的网站,请建立一个空的robots.txt文件。对于大家的网站来说,一般都会希望搜索引擎全部收录网站内容,那么看看www.lipin-bj.cn 的网站robots.txt文件,注意此文件必须放在网站的根目录下面,即www.lipin-bj.cn/robots.txt

  1。首先告诉大家robots.txt文件要放在你网站的根目录里面。当你修改了你的robots.txt一般会在48小时内生效(对于搜索引擎来说)。

  2。如果你要禁止搜索引擎在搜索你网站时显示快照,而只对你的网站索引,什么办呢?

  百度支持通过设置网页的meta,防止搜索引擎显示网站的快照。方法如下:

  要防止所有搜索引擎显示您网站的快照,请将此元标记置入网页的 部分:

  

  要允许其他搜索引擎显示快照,但仅防止百度显示,请使用以下标记:

  

  注:此标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。

  3。我们来看一下如何写robots.txt,他的格式是什么样的。

  该文本是以 User-agent: 作为文本记录开头的。这个值有什么样呢?它是来描述搜索引擎robots的名字。比如说你要专指百度搜索引擎你就可以写为 User-agent: baiduspider

  同样的谷歌就是 User-agent:googlespider 比如你要描述SOSO图片蜘蛛你可以写 User-agent:Sosoimagespider 这样都可以 如果你要针对所有搜索引擎呢 User-agent: *

  就是所有搜索引擎全部概括了。

  robots.txt 除了第一项 User-agent: 还有其他两项 Disallow: Allow: 但是User-agent: 是唯一项 他后面可以加若干Disallow和Allow行 也就是这种格式

  User-agent: *

  Disallow:

  Disallow:

  Disallow:

  Allow:

  Allow:

  Allow: 后面加多少个Disallow和Allow行都可以 是根据你需要来加的。好了我接着说 Disallow

  该项就是告诉搜索引擎我不希望我网站的那些网页收录的。你就可以用Disallow的描述来限制搜索引擎 我们来举个例子,比如我要限制所有搜索引擎不收录我的后台目录admin 那么我们什么做呢?来看一下

  User-agent: *

  Disallow:/admin/

  就可以了 如果是要显示百度不要收录我的这个目录其实搜索引擎可以什么做呢 前面我们说到了

  User-agent: baiduspider

  Disallow:/admin/

  你问如果是要禁止所有搜索引擎访问全站应该什么办呢?我们来看一下

  User-agent: *

  Disallow:/

  如果要禁止访问多个文件夹呢 比如我要禁止访问 Admin image data 3个文件夹

  User-agent: *

  Disallow:/Admin/

  Disallow:/image/

  Disallow:/data/

  这样就可以了

  我们来解释一下Allow行是做什么的?其实这个Allow和Disallow是相反的。Allow他的意思就是希望搜索引擎访问我网站的一下路径,Allow通常与Disallow搭配使用。下面我们举个例子

  我要允许访问特定目录中的部分url 比如我不要他访问我Admin目录 但是我希望他访问我Admin目录里面的hdd.html 什么办呢?这时候我们就可以用到Allow了 来看例子

  User-agent: *

  Allow:/admin/hdd

  Disallow:/Admin/

  这样就可以了

  顺便所一下 在robots.txt里面可以使用"*"和"$":

  baiduspider支持使用通配符"*"和"$"来模糊匹配url。

  "$" 匹配行结束符。

  "*" 匹配0或多个任意字符。

  举个例子: 使用"*"限制访问url 。禁止访问/iea/目录下的所有以".htm"为后缀的URL(包含子目录)。

  User-agent: *

  Disallow:/iea/*.htm 就可以了。

  再来举个例子 关于使用"$"限制访问url , 仅允许访问以".htm"为后缀的URL。

  User-agent: *

  Allow: .htm$

  Disallow: /

  相信大家看过后都注意修正自己的rotots.txt了

 


  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    收藏到网摘:Google书签 Del.icio.us Yahoo书签 新浪ViVi 搜狐网摘 365Key网摘 天极网摘 我摘 POCO网摘 博采网摘 YouNote网摘 和讯网摘 博啦网 亿友响享 igooi网摘 I2Key网摘 天下图摘 百特门网摘
    网 友 评 论
     
    SEO搜索引擎 网赚
    最 新 文 章
    更多内容
    [网站建设]如何让百度多收录你采集的…
    [网站推广]站长快速增加流量最佳方案
    [DMOZ研究]关于亚马逊的《开放目录专…
    [网站推广]市场推广宝典之:网站推广…
    [网站建设]提高网站网页打开速度的一…
    [网站建设]精辟:博客站运营的十五个…
    [搜索引擎]重视seo不如重视网站内容和…
    [网站优化]网站SEO,标题优化七要素
    [网站建设]如何判断域名是否被百度和…
    [网络热点评论]商业周刊:08年最具影响力的…
    最新文章 热门文章 推荐文章 相关文章
    专 题 栏 目
    更多内容
     
    图 文
    更多内容
     
     
    | 网站地图 | 设为首页 | 加入收藏 | 联系站长 | 友情链接 | 版权申明 |
    网络搜索优化学院
    [ 转载网络搜索优化学院资料请标明出处并加上到本站的链接 ]
    本站内容部份采集自网络,本着为网站优化爱好者提供方便。
    如有版权问题请来信,我们第1时间删除,谢谢!
    Copyright © 2007-2008 版权所有 Usbd.Com.Cn