3133拉斯维加斯
全部
All
当前位置: 首页 > 新闻资讯 > 什么是Robots协议
相关新闻
  • 网页标题如何设置?

    2026-04-03 17:24:09

    网页标题即是我们常说的title标签,相当于一篇文章的题目,是对网页内容主题的概括。搜索引擎往往会提取网页标题title的全部或部分内容作为摘要信息中的标题。因此,我们在拟写标题内容时,要做

  • 小程序“后半场”何去何从?

    2026-04-01 17:24:09

    4月2日阿拉丁小程序发布行业发展研究报告,网络购物类小程序在数量上超越了小游戏占比,成为榜单中占比的分类,说明社交电商在小程序中经历了两年的市场发展后,即将进入爆发期,对企业来说,这意味着小

  • 巨头“装企”投入20亿助力转型互联网之道

    2026-03-31 17:24:09

    2019·第五届土巴兔生态大会在深圳召开,同时也是影响行业变革的风向标。土巴兔对外宣布了一项针对国内装修企业的重磅战略——天梯扶持计划,用于扶持、推动装修企业网站开发的快速发展。据网站开发公

  • 如何制作自己的网站 营销型网站如何策划

    2026-03-30 17:24:09

    如今随着互联网的不断发展与迭代。很多企业还不知道该如何制作自己公司的网站,相信很多企业都有遇到这样的问题,毕竟制作公司网站,没有网站设计技术那是万万不可能的,要制作出公司网站,很多的公司只好

  • “APP过度索权”超范围收集用户个人信息

    2026-03-20 17:24:09

    小编记得很多年前,流行一句话“谁动了我的奶酪?”如今同样又流行起一句话“谁动了我的个人信息?”我想大家对于这句话应该都不陌生吧,甚至有些朋友在内心无数次的怒吼出这句话。这是现在移动端市场AP

什么是Robots协议

返回列表
发布时间:2026-03-12 17:24:09
Robots协议的全称是“网络爬虫排除标准”(Robots Exclusion
Protocol),网站通过Robots协议让搜索引擎知道哪些页面能抓取,哪些页面不能抓取。


公司网站设计案例


robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,可以创建和编辑它。robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。


当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。



Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots
Meta标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots
Meta标签也是放在页面中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。


Robots
Meta标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”。content部分有四个指令选项:index、noindex、follow、nofollow,指令间以“,”分隔。


index指令告诉搜索机器人抓取该页面;


follow指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;


Robots Meta标签的缺省值是index和follow,只有inktomi除外,对于它,缺省值是index、nofollow。



Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:音乐,视频等,节省服务器带宽;也可以屏蔽站点的一些死链接。方便搜索引擎抓取网站内容;设置网站地图连接,方便引导蜘蛛爬取页面。


Robots协议是网站出于安全和隐私考虑,防止搜索引擎抓取敏感信息而设置的。搜索引擎则会按照Robots协议给予的权限进行抓取。Robots协议代表了一种契约精神,互联网企业只有遵守这一规则,才能保证网站及用户的隐私数据不被侵犯。Robots协议是维护互联网世界隐私安全的重要规则,如果被破坏,其后果是不可想象的。