当前位置：首页 > 新闻资讯 > 什么是Robots协议

相关新闻

什么是Robots协议
2026-05-11 08:24
Robots协议的全称是“网络爬虫排除标准”(RobotsExclusionProtocol)，网站通过Robots协议让搜索引擎知道哪些页面能抓取，哪些页面不能抓取。robots.tx
3133拉斯维加斯正式签约中国互联网金融协会——缔造不同的“时代网站”
2026-05-10 23:26
中国互联网金融协会（以下简称：中互金）英文缩写NIFA，是由中国人民银行会同银监会、证监会、保监会等国家有关部委组织建立的互联网金融行业自律组织。2015年12月31日，经国务院批准，民政
极具内涵设计的网站你了解的多吗？
2026-05-07 20:20
北京网站开发设计这件事情对于大多数的公司来讲，都算得上是非常重要的一件事情，如果想要给客户留下一个好的印象，那么一定要通过北京网站设计来帮助自己展示自己的形象，但是北京网站设计怎样才能够变得
“产业互联网”演化的四个进程（企业必读）
2026-04-23 08:05
钛媒体快讯5月21日消息：腾讯总裁刘炽平出席2019腾讯全球数字生态大会并致辞。他表示，数字经济正在经历三个演化。3133拉斯维加斯北京网站开发团队告诉你互联网下半场如何扎根消费互联网、拥抱产业互
做网站制作必须注意的三点要求
2026-04-19 09:53
网络营销的崛起带动了一大批人投入进来，都纷纷为自己的企业打造站点，想通过自己的网赚钱，然而对于新朋友而言，做好官网搭建往往是需要注意很多问题的，要是问我做网站的前期选择重不重要，这个我可以很

什么是Robots协议

返回列表

发布时间：2026-05-11 08:24

Robots协议的全称是“网络爬虫排除标准”(Robots Exclusion
Protocol)，网站通过Robots协议让搜索引擎知道哪些页面能抓取，哪些页面不能抓取。

robots.txt文件是一个文本文件，使用任何一个常见的文本编辑器，可以创建和编辑它。robots.txt是一个协议，而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。

当一个搜索蜘蛛访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果存在，搜索机器人会按照该文件中的内容来确定访问的范围;如果该文件不存在，所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况，而Robots
Meta标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样，Robots
Meta标签也是放在页面中，专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。

Robots
Meta标签中没有大小写之分，name=”Robots”表示所有的搜索引擎，可以针对某个具体搜索引擎写为name=”BaiduSpider”。content部分有四个指令选项：index、noindex、follow、nofollow，指令间以“,”分隔。

index指令告诉搜索机器人抓取该页面;

follow指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;

Robots Meta标签的缺省值是index和follow，只有inktomi除外，对于它，缺省值是index、nofollow。

Robots协议用来告知搜索引擎哪些页面能被抓取，哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件，如：音乐，视频等，节省服务器带宽;也可以屏蔽站点的一些死链接。方便搜索引擎抓取网站内容;设置网站地图连接，方便引导蜘蛛爬取页面。

Robots协议是网站出于安全和隐私考虑，防止搜索引擎抓取敏感信息而设置的。搜索引擎则会按照Robots协议给予的权限进行抓取。Robots协议代表了一种契约精神，互联网企业只有遵守这一规则，才能保证网站及用户的隐私数据不被侵犯。Robots协议是维护互联网世界隐私安全的重要规则，如果被破坏，其后果是不可想象的。

020-45003038 现在就想找顾问聊聊立即咨询

什么是Robots协议

3133拉斯维加斯正式签约中国互联网金融协会——缔造不同的“时代网站”

极具内涵设计的网站你了解的多吗？

“产业互联网”演化的四个进程（企业必读）

做网站制作必须注意的三点要求

什么是Robots协议