有什么方法可以屏蔽搜索引擎蜘蛛,禁止被收录
Admin 2022-08-22 群英技术资讯 570 次浏览
拒绝搜索引擎收录网站的方法:可以在head标签中添加内容【<meta name="robots" content="noarchive">】,禁止搜索引擎抓取网站并显示网页快照。
一个新的网站建好之后,只要搜索引擎蜘蛛抓取到的、网站内容不是很差劲那么搜索引擎就很有可能收录我们的网站,如果因为某种原因不想让搜索引擎收录网站,那要如何操作?下面本篇文章就来给大家讲解一下。
方法一:设置 robots.txt 方法
可以利用设置robots.txt来屏蔽搜索引擎蜘蛛,那么什么是robots.txt?
搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
如何使用robots.txt屏蔽搜索引擎蜘蛛?
搜索引擎默认的遵守 robots.txt 协议,创建 robots.txt 文本文件放至网站根目录下,编辑代码如下:
User-agent: * Disallow: /
通过以上代码,即可告诉搜索引擎不要抓取采取收录本网站,注意慎用如上代码:这将禁止所有搜索引擎访问网站的任何部分。
如果只想禁止百度收录全站,可以编辑如下代码:
User-agent: Baiduspider Disallow: /
如果只想禁止Google收录全站,可以编辑如下代码:
User-agent: Googlebot Disallow: /
方式二:设置网页代码方法
在网站首页代码<head>与</head>之间,加入如下代码,即可禁止搜索引擎抓取网站并显示网页快照。
<meta name="robots" content="noarchive">
在网站首页代码<head>与</head>之间,加入如下代码,即可禁止百度搜索引擎抓取网站并显示网页快照。
<meta name="Baiduspider" content="noarchive">
在网站首页代码<head>与</head>之间,加入如下代码,即可禁止谷歌搜索引擎抓取网站并显示网页快照。
<meta name="googlebot" content="noarchive">
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
网站关键词优化是指把网站里面的关键词进行选词和排版的优化达到优化网站排名的效果,在搜索引擎中把相关关键词的排名占据有利的位置。在现在这个互联网时代,网站关键词优化已经成为了企业在线上引流的一种渠道,特别是对于中小企业来说,深受喜爱。
网站推广一直是企业和个人站长们关注的问题,特别是新手站长。网站推广不仅仅是通过广告宣传,还包括SEO优化、内容营销、社会化媒体营销等方式。自己的网站怎么推广?
百度快照在我们做网站SEO优化中是至关重要的,百度快照是记录网站内容的副本,它更多的时候只是保存站点可识别的样式,重点是记录文字内容。当你的站点内容发生变化的时候,它会根据一定周期发生改变。
以下几种链接会被百度判断为作弊外链:1、论坛签名链接;2、相关性差的链接;3、论坛广告区的链接。
在我们建设内链的过程中应使用HTML文本链接,避免使用Flash、JS代码做内部链接;内部链接的URL使用绝对地址;使用Nofollow阻止页面的权重流失。
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008