有什么方法可以屏蔽搜索引擎蜘蛛,禁止被收录
Admin 2022-08-22 群英技术资讯 415 次浏览
拒绝搜索引擎收录网站的方法:可以在head标签中添加内容【<meta name="robots" content="noarchive">】,禁止搜索引擎抓取网站并显示网页快照。
一个新的网站建好之后,只要搜索引擎蜘蛛抓取到的、网站内容不是很差劲那么搜索引擎就很有可能收录我们的网站,如果因为某种原因不想让搜索引擎收录网站,那要如何操作?下面本篇文章就来给大家讲解一下。
方法一:设置 robots.txt 方法
可以利用设置robots.txt来屏蔽搜索引擎蜘蛛,那么什么是robots.txt?
搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
如何使用robots.txt屏蔽搜索引擎蜘蛛?
搜索引擎默认的遵守 robots.txt 协议,创建 robots.txt 文本文件放至网站根目录下,编辑代码如下:
User-agent: * Disallow: /
通过以上代码,即可告诉搜索引擎不要抓取采取收录本网站,注意慎用如上代码:这将禁止所有搜索引擎访问网站的任何部分。
如果只想禁止百度收录全站,可以编辑如下代码:
User-agent: Baiduspider Disallow: /
如果只想禁止Google收录全站,可以编辑如下代码:
User-agent: Googlebot Disallow: /
方式二:设置网页代码方法
在网站首页代码<head>与</head>之间,加入如下代码,即可禁止搜索引擎抓取网站并显示网页快照。
<meta name="robots" content="noarchive">
在网站首页代码<head>与</head>之间,加入如下代码,即可禁止百度搜索引擎抓取网站并显示网页快照。
<meta name="Baiduspider" content="noarchive">
在网站首页代码<head>与</head>之间,加入如下代码,即可禁止谷歌搜索引擎抓取网站并显示网页快照。
<meta name="googlebot" content="noarchive">
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
网站降权的解决方法是:1、定时定点更新内容,并持续增加数量;2、外链的平台要多样性;3、避免网站中出现过多的重复内容;4、保证网站健康、安全、合乎法律法规。
现在越来越多的电商网站开始重视网站优化。电商网站优化包括网站标题,图片大小等的网站内容和关键词,网站代码,网站性能等的网站内容内部优化和外部优化。相比于纯文字的网站,电商网站的优化难度大,而且很多电商网站都是大型网站,优化起来更是难上加难。
随着搜索引擎智能化,大面积的网络上面内容重复的太多,对于像咱们这样企业网站本身权重不高,又产生不少重复内容来说,不收录是在正常不过的事情。为了网站的能够有更好的排名,我们急需要改变这样一个现状,那么企业网站页面内容不收录怎么办?来看看吧
颜值是个网络词汇,主要是对人或者物的外貌特征优劣程度打分,顾名思义,“颜”就是“外貌”,“值”就是分数,用网络用语就是指数。说一个网站的颜值,就是指网站首页设计效果,在网站首页设计上,走过一段漫长的摸索过程
现在是互联网的时代,如果企业网站及产品推广信息没办法出现在搜索结果的前10位,那么整体的流量和效果会很微弱,相当于无人问津的状态。 所以,在越激烈的行业中,只有采取有效的方法推广自己的网站,才可以提升品牌,实现曝光,获得转化。
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008