禁止搜索引擎抓取网站内容的方法有哪些,为何要这样做
Admin 2022-06-10 群英技术资讯 630 次浏览
可能有的朋友会奇怪,网站的页面不是让搜索引擎抓的越多越好吗,怎么还会有怎么让网站页面内容不被抓取的想法。
首先,一个网站可以分出去的权重是有限,哪怕是Pr10的站,也不可能无限的分权重出去。这权重包括链到别人网站的处链以及自己网站内的内链。
外链的话,除非是想坑被链的人。否则外链都是需要让搜索引擎所抓取。这不在本文讨论范围之内。
而内链,因为有些网站有不少重复或冗余的内容。 比如一些按条件查询的搜索结果。特别是一些B2C站,在专门查询页或在所有产品页面的某个位置内,都可以按产品类型,型号,颜色,大小等进行分类搜索。这些页面虽然对浏览者来说是极大的方便,但对搜索引擎来说,这可是耗费蜘蛛极大的抓取时间,特别是网站页面较多时。同时也会分散页面权重,对SEO不利。
另外网站管理登陆页面,备份页面,测试页面等等,也是站长不想让搜索引擎所收录的。
所以就有需要让网页的某些内容,或某些页面不被搜索引擎所收录。
下面笔者先介绍一下较为有效的几种方法:
1.在FLASH展示不想被收录的内容
众所周知,搜索引擎对FLASH的内容抓取能力有限,不能完全抓取所有FLASH内的所有内容。但遗憾的是,也不能完全保证FLASH的所有内容都不会被抓取。因为谷歌和Adobe正努力的实现FLASH抓取技术。
2.使用robos文件
这是暂时最有效的方法,但有个很大的缺点。就是不传出任何的内容及链接。大家知道,在SEO来说比较健康的页面应该是有进有出的。有外链的链入,同时也页面内也需要有链到外部网站的链接,所以robots文件控制,让此页面只进不出,搜索引擎也不知道内容是什么。会把此页定为低质量页面。权重有可能受一定的惩罚。这个多用于网站管理页面,测试页面等。
3.使用nofollow标签包裹不想被收录的内容
这个方法也不能完全保证不被收录,因为这并不是严格要求遵守的标签。另外,如果有外部网站链向了有nofollow标签的页面。这样就很有可能会被搜索引擎抓取。
4.用Meta Noindex标签加上follow标签
这个方法可以做到防止收录而且还能传递出权重。要不要传递,看网站建设站长自己的需要。这个方法的缺点是,也是会较大的浪费蜘蛛的抓取页面时间。
5.用robots文件的同时在页面上使用iframe标签展示需要搜索引擎收录的内容robots文件可以阻止iframe标签以外的内容被收录 。所以,可以把不想收录的内容放到正常页面标签下。而想被收录的内容放在iframe标签内。
紧接着,再说一下已经失效的方法,大家以后不要用这些方法了。
1.使用表格
谷歌和百度早已经能抓取表格用的内容了,无法阻止收录。
2.使用Javascript及Ajax技术
以现在的技术来说,Ajax和javascript现在的最终运算的结果还是以HTML的形式传给浏览器以作显示,所以这同样无法阻止收录。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
随着互联网的不断发展,网站SEO优化深得广大企事业客户的喜爱,网站SEO优化可以让企业更好的在线上获取流量增加销售渠道,但是在网站SEO优化中我们也会由于违反搜索引擎规则而导致网站被K,网站被K的形式主要体现在全站被K、首页被K、内页被K这三种
网页收录后又被删除的原因:1、文章内容与网络上的文章相似度过高;2、文章中没有实质的内容;3、文章内容价值度不高;4、文章内容是采集的或者是伪原创的。
seo优化的方法:1、网站站内优化;2、网站基础建设的优化;3、网站内容优化;4、内链的建设;5、外链的分布;6、交换友情链接;7、了解各大搜索引擎的算法。
随着互联网的不断发展,网站SEO优化已经成为了很多企业作为线上引流的一种渠道了,但是在网站SEO优化中无时无刻都会有网站被搜索引擎惩罚,特别是在搜索引擎算法更新的时候,这也是站长们非常头疼的一个问题
新手学习SEO需要注意的地方有:1、网站导航;2、网站的内容,数字、字母和汉字对于百度来说是非常友好的;3、网站的三大标签;4、all属性;5、关键词密度;6、向搜索引擎提交网站地址;7、交换友情链接。
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008