华仔博客

  • 首页
  • seo
  • 网站建设
  • 工具资源
  • 生活
  • 程序开发
  • 网上那点事
  • 网络营销
华仔博客
一个经验分享的博客
  1. 首页
  2. seo
  3. 正文

网站内容不能被充分收录的原因

2012年12月21日 1675点热度 0人点赞 1条评论

网站内容不能被充分收录的原因

北京seo给大家揭秘不能充分收录的真实原因。

第一:被robots.txt文件屏蔽。在分析网站日志时发现蜘蛛每天都会在网站抓取,但是网站依然是收录不充分,这时我们很有必要检测网站的robots文件,站长们都知道蜘蛛来网站抓取时,首先会检索网站是否存在robots文件,查看网站是否已经存在不需要抓取的页面,看文件中是否阻止了网站中某部分内容,很多站长因为不会正确的写robots文件,导致网站不能被充分的收录。对于很多新手站长不知道如何写文件,可以利用百度站长工具robots文件功能,可以检测你的文件写法是否正确,或者可以直接帮你生成文件,需要你填写屏蔽的文件路径即可。如下面的例子:

User-agent: *

Disallow: /news / 不允许所有的搜索引擎抓取news路径下的内容

如果某网站上添加了上面的文件,蜘蛛并不会抓取网站上在news路径下的内容,网站在news目录下更新的文章永远不会被收录,网站更新再多的文章,访问日志中蜘蛛每天都来抓取,但是对于这些内容还是不会给予收录。但是对于网站来说news下的内容是很重要的,这样错误的robots文件并是网站不能被充分收录的幕后黑手。

第二: robots meta标签禁止,网站在诊断的过程中,发现网站的实际收录率很低,网站有的栏目页可以被收录完整,但是有的栏目页更新原创的文章,也不会被收录,之后在检查网站代码时才发现,页面上使用了 noindex标签告诉蜘蛛不允许索引这个页面,显然保护这段代码的栏目页不会被收录,更新的内容即使质量再高也不会被抓取。同时,nofollow标签告诉蜘蛛此页面上的链接不传递权重,如果网站上的页面链接都带有nofollow,那这就是明显的告诉搜索引擎此页面没有任何价值。如果你的站遇到不能被充分收录,检查下meta标签,是否存在错误的标签。

第三:页面没有被访问过,特别对于一些大型的内容型网站来说,网站上的内容页面特别多,网站之间如果不能很好的建立内链,很多页面可能就会面临着被沉底不收录的现象,这些页面大多数离网站首页深度比较深,蜘蛛无法对页面进行爬行,导致不能被蜘蛛收录。或者是链接到此页面的链接都是加了nofollow标签,不传递任何权重的链接。因为这种原因导致网站不被充分收录比较冤枉,对于网站的建设来说,最好不要在网站上使用nofollow标签、JS代码、或者蜘蛛不能识别的转向等。对于网站页面深度比较深的情况,站长们可以完善网站的内链建设,不要网站的页面变成独立的页面,建立好导航和内链,或者给想要收录的页面增加外链,提高页面在搜索引擎中的权重值。

第四:被蜘蛛当做是作弊的内容,网站中大量的使用黑帽SEO,作弊的手法优化页面,这样的页面蜘蛛是不会给予收录的。网站上长期使用隐藏文字在页面上进行关键词堆积,网站上对蜘蛛检索到存在隐藏文字和链接,这时你的网站很有可能会被蜘蛛从索引中删除,不会再次出现在搜索页面中。站长们可能会问什么是作弊的内容,如最初的作弊方法使用和背景颜色相同的文字,堆积大量的关键词,这种作弊方法很容易被检测出来;使用noscript标签,告诉浏览器当页面上有JS时,当浏览器关闭时,页面上该显示什么内容,事实上是在noscript标签中堆积很多关键词,这种做法是相关有危险的,很容易就会导致内容被删除。

第五:低质量内容垃圾站点,除去上面说到的4点优化方法上的原因,还有个重要的不可忽视的就是页面本身的问题,搜索引擎识别能力逐渐加强,对于非高质量非原创的内容,蜘蛛有一定的识别能力,不管是本身网站的重复内容,还是网站从外部获得的重复内容,蜘蛛都能一定程度的对其识别,对于重复的内容页面,蜘蛛不会继续放入自己的数据库,甚至会对一些低权重的网站,进行删除索引的操作。在互联网垃圾泡沫的时代,要想真正的做到收录充分,网站权重高,还是要坚持去做高质量的内容,这样才能长久在业界生存。

标签: 暂无
最后更新:2018年12月29日

admin

这个人很懒,什么都没留下

点赞
< 上一篇
下一篇 >

文章评论

  • 黔灵人民医院

    学习,支持,感谢博主分享!

    2012年12月23日
    回复
  • 取消回复
    广告
    搜索
    最新 热点 随机
    最新 热点 随机
    泰坦第四季第二部分4月13日上映阿里云盘 继承之战第四季阿里云盘3月26日更新 太阳召唤第二季阿里云盘 小美人鱼真人版阿里云盘待更新 魔术师的大象阿里网盘待更新 梅森探案集第二季阿里云盘 黑暗荣耀第二季阿里云盘 曼达洛人第三季中字4k阿里网盘 ChatGPT for Wechat-在微信上使用ChatGPT Netflix奈飞,HBO Max,Disney+账号会员合租共享 免费的ChatGPT API接口网站-The Free ChatGPT API 最后的生还者4k阿里云盘分享 Ahrefs账号-Ahrefs的终极使用教程 Moz Pro共享账号-Moz工具完整教程 Moz Pro团购账号 Ahrefs正版账号共享使用 Ahrefs共享团购账号 Wordpress文章列表没有缩略图就显示默认图片 SEMrush 团购账号-SEMrush 的优点 2023最新Semrush正版账号共享使用 Semrush团购账号 SEMrush是什么-semrush使用教程 谷歌SEO关键词调研工具SEMRUSH如何使用 wordpress 产品图片放大镜效果制作 phpmyadmin 修改表 Table 'wp_options' is read only GSA Search Engine Ranker 项目窗口详细介绍 iRedMail 支持的密码 Wild Rift 英雄联盟手游美服转日服(国际服之间的转换)教程 网站更换主题喽 Burn It All Down (ft. PVRIS) _Worlds 2021 - League of Legends
    免费的ChatGPT API接口网站-The Free ChatGPT APINetflix奈飞,HBO Max,Disney+账号会员合租共享ChatGPT for Wechat-在微信上使用ChatGPT曼达洛人第三季中字4k阿里网盘黑暗荣耀第二季阿里云盘梅森探案集第二季阿里云盘魔术师的大象阿里网盘待更新小美人鱼真人版阿里云盘待更新太阳召唤第二季阿里云盘继承之战第四季阿里云盘3月26日更新泰坦第四季第二部分4月13日上映阿里云盘
    弱弱的说说近期各大网站改版 apache双机搭建高可用负载均衡 Ahrefs账号-Ahrefs的终极使用教程 seo博客_做seo先从选择域名主机开始 太阳召唤第二季阿里云盘 华仔教你如何看清一个网站和公众号 北京seo_seo优化正式开篇 seo博客_什么是404页面及怎么制作404页面 近期我都去买干货的了 keepalived 安装教程 北京seo_本地php环境的搭建 怎样利用网摘收藏做好网站推广? centos7下apache安装以及自动启动 网络资源_Roundcube推荐插件整理 百度站长平台高端SEO俱乐部第一期沙龙活动整理分享 js实现的最简单的滑动门 免费的ChatGPT API接口网站-The Free ChatGPT API 男孩实现11年前的爱情约定,女主播现在如何了结 百度外链工具如何批量拒绝垃圾链接 a5杂谈区秒杀外链了 号外号外谷歌字体国内已经正常打开 营销魔术师的最新举动......震撼了100万营销人 李彦宏“改变,从你我开始”为题的公开信 宝塔面板编译开启ngx_pagespeed成功版 近期关于site语法查询的问题百度官网回答 年度最给力,冰点促销来袭,你准备好了吗? (转载)如何正确使用微同步来更新微博 Google搜索新算法,严惩侵权的网站 如何判断页面价值 百度搜索结果官网子链 展现上线公告

    © 2012-2023 sem-home.com.版权所有.友情链接:章丘新闻

    主题KRATOS貌似作者网站打不开了,就没加,嗯就这样

    京ICP备12020022号