华仔博客

  • 首页
  • seo
  • 网站建设
  • 工具资源
  • 生活
  • 程序开发
  • 网上那点事
  • 网络营销
华仔博客
一个经验分享的博客
  1. 首页
  2. seo
  3. 正文

网站内容不能被充分收录的原因

2012年12月21日 2357点热度 0人点赞 1条评论

网站内容不能被充分收录的原因

北京seo给大家揭秘不能充分收录的真实原因。

第一:被robots.txt文件屏蔽。在分析网站日志时发现蜘蛛每天都会在网站抓取,但是网站依然是收录不充分,这时我们很有必要检测网站的robots文件,站长们都知道蜘蛛来网站抓取时,首先会检索网站是否存在robots文件,查看网站是否已经存在不需要抓取的页面,看文件中是否阻止了网站中某部分内容,很多站长因为不会正确的写robots文件,导致网站不能被充分的收录。对于很多新手站长不知道如何写文件,可以利用百度站长工具robots文件功能,可以检测你的文件写法是否正确,或者可以直接帮你生成文件,需要你填写屏蔽的文件路径即可。如下面的例子:

User-agent: *

Disallow: /news / 不允许所有的搜索引擎抓取news路径下的内容

如果某网站上添加了上面的文件,蜘蛛并不会抓取网站上在news路径下的内容,网站在news目录下更新的文章永远不会被收录,网站更新再多的文章,访问日志中蜘蛛每天都来抓取,但是对于这些内容还是不会给予收录。但是对于网站来说news下的内容是很重要的,这样错误的robots文件并是网站不能被充分收录的幕后黑手。

第二: robots meta标签禁止,网站在诊断的过程中,发现网站的实际收录率很低,网站有的栏目页可以被收录完整,但是有的栏目页更新原创的文章,也不会被收录,之后在检查网站代码时才发现,页面上使用了 noindex标签告诉蜘蛛不允许索引这个页面,显然保护这段代码的栏目页不会被收录,更新的内容即使质量再高也不会被抓取。同时,nofollow标签告诉蜘蛛此页面上的链接不传递权重,如果网站上的页面链接都带有nofollow,那这就是明显的告诉搜索引擎此页面没有任何价值。如果你的站遇到不能被充分收录,检查下meta标签,是否存在错误的标签。

第三:页面没有被访问过,特别对于一些大型的内容型网站来说,网站上的内容页面特别多,网站之间如果不能很好的建立内链,很多页面可能就会面临着被沉底不收录的现象,这些页面大多数离网站首页深度比较深,蜘蛛无法对页面进行爬行,导致不能被蜘蛛收录。或者是链接到此页面的链接都是加了nofollow标签,不传递任何权重的链接。因为这种原因导致网站不被充分收录比较冤枉,对于网站的建设来说,最好不要在网站上使用nofollow标签、JS代码、或者蜘蛛不能识别的转向等。对于网站页面深度比较深的情况,站长们可以完善网站的内链建设,不要网站的页面变成独立的页面,建立好导航和内链,或者给想要收录的页面增加外链,提高页面在搜索引擎中的权重值。

第四:被蜘蛛当做是作弊的内容,网站中大量的使用黑帽SEO,作弊的手法优化页面,这样的页面蜘蛛是不会给予收录的。网站上长期使用隐藏文字在页面上进行关键词堆积,网站上对蜘蛛检索到存在隐藏文字和链接,这时你的网站很有可能会被蜘蛛从索引中删除,不会再次出现在搜索页面中。站长们可能会问什么是作弊的内容,如最初的作弊方法使用和背景颜色相同的文字,堆积大量的关键词,这种作弊方法很容易被检测出来;使用noscript标签,告诉浏览器当页面上有JS时,当浏览器关闭时,页面上该显示什么内容,事实上是在noscript标签中堆积很多关键词,这种做法是相关有危险的,很容易就会导致内容被删除。

第五:低质量内容垃圾站点,除去上面说到的4点优化方法上的原因,还有个重要的不可忽视的就是页面本身的问题,搜索引擎识别能力逐渐加强,对于非高质量非原创的内容,蜘蛛有一定的识别能力,不管是本身网站的重复内容,还是网站从外部获得的重复内容,蜘蛛都能一定程度的对其识别,对于重复的内容页面,蜘蛛不会继续放入自己的数据库,甚至会对一些低权重的网站,进行删除索引的操作。在互联网垃圾泡沫的时代,要想真正的做到收录充分,网站权重高,还是要坚持去做高质量的内容,这样才能长久在业界生存。

标签: 暂无
最后更新:2018年12月29日

admin

这个人很懒,什么都没留下

点赞
< 上一篇
下一篇 >

文章评论

  • 黔灵人民医院

    学习,支持,感谢博主分享!

    2012年12月23日
    回复
  • 取消回复
    广告
    搜索
    最新 热点 随机
    最新 热点 随机
    WhatsApp收不到验证码、一小时死循环现在可付费接码 win7惠普m227fdw打印机扫描仪不能用解决办法 WordPress教程-WordPress撰写设置 GTranslate3.04翻译插件不工作的原因找到了 WordPress教程-WordPress常规设置 wordpress教程-WordPress 安装 WordPress教程-WordPress概述 wordpress 导入word文档插件Seraphinite Post .DOCX Source 谷歌SEO的页面标题和元描述的长度多长最合适? 如何利用wordpress编辑网站页面 Hitpaw watermark remover去图片视频水印神器 WordPress博客页面和文章 如何充分利用您的 SEMrush 帐户 什么是 Robots.txt 文件以及Robots.txt 文件如何工作 ? WordPress列表页分页制作教程 youtube视频响应式插件Simple YouTube Responsive WordPress文章页添加展开/收缩功能 WordPress栏目调用去掉Ul标签 WordPress如何调用置顶文章 如何使用奈飞Netflix cookies登录奈飞Netflix GSA Search Engine Ranker项目屏幕 GSA Search Engine Ranker内容创建服务推荐 GSA Search Engine Ranker 仿写服务推荐 GSA Search Engine Ranker电子邮件账户推荐 GSA Search Engine Ranker搜索引擎提交服务推荐 GSA Search Engine Ranker索引服务推荐 GSA Search Engine Ranker验证码服务推荐 GSA Search Engine Ranker代理服务推荐 GSA Search Engine Ranker介绍 ChatGPT for Wechat-在微信上使用ChatGPT
    营销魔术师的最新举动......震撼了100万营销人 seo博客_网站图片的优化 ecshop商品详情页显示4个同类别下的推荐商品 13年四川高考高考满分作文:中国式平衡 谷歌nofollow插件百度知道链接已加nofollow seo博客_什么是关键词及关键词的选择原则 dede网站建设实用篇 iRedMail 支持的密码 北京seo_关于一个网站两个快照的问题详解 ecshop 首页调用文章图片 成功版 安徽的满分作文,大学上还是不上我也无语了 百度原创火星计划已经更新 济南seo教程:怎样让网站的百度排名再度提升 seo工具_反链批量增加工具 网络营销_弱弱的说说什么是网络营销 章丘撤市设区最新进展 如何使用奈飞Netflix cookies登录奈飞Netflix WordPress教程-WordPress概述 spamassassin垃圾邮件拦截插件 seo博客_robots.txt真的不管用,亲请看图 网络资源_Roundcube推荐插件整理 a5杂谈区秒杀外链了 WordPress栏目调用去掉Ul标签 json gbk转utf8 北京seo带你了解百度ping服务 个人网站怎么通过网站赚钱 SEO外链时代已过时原创时代来了 北京seo_lee详细介绍site语法下的结果数问题 config_global.php未找到或者无法访问解决方法 如何增强执行力将推广方法用到极致?

    © 2012-2025 sem-home.com.版权所有.

    主题KRATOS貌似作者网站打不开了,就没加,嗯就这样

    京ICP备12020022号