本文大纲:
1、百度网站收录是什么?为什么不收录?
2、百度收录网站的途径是什么?
3、百度快速收录是什么?提交收录是什么?
4、百度加快网站收录的三种方式(快速收录权限、蜘蛛池、老域名)
百度网站收录是什么?为什么不收录?
百度网站收录是什么,就如字面意思,就是网站被百度收录了。收录又可分为网站首页收录和内页收录。
网站首页收录,即这个网站首页主域名被收录了。举例白杨SEO博客(http://www.baiyangseo.com)查看方式,直接把域名放百度里即可:
至于网站首页前是放http://还是https://搜,这个看你网站用的哪个即可。而网站内页收录,指这个网站不止收录了首页,其它页面也收录了。
一般我们SEO查看方式是:site:http://www.baiyangseo.com,当然你也可以把那条内页放搜索引擎查看。
下图这个URL就代表没有被百度收录。
为什么有的网站百度不收录或者只收录首页呢?
很多人问这个,其实这是两个问题,而且是多种综合因素。如果你也有这个问题,请真看完本文最后你就能明白了,我先简单说说。
为什么有的网站百度一个页面都不收录?可能因素,比如你的网站属于黄赌毒黑灰,比如你的网站屏蔽了百度蜘蛛,再比如你的网站模板是被百度处罚降权过,或者你的网站上线期间服务器不稳定等等。
为什么网站只收录了首页,其它页面不收录?可能因素,你做的是内容可能就首页还能看看,其它页面没什么内容,又或者你的网站首页到内页该做的站内SEO都没有做。
百度收录网站的途径是什么?
目前百度收录的baiduspider抓取新资源的途径主要有两个:
1、baiduspider蜘蛛主动出击去发现抓取
2、从百度搜索资源平台的普通收录工具中获取数据
其中通过资源平台“收”上来的数据最受baiduspider的欢迎!
百度又是如何判断网站是新网站还是老网站呢?主要还是两个方式:
1、通过百度搜索资源平台—资源提交工具来提交内容
2、在工信部进行网站ICP备案判断
看上面都提到了一个共同的百度搜索资源平台,下面提交收录会说到。但看到了没,你的网站在工信部备案这个很重要,所以现在很多人问,不备案网站为啥很难被收录,大概明白了吧。
关于百度蜘蛛以及百度抓取原理感兴趣深入学习一下,看我之前写过这篇:
白杨SEO:SEO入门学习之搜索引擎百度蜘蛛与网站HTTP状态码
百度快速收录是什么?提交收录是什么?
百度快速收录是什么?白话来说,还是字面意思,就是如何快速让百度收录自己的网站。那到底有没有百度快速收录呢?
白杨SEO这里想给你的答案是,当然有百度快速收录,只是这个快速收录只是相对而言的。比如主动去提交收录就比你建好网站等着百度来抓取你收录快多了是不是?
提交收录又是什么?
其实我们这里说的提交收录,主要有两种方式:一种是你没有去百度资源站长后台验证网站的提交,另外一种就是去百度资源站长后台验证网站后提交。
前者是你可以提交自己未收录网页,也可以提交别人的(如图),后者你只能提交你自己的网站的页面。
但是吧,你提交了,他也不保证能收录你的链接。站长平台提交如下图,这边顺便再写写百度站长后台提交的几种方式。
百度那个快速收录很多人都没有那个权限,尤其新站更不有,等会在下面细讲。我们先来详细说说百度普通收录提交三种方式:
1、API接口推送(收录速度快)
没有快速收录权限,这个API接口推送是次优选,它的收录速度比sitemap网站地图和手动提交网址都快,但这个API最多每天最多推送提交10万条。
这个交给网站技术处理,看你是哪种类型,比如白杨SEO博客主要用PHP的,所以参考百度PHP推送示例做上即可。
2、网站sitemap地图提交
网站地图是把需要被收录的网址写进xml或txt文件里,上传到网站根目录,把网站地图的地址提交给百度,蜘蛛会不定期抓取sitemap里的链接。每个地图里最多写50000链接,每天最多提交10个,也就是最多500000条。
网站地图sitemap一般都是xml文件,打开看的时候你会发现其中包含很多代码,网页网址,时间日期等看不懂的内容。xml文件对于大多数搜索引擎都是非常实用的,html地图文件对百度来说是很友好的。
3、手动提交网址
手动提交网址是把每天新增或修改的网页页面地址手动推送给百度,每次最多推送只有20条。
手动提交收录的效果也比上面几个差一些,稍微比百度蜘蛛自己来抓取快一些。除非你是新网站想被百度快速被收录,一般不太建议每天去百度站长平台手动提交,麻烦,不如等它自己来爬取哈。
你可能会问,白杨SEO,我之前听说百度那个有自动推送啊,怎么没看到你写呢?这里说明两点,一是百度自动功能早下线了,二是自动推送也有他的不足。
以前百度自动推送是在网站里加一段js代码,代码安装后无需其他操作,每当有访客访问页面时,自动把链接推送给百度蜘蛛。这样提高页面被抓取收录的速度。但是,如果网站的访客数较多时,反复推送会造成蜘蛛抓取次数增加,消耗服务器带宽和流量,增加服务器压力,如果服务器小了,可能反而起反作用。
这段代码如下(能不能用自己去试,但注意我上面说的):
<script>(function(){ var bp = document.createElement('script');var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })(); </script>
百度加快网站收录的三种方式(快速收录权限、蜘蛛池、老域名)
上面说完常规的新站比自然等百度主动抓取快一点的方式,有没有更快速的方法呢?这里再说三种方式。
1、快速收录权限
快速收录权限,百度官方为了让站长更加跟着百度,百度曾推出过【熊掌号】,而大家用熊掌号最大的就是百度的这个快速收录。这个快速收录有多块呢?主要有小时级、天级、周级。大家最喜欢的就是小时级收录,一般2-3小时就能完成爬取。
现在这个权限哪里来?
有两种方式,一种就是以前有熊掌号虽然下线了,但是他的那个老域名的快速收录权限还在,所以有很多人拿来卖他那个老域名。
这种就要自我把控了哈,白杨SEO个人建议完全没必要。比如,白杨SEO这个http://yanghonglin.com老域名还有快速收录权限,如图:
另外一种就是去做个百度小程序啦,这个快速权限其实是移到百度小程序上了,举例比如白杨SEO某个小程序就有这个快速权限。
其实吧,所谓这个快速收录权限,不管是熊掌号域名还是小程序都不是最核心,最核心的是你的网站本身和内容优质与否哈。
2、蜘蛛池
很多SEO同学可能没听过,蜘蛛池是什么?蜘蛛池,指的是被搜索引擎蜘蛛抓取的频次较多的网站,有强大的吸引蜘蛛的能力。当我们建了新网站,或网站不收录的时候,就可以用蜘蛛池促进收录。这也是一种方式。
比如某知名SEO论坛就有这个服务,100元4000个蜘蛛,截图如下:
效果如何,白杨SEO没用过,网上提供这种付费服务的也多,所以就不做推荐了哈,如果想知道如上截图资源,可以加我微信私下问我,当然有些同学也知道的哈哈哈。
3、老域名
如果你想你的新站快速被百度收录,内容也收录快一些,第三个方法就是去买老域名建站。老域名的优势是在百度那里信任度高。
什么叫老域名?就是有三年及以上的域名,并且要有建站历史。如果有域名五年了,五年都有建站,且有备案,这就是一个好的老域名。
在哪购买,你懂搜索就可以了,实在找不到,阿里云里也有。怎么去查老域名?白杨SEO四川老乡有个桔子SEO工具可以查询,我以我的网站查询如图:
至于费用,这个需要你自己购买去问了。
看到上面我写的这些,你大概清楚了吧。回到我们开始提的问题,为什么我的域名还是不被收录,或者说我的域名之前被收录了突然搜索不到了。那是,你有可能被举报了。
比如:以下截图来自来咨询我问题客户真实反馈:
如果不是被举报,影响提交网站URL被百度抓取和收录请看是不是这几个方面原因:
A、站点封禁
有的网站一边封禁着(robots.txt里)百度spider,一边向百度疯狂提交数据,结果当然是无法收录。
B、质量筛选
百度spider不断地进行更新,对低质内容的识别越来越精准。从抓取这个环节就开始进行内容质量的评估和筛选,过滤掉大量过度优化和内容低质的页面。
如果你的内容一直未收录,那么需要看看内容质量是否过关,对于内容低质和体验低质的资源,百度搜索不会收录!
C、抓取失败
抓取失败的原因很多,有时你在办公室访问完全没有问题,百度spider却遇到麻烦。网站开发者要随时注意在不同的时间地点都要保证网站的稳定性。
D、站点安全
通常情况下,站点被黑后页面数量会突然爆发式增长,因此会影响到spider对优质链接的抓取。所以站点在保证访问稳定外,也要关注网站安全,防止站点被黑。
关于网站如何被收录,我公众号之前也写过,可以看这篇:白杨SEO:如何让网页被百度收录以及提高它的排序?