正在阅读:

分析百度蜘蛛工作原理,有效提高网站收录的思维

6,539

分析百度蜘蛛工作原理,有效提高网站收录的思维

如何提高网站收录?首先要熟悉Spider的脾气,搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也叫机器人(bot)。蜘蛛其实就是搜索引擎的下属,辛勤的工作者。搜索引擎命令它到互联网上浏览网页,每天奔波在各大网站页面之中,从而得到互联网的所有数据,然后把这些数据存到百度搜索引擎的数据库中。

浅析百度蜘蛛工作原理

Spider抓取系统是搜索引擎数据来源的重要保证,如果把web理解为一个有向图,那么spider的工作过程可以认为是对这个有向图的遍历。从一些重要的种子URL开始,通过页面上的超链接关系,不断的发现新URL并抓取,尽最大可能抓取到更多的有价值网页。对于类似百度这样的大型spider系统,因为每时每刻都存在网页被修改、删除或出现新的超链接的可能,因此,还要对spider过去抓取过的页面保持更新,维护一个URL库和页面库。

Spider和人一样,会有第一印象。它会提取你网站是做什么的,提取你网站的题目,提取你的排版,若是你做的这些布局不太合理,会导致你网站的收录时间要比其他人多1-2周,甚至更久。如果当它已经爬取过你的网站了,就不要再改动了,结局并不是你所能承担的后果。要改的话最好在蜘蛛没来过你网站之前就改好,这就得在网站上线之前就策划好。

随着搜索引擎的不断更新,百度在数据库中就会降低那些陈旧信息的权重,提高那些最新的信息。这也培养了蜘蛛的喜新厌旧,对于"新鲜的血液",总会乐此不疲的去抓取,若是你天天都给它喂食"新鲜的血液",那么它来你网站的次数就越多,对你的网站就更加青睐。

人越多的网址Spider越喜欢去,人们都喜欢的网站,必有其值得欣赏的地方。这也导致了很多大论坛的权重愈来愈高,尤其是一些视频网站,优酷、土豆之类的。因为天天看的人数很多,点击量大并且跳出率很低。

还有很多蜘蛛不太喜欢的站点,像网站栏目不清晰、有大量js代码的、有flash的、有跳转的等等这些类型的网站。蜘蛛看不懂,收录的质量就会降低很多。研究好蜘蛛的一些特征,观察好他的动向对网站绝对有意想不到的收获。在<如何分析SEO网站优化数据,都需要分析哪些数据?>文章中我也提到让大家多看网站日志。

有效提高网站收录:增加多入口与锚链接

一般在网站的最初阶段,由于网站的权重比较低甚至没有权重。这时候搜索引擎蜘蛛不可能无限去挖掘你网站上的东西。一般来说你需要尽量把最新的东西放到首页、栏目以及各个重要页面之上,使你的文章增加更多的入口,Spider看到了这些更新的东西就会去看内容是否吸引它,另外文章内容也可以在相应的长尾关键词加上描连接。总的来说合理的内链不但可以增加收录量,还会让这些页面获得更好的排名。

原创文章与定时定量更新

这个在之前的文章中就提到过很多次了,大家可以看看<原创文章对SEO的作用>无论百度、360等搜索引擎都喜欢原创文章,尤其定时定量发布原创文章的网站,我们应该适当的投其所好。

提高合作网站的质量

如果你的合作网站权重,质量都很高。就会提高搜索引擎对你网站的信任度。自然而然地你的网站就会成为搜索引擎蜘蛛的重点关注对象。

网站地图与404页面

制作网站地图是为了方便搜索引擎蜘蛛根据导航索引爬行网站。至于404页面大家可以看看<404页面到底要怎样做?>来了解一下。

长尾关键词的挖掘与建设

网站建设的过程中想要获得更多流量,离不开长尾关键词的挖掘与建设。而长尾关键词想要获得排名,只有高质量资讯内容。当大量长尾关键词都获得排名以后,就算由搜索引擎算法改变而导致的核心关键词浮动,也不要因此而懊恼。因为即使核心关键词排名丢失,长尾关键词排名还是在的,并不会直接导致网站流量消失。