什么是Sitemap? 怎样做?

Sitemap是什么?

站点地图(Sitemap)是站长用来通知搜索引擎在他们的站点上可以爬行的页面的一种简单方法。在其最简单的形式,一个网站地图是一个XML文件,列出一个站点的URL以及额外的元数据对每个URL(上次更新时,它通常多长时间发生变化时,是多么的重要,相对于其他网站的URL),以便搜索引擎可以更明智地爬行。


网站地图.jpg


网络爬虫通常会从网站和其他网站的链接中发现页面。Sitemaps补充这个数据允许爬虫支持站点地图接站点地图中的所有url和了解这些url使用相关的元数据。使用Sitemap协议并不能保证web页面包含在搜索引擎中,但是提供了一些提示,让web爬虫能够更好地爬行您的站点。


怎样制作sitemap?


一、手动标准版的Sitemap文件如下所示:


sitemap的制作.jpg


urlset:这个表情是必须的,词标签声明了Sitemap协议的版本

url:必须的,是它下面所有网址的母标签

loc:必须的,页面永久链接地址

lastmod:这个是可选标签,表示页面最后修改时间

changefreq:可选标签,代表页面更新频率。

priority:可选标签,表示URL相对于其他的优先权,可选范围:0.0-1.0 数值越大,说明越重要。

手动制作Sitemap的优点:制作的文件清晰简单,同时可以自己设定一些自己认为比较重要的URL告诉搜索引擎这个页面相对重要的程度,如我们可以通过设定priority的值来依次设定首页、栏目页的重要程度,当然评判还是以搜索引擎的标准为主。缺点:对于一些中大型网站,页面众多很难人工实现。


二、通过一些工具


网上有很多sitemap地图生成的方法,比如在线生成、软件生成等(具体什么软件,大家可以在百度搜下就可以,我就不说出软件了,免得以为我打广告),另外现在很多的CMS或博客的程序都自带一些网站地图生成插件,我们只要安装插件使用就行了。

优点:简单方便,只要输入你网站的地址,确认就可以给你生产一个网站地址

缺点:会生成很多不必要的标签。

这里值得一提的是,Sitemap 最多可以列出5万个URL,且文件不能超过10MB,如果需要收录的超过,就需要分词多个Sitemap,但一个网站最多可以有1000个Sitemap。


第三步:Sitemap的提交


将制作好的Sitemap 文件上传到网站的根目录下,然后通知搜索引擎,我们可以通过站长工具后台提交网站地图文件,还有一种途径是在robots.txt文件中通知搜索引擎网站地图文件位置,只要在robots.txt文件中加入一句:Sitemap: http://www.brain-info.com/sitemap.xml 即可。个人比较青睐。大家都知道robots.txt是蜘蛛(当然谷歌的叫机器人,反正都是一回事了)访问网站首先要看的文件,他要根据你的指令对网站进行抓取,而把sitemap写入到robots.txt中大大提高了蜘蛛的效率,这对网站的优化尤其重要

另外就通过修改网站的源文件为地图增加锚文本,一定要记得是全站的链接哦。那样才能增加Sitemap 的权重,有效的吸引蜘蛛爬行。


【温馨提示】通过Sitemap网站题图,引导通知搜索引擎有这些页面存在,让他去看看,如果页面达到搜索引擎的要求,他就会收录,但如果页面没达到要求的话搜索引擎也是不会收录的,所以布瑞恩提醒各位SEOer要首先做好网站页面质量。若您对上文有任何疑问,或者是想要咨询其他相关问题,欢迎点击页面右侧的在线咨询服务。