网站地图sitemap的三种文件类型及制作方法
网站地图sitemap的重要性在上一篇文章《四种url提交方式》中已经有过提到,今天就给大家具体介绍一下sitemap的三种文件类型以及制作方法。
Sitemap有三种文件类型,xml、txt和html
xml和txt文件的sitemap是给搜索引擎看的,通过搜索引擎的站长平台提交的是xml和txt这两个文件类型的sitemap,此外如果你有设置robots文件,在robots中添加的也是xml的sitemap文件地址。
html文件是给浏览用户看的,但是这一说法也并不完全正确,因为html的网站地图最好放到每个页面的底部导航中,在引导蜘蛛抓取上也会有一些作用。
网站地图sitemap的制作方法
1、txt网站地图
Txt的网站地图比较简单,只需要新建一个文本文档,命名为sitemap,然后将需要提交的url粘贴进去即可,需要注意的是每一行只能放一个url且单个url不能出现换行。单个文件url上限是5万条,大小上限为10M。如果超过这个限制,可以新建另外一个文本文档。
2、html网站地图
Html的网站地图其实可以理解为一个单独的页面,里面包括一些重要的菜单、聚合页面、文章的链接,通过放到每个页面底部导航菜单,方便浏览用户能够快速找到自己想找的内容。制作html网站地图需要你能够写html和css。
3、xml网站内容
单个xml的网站地图同样限制最多5万个url和10M的大小,所以如果你的站点内容比较多,超过5万条或者说以后肯定会超过5万条,那么建议你使用xml的索引类型的网站地图,也就是说将多个小的sitemap放到一起。单个和索引类型的sitemap见下面的截图。
单个sitemap
索引sitemap
敲黑板,在将xml文件上传到服务器时,可能会出现在浏览器打开空白的情况,可以依次排查1、是不是没有上传xsl样式文件;2、xsl样式文件是否存在大小写错误;3、浏览器无法解析xsl样式表文件(这个猜测是服务器问题)。这个问题能解决最好,不能解决也不用担心,是不影响向搜索引擎提交的。
说了三种sitemap文件的制作方法,可能有的人会有疑问,不是有工具可以直接生成三种sitemap文件吗,确实像爱站、小爬虫、sitemapX都有这个功能,但是一般的sitemap工具都是依靠内链来爬取链接的,这就要求你的每个页面都要有站内链接的入口,否则可能会被爬虫工具丢弃,所以建议还是尽量自己制作sitemap,更新起来也比较方便。
在自己制作xml文件的sitemap的时候需要注意拼写和<>是否丢失,要不然搜索引擎在抓取的时候会报错,就不能正常提交了。