创建Sitemap索引文件的目的就是确保web服务器不会因传输非常大的文件而遇到麻烦。如果要列出超过50,000个网址,您需要创建多个Sitemaps文件。
如果预计您的Sitemap网址数量会超过50,000个或未压缩时大小超过10MB(10,485,760字节),应考虑创建多个Sitemap文件。
如果您的确提供了多个Sitemap,您可以将其列在Sitemap索引文件中。Sitemaps索引文件只能列出不超过1,000个Sitemap。
Sitemaps 索引文件的 XML 格式与 Sitemaps 文件的 XML 格式非常相似。Sitemaps 索引文件使用以下 XML 标记:
loc
lastmod
sitemap
sitemapindex
注:Sitemaps 索引文件只能指定与其位于同一网站的Sitemap。例如,http://www.jiangwenseo.com/sitemap_baidu.xml 可包含位于http://www.jiangwenseo.com的Sitemap。
您的 Sitemap索引文件应为 UTF-8 编码。
XML Sitemaps 索引示例
下例展示了一个 XML 格式的 Sitemaps 索引。该 Sitemaps 索引列出了两个 Sitemaps:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
备注:与XML文件中的所有值一样,Sitemap网址需要实体换码。
Sitemap索引XML标记定义
①需要有 <loc> 标记并用其来识别 Sitemap的位置。
②<lastmod> 标记是可选标记,用于指示相应Sitemap文件的修改时间。它并不对应于该 Sitemap中列出的任一网页的更改时间。lastmod标记的值应采用 W3C Datetime 格式。
通过提供最近修改的时间戳启用搜索引擎抓取工具,抓取工具将只检索索引中的Sitemap的一个子集,也就是说,抓取工具只检索某特定日期之后修改的Sitemap。通过这一递增的Sitemap提取机制,可以快速发现超大型网站上的新网址。
③<sitemap>标记封装单个Sitemap的相关信息。
④<sitemapindex>标记会压缩有关文件中的所有Sitemap的信息。
- 作者:姜 文 | 发布:2015年04月22日
- 分类:SEO教程
- 标签:seo教程
- 转载文章请注明:如何创建Sitemap索引文件? | 姜文博客