正在阅读:

如何创建Sitemap索引文件?

6,953

创建Sitemap索引文件的目的就是确保web服务器不会因传输非常大的文件而遇到麻烦。如果要列出超过50,000个网址,您需要创建多个Sitemaps文件。

如果预计您的Sitemap网址数量会超过50,000个或未压缩时大小超过10MB(10,485,760字节),应考虑创建多个Sitemap文件。

如果您的确提供了多个Sitemap,您可以将其列在Sitemap索引文件中。Sitemaps索引文件只能列出不超过1,000个Sitemap。

Sitemaps 索引文件的 XML 格式与 Sitemaps 文件的 XML 格式非常相似。Sitemaps 索引文件使用以下 XML 标记:

loc

lastmod

sitemap

sitemapindex

注:Sitemaps 索引文件只能指定与其位于同一网站的Sitemap。例如,http://www.jiangwenseo.com/sitemap_baidu.xml 可包含位于http://www.jiangwenseo.com的Sitemap。

您的 Sitemap索引文件应为 UTF-8 编码。

XML Sitemaps 索引示例

下例展示了一个 XML 格式的 Sitemaps 索引。该 Sitemaps 索引列出了两个 Sitemaps:

<?xml version="1.0" encoding="UTF-8"?>

<sitemapindex xmlns="http://www.google.com/schemas/sitemap/0.84">

<sitemap>

<loc>http://www.example.com/sitemap1.xml.gz</loc>

<lastmod>2004-10-01T18:23:17+00:00</lastmod>

</sitemap>

<sitemap>

<loc>http://www.example.com/sitemap2.xml.gz</loc>

<lastmod>2005-01-01</lastmod>

</sitemap>

</sitemapindex>

备注:与XML文件中的所有值一样,Sitemap网址需要实体换码。

Sitemap索引XML标记定义

①需要有 <loc> 标记并用其来识别 Sitemap的位置。

②<lastmod> 标记是可选标记,用于指示相应Sitemap文件的修改时间。它并不对应于该 Sitemap中列出的任一网页的更改时间。lastmod标记的值应采用 W3C Datetime 格式。

通过提供最近修改的时间戳启用搜索引擎抓取工具,抓取工具将只检索索引中的Sitemap的一个子集,也就是说,抓取工具只检索某特定日期之后修改的Sitemap。通过这一递增的Sitemap提取机制,可以快速发现超大型网站上的新网址。

③<sitemap>标记封装单个Sitemap的相关信息。

④<sitemapindex>标记会压缩有关文件中的所有Sitemap的信息。

上一节[ 6.2 ]Sitemap文件应该放在哪里

下一节[ 6.4 ]如何提交Sitemap