阅读372 返回首页    go 谷歌 go 谷歌新闻


谷歌新闻资讯站点地图: 创建新闻站点地图

首先,确保您的网站已加入“Google 新闻”。如果未加入,可与我们联系请求加入。

“Google 新闻”站点地图采用站点地图协议,另外还带有下文定义的“Google 新闻”专用标记。下例是采用“Google 新闻”专用标记的 Google 新闻站点地图条目:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
    <loc>http://www.example.org/business/article55.html</loc>
    <news:news>
      <news:publication>
        <news:name>新华日报</news:name>
        <news:language>zh-cn</news:language>
      </news:publication>
      <news:access>Subscription</news:access>
      <news:genres>PressRelease, Blog</news:genres>
      <news:publication_date>2008-12-23</news:publication_date>
      <news:title>A 公司与 B 公司展开并购谈判</news:title>
      <news:keywords>business, merger, acquisition, A, B</news:keywords>
      <news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers>
    </news:news>
  </url>
</urlset>
新闻专用标记的定义

标记 必带标记? 说明
<publication>
是 <publication> 标记用于指定发表此报道的出版物。该标记必须包含两个下级标记:<name> 和 <language>。<name> 是新闻出版物的名称。该名称必须与 news.google.cn 上的报道中显示的名称完全一致(除附加说明之外的部分)。例如,如果显示在“Google 新闻”中的名称是“示例时报(订阅)”,则应该使用名称“示例时报”。<language> 是出版物所用的语言。语言应该是 ISO 639 语言代码(2 个或 3 个字母)。例外情况:就中文而言,简体中文请使用 zh-cn,繁体中文请使用 zh-tw。
<access>
如果报道不供人们公开阅读,则是必带标记;否则应该略去 可以使用的值包括“Subscription”或“Registration”,用于说明是否能阅读报道。如果“Google 新闻”的读者不注册或不订阅也可以阅读报道,则应该略去此标记。
<genres>
如果体裁适用,则必带此标记,否则可以略去 用逗号分隔的属性列表,用于指明报道内容的特点(如“PressRelease”或“UserGenerated”)。关于所有可能值的列表,请参阅 Google 新闻内容属性。内容的标注必须准确无误,以便为我们的用户提供一致的体验。
<publication_date>

报道发布日期采用 W3C 格式,即,使用“完整日期”(YYYY-MM-DD) 或“完整日期加时、分、秒”(YYYY-MM-DDThh:mm:ss) 格式,并带有可选分数和时区后缀。请确保您提供的是报道在网站上发布时的原始日期和时间,而不是报道添加到站点地图的时间。

我们的抓取工具可接受以下任意格式:
完整日期
YYYY-MM-DD(例如 1997-07-16)

完整日期加时和分
YYYY-MM-DDThh:mmTZD(例如 1997-07-16T19:20+01:00)

完整日期加时、分和秒
YYYY-MM-DDThh:mm:ssTZD(例如 1997-07-16T19:20:30+01:00)

完整日期加时、分、秒和小数位秒
YYYY-MM-DDThh:mm:ss.sTZD(例如 1997-07-16T19:20:30.45+01:00)

<title>
否,但是强烈建议 新闻报道的标题。注意:在“Google 新闻”中显示标题时,可能会因为空间不足而删减部分内容。报道的标题标记中应只包含显示在您网站上的报道标题,而不应包含作者姓名、出版物名称或出版日期。
<:keywords>
否 用逗号分隔的关键字列表,用于描述报道的主题。可从(但不限于)现有的“Google 新闻”关键字列表中摘录关键字。
<:stock_tickers>
否 公司、基金或其他作为报道主体的金融实体的证券代码(最多 5 个)的列表,以逗号分隔。主要与财经报道相关。每个证券代码都必须以其证券交易所的名称为前缀,还必须与其在 Google 财经中的条目相符。例如,“NASDAQ:AMAT”(不是“NASD:AMAT”)或“BOM:500325”(不是“BOM:RIL”)。
创建新闻站点地图时,请记住以下要点:

  •  您的新闻站点地图应只包含两天内发布的报道的网址。

  •  我们建议您在新报道发布时,使用这些报道不断地更新自己的新闻站点地图。Google 新闻抓取新闻站点地图的频率与抓取网站其他内容的频率相同。

  • Google 新闻站点地图所包含的网址不应超过 1,000 个。如果要添加更多网址,可将相应网址分成几组分别添加到多个站点地图中,然后用站点地图索引文件管理这些网址。使用站点地图协议中规定的 XML 格式。列在站点地图索引文件中的站点地图不应超过 50,000 个。这些限制条件有助于确保不会因为向 Google 新闻提供大量文件而导致您的网络服务器负荷过重。 

创建站点地图后,将其上传到包含新闻报道的最高级目录中。有关提交站点地图的进一步说明,请参阅此页

最后更新:2011-05-20 09:50:47

  上一篇:go 谷歌新闻资讯站点地图: 验证 Google 新闻站点地图
  下一篇:go 谷歌新闻资讯站点地图: 新闻站点地图概述