之前百度一直沿用《互联网新闻开放协议》和《互联网论坛收录开放协议》去进行收录,对于普通sitemap索引文件的提交比较严格,要求原创性及可读性比较高。站长们即便具有很有的新闻内容源,但由于交叉着部分社区交流性质内容,也会被百度无情拒绝。
而google的webmasters网站管理工具则更为通用,用户只需提交索引,即可对站点进行sitemap更新、robots抓取权限控制、301重定向等等,还能根据查询到热点关键词搜索和内外链接。
现在百度终于推出了新的站长平台,用以提升sitemap的数据提交效率,由站长自主提交索引,更有利于内容的收录。目前百度站长平台处于内测阶段,需要注册的用户,可通过发送邮件zhanzhang@baidu.com索要邀请码,邮件标题中须注明“百度站长平台”。
关于百度站长平台的说明:
百度站长平台是一个服务于百度网页收录的数据提交平台。通过本平台,您网站的有效数据将更容易、更快速、更全面的被百度网页收录。
在经过必要的申请、审核后,借助百度站长平台,您可以:
1. 大批量向百度推送您希望收录的数据;
2. 在一定程度上减轻抓取产生的额外负担;
3. 网页更容易被百度收录,新增和删除数据,更快被百度所知道;
4. 还可查看数据的详细统计等其它附加功能。
百度sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。
百度sitemap支持标准的XML格式sietmap文件以及文本格式的sitemap文件,如果您有多个sitemap文件,还可以使用sitemap索引文件提交。
Sitemaps 协议格式由 XML 标记组成。Sitemap 的所有数据数值应为转义过的。文件本身应为 UTF-8 编码。
Sitemap 索引文件必须:
- 以
<sitemapindex>开始标记作为开始,以</sitemapindex>结束标记作为结束。 - 每个 Sitemap 包含一个
<sitemap>条目作为 XML 父标记。 - 每个
<sitemap>父标记包含一个<loc>子标记条目。
