云测速许久没有登陆百度搜索资源平台了,今天本想打开看看索引数据以及sitemap收录情况,结果打开普通收录--sitemap的时候,出现了下图的情况,显示索引型不予处理。这就尴尬了。
那么,什么是索引型sitemap文件,其实就是xml文档嵌套xml文档。对于WordPress网站来说,如果安装的是Google XML Sitemaps、All in One SEO等插件,那么生成XML的网站地图就是索引结构类型的文件。
索引型不予处理,那岂不是后面只能一条一条的提交了哦。最近百度说取消对索引型sitemap的支持就取消,说翻脸就翻脸,这就是百度。
云测速整理了下讯息,发现百度发布公告称,为提升对sitemap文件的处理效率,即日起普通收录和死链提交工具均不再支持索引型sitemap文件。对于已提交的文件也将不予处理,且会占用相应工具的配额,需要及时删除此类索引型xml文件。下面是百度官方的话:
文件地址格式为txt或xml,每个地址文件最多包含50,000个网址且需小于10MB。
如果验证了网站的主域,那么sitemap文件中可包含该网站主域下的所有网址。
请勿提交索引型sitemap,索引型不予处理且子文件会占用配额,如若提交请主动删除。
那么,应该如何解决呢?其实解决方法很简单:
我们发现插件生成的Sitemap满足前面的两个条件,但百度又来了新花样,即“索引型”Sitemap。之所以生成索引型Sitemap,难道不是为了更好地对网站URL进行归类,方便的不是搜索引擎吗?
与其去思考百度的逻辑,还不如思考如何解决这个问题。
百度不处理索引型Sitemap,难道通过插件生成一堆Sitemap地址?自不可取,其实稍微变通一下即可解决这个问题。
我们都知道很多Sitemap插件生成的Sitemap都是索引型Sitemap,即一个Sitemap文件里面包含多个子Sitemap,这样做的主要目的是:
- 避免单个Sitemap文件包含超过50000个网站,又或者体积超过10MB,这样的Sitemap百度是不会处理的;
- 过大的Sitemap文件也读取性能也会差很多,不利于搜索引擎蜘蛛爬取;
- 将所有类型的URL纳入一个Sitemap文件,也不合适。
从上述,我们可以知道现在生成的Sitemap文件属于索引型Sitemap,也就是说里面包含多个子Sitemap。既然百度不允许提交索引型Sitemap(即主Sitemap),那么我们可以在浏览器中打开主Sitemap链接(一般是yourdomain.com/Sitemap.xml)
然后你需要做的是,复制上述子Sitemap文件的10个的URL地址(注:每天仅可提交10条),粘贴到百度搜索资源平台Sitemap提交的地方(即百度搜索资源平台-普通收录-资源提交-Sitemap),然后提交。
然后,你会发现Sitemap地址的状态变为“等待”,再过一段时间去刷新,百度搜索资源平台即完成Sitemap地址的URL检测,效率貌似比之前快得多了。
这样,我们遇到的问题就算大致解决了。