随着网络的发展,谷歌和搜索引擎优化也在不断发展。
这意味着被认为是最佳实践的往往是不断变化的。昨天可能是好的建议,今天不是这样。
对于站点地图尤其如此,站点地图几乎与SEO本身一样古老。
问题是,当每个男人和他们的狗在论坛上发布答案,在博客上发布建议并在社交媒体上发表意见时,需要时间从错误的信息中提出有价值的建议。
因此,虽然我们大多数人都普遍认为向Google Search Console提交站点地图很重要,但您可能不知道如何以推动SEO关键绩效指标(KPI)的方式实施站点地图的复杂性。
让我们清楚解决今天站点地图最佳实践的困惑。
在本文中,我们将介绍:
- 什么是XML站点地图
- XML站点地图格式
- 站点地图的类型
- XML站点地图索引优化
- XML站点地图最佳实践清单
什么是XML站点地图
简单来说,XML站点地图是您网站的URL列表。
它可以作为一个路线图,告诉搜索引擎哪些内容可用以及如何访问它。
搜索引擎将在站点地图中找到所有九个页面,只需访问XML站点地图文件。
在网站上,它必须跳过五个内部链接才能找到第9页。
对于以下网站,XML站点地图帮助抓取工具加快索引的能力尤为重要:
- 拥有数千个页面和/或深度网站架构。
- 经常添加新页面。
- 经常更改现有页面的内容。
- 受到弱内部链接和孤立页面的影响。
- 缺乏强大的外部链接配置文件。
附注:提交带有noindex URL的站点地图也可以加快去索引。如果要解除索引,可以比在Google Search Console中删除网址更有效。但请谨慎使用,并确保只将此类网址临时添加到您的站点地图中。
重点外卖
即使搜索引擎在技术上可以找到没有它的URL,但通过在XML站点地图中包含页面,您表明您认为它们是高质量的登陆页面。
虽然无法保证XML站点地图会抓取您的页面,更不用说索引或排名,提交一个肯定会增加您的机会。
XML站点地图格式
使用所有可用标签的单页网站将具有此XML站点地图:
但SEO如何使用这些标签?所有元数据都有价值吗?
Loc(aka Location)标签
此强制标记包含URL位置的绝对规范版本。
它应该准确反映您的站点协议(http或https),如果您选择包含或排除www。
对于国际网站,您也可以在这里实施hreflang处理。
通过使用xhtml:link属性指示每个URL的语言和区域变体,可以减少页面加载时间,<head>或HTTP标头中的链接元素的其他实现无法提供这些时间。
对于那些想要了解更多信息的人来说,Yoast有一篇关于hreflang 的史诗文章。
Lastmod(又名最后修改)标签
一个可选但强烈推荐的标记,用于传达文件的上次修改日期和时间。
John Mueller承认Google确实使用lastmod元数据了解页面上次更改的时间以及是否应该对其进行爬网。与Illyes 在2015年的建议相矛盾。
上次修改时间对于内容网站尤其重要,因为它可以帮助Google了解您是原始发布商。
沟通新鲜度也很强大,但只有在进行了有意义的更改后才能确保更新修改日期。
试图欺骗搜索引擎你的内容是新的,如果不是,可能会导致谷歌处罚。
Changefreq(又名变更频率)标签
曾几何时,这个可选标签暗示了URL上的内容预计会更改为搜索引擎的频率。
但是 穆勒已经表示 “改变频率并不能真正发挥站点地图的作用”,并且“直接指定时间戳要好得多”。
优先级标记
这个可选标记表面上告诉搜索引擎页面相对于其他URL的重要程度在0.0到1.0之间。
充其量只是对搜索引擎的暗示,穆勒和 Illyes都明确表示他们忽略了它。
重点外卖
您的网站需要XML站点地图,但不一定是优先级和更改频率元数据。
准确使用lastmod标记,并将注意力集中在确保提交正确的URL。
站点地图的类型
有许多不同类型的站点地图。让我们来看看你真正需要的那些。
XML站点地图索引
XML站点地图有一些限制:
- 最多50,000个网址。
- 未压缩的文件大小限制为50MB。
可以使用gzip压缩站点地图(文件名将类似于sitemap.xml.gz)以节省服务器的带宽。但是一旦解压缩,站点地图仍然不能超过任何限制。
每当超过任一限制时,您将需要跨多个XML站点地图分割您的URL。
然后,可以将这些站点地图合并为单个XML站点地图索引文件,通常名为sitemap-index.xml。基本上,站点地图的站点地图。
对于异常大的网站,您还可以创建多个站点地图索引文件。但请注意,您无法嵌套站点地图索引文件。
要让搜索引擎轻松找到您的每个站点地图文件,您需要:
- 将您的站点地图索引提交到Google Search Console和Bing网站管理员工具。
- 在robots.txt文件中指定您的站点地图索引网址。当您欢迎他们抓取搜索引擎时,将搜索引擎直接指向您的站点地图。
您还可以通过将其ping到Google来提交站点地图。
但要注意:
谷歌不再关注“未经验证的站点地图”中的hreflang条目,Tom Anthony认为这些条目是通过ping URL提交的。
XML Image Sitemap
图像站点地图旨在改善图像内容的索引。
然而,在现代SEO中,图像嵌入在页面内容中,因此将与页面URL一起被抓取。
此外,最佳实践是利用JSON-LD schema.org/ImageObject标记向搜索引擎调用图像属性,因为它提供了比图像XML站点地图更多的属性。
因此,大多数网站都不需要XML图像站点地图。包含图像站点地图只会浪费爬网预算。
例外情况是,图像有助于推动您的业务,例如照片网站或电子商务网站从Google图片搜索获得产品页面会话。
知道图像不必与您在站点地图中提交的网站位于同一个域中。只要在Search Console中验证了CDN,您就可以使用CDN。
XML视频站点地图
与图像类似,如果视频对您的业务至关重要,请提交XML视频站点地图。
如果没有,则不需要视频站点地图。
保存嵌入视频的页面的抓取预算,确保使用JSON-LD将所有视频标记为schema.org/VideoObject。
Google新闻站点地图
只有在Google新闻中注册的网站才能使用此站点地图。
如果是,请包括过去两天发布的文章,每个站点地图最多限制1,000个网址,并在发布后立即更新新文章。
与一些在线建议相反,Google新闻站点地图不支持图片网址。
Google建议使用schema.org图片或og:image来指定Google新闻的文章缩略图。
移动Sitemap
大多数网站都不需要这样做。
为什么?因为Mueller确认移动站点地图仅适用于功能手机页面。不适用于智能手机兼容性。
因此,除非您拥有专门为特色手机设计的唯一网址,否则移动网站地图将无益。
HTML站点地图
XML站点地图可以满足搜索引擎的需求。HTML站点地图旨在帮助人类用户查找内容。
问题是,如果您有良好的用户体验和精心设计的内部链接,您是否需要HTML站点地图?
在Google Analytics中查看HTML站点地图的网页浏览量。机会是,它非常低。如果没有,这表明您需要改进网站导航。
HTML站点地图通常在网站页脚中链接。从您网站的每个页面获取链接资产。
问你自己。这是链接资产的最佳用途吗?或者您是否包含HTML站点地图作为遗留网站最佳实践的点头?
如果很少有人使用它。搜索引擎不需要它,因为你有强大的内部链接和XML站点地图。该HTML站点地图是否有理由存在?我会说不
动态XML站点地图
使用Screaming Frog等工具可以轻松创建静态站点地图。
问题是,只要您创建或删除页面,您的站点地图就会过时。如果您修改页面的内容,站点地图将不会自动更新lastmod标记。
因此,除非您喜欢为每次更改手动创建和上传站点地图,否则最好避免使用静态站点地图。
另一方面,动态XML站点地图由服务器自动更新,以反映相关网站发生的变化。
要创建动态XML站点地图:
- 请您的开发人员编写自定义脚本代码,确保提供明确的规范
- 使用动态站点地图生成器工具
- 为您的CMS安装一个插件,例如WordPress的Yoast SEO插件
重点外卖
动态XML站点地图和站点地图索引是现代最佳实践。移动和HTML站点地图不是。
仅当改进了这些内容类型的索引编制驱动您的KPI时,才使用图片,视频和Google新闻站点地图。
XML站点地图索引优化
现在是有趣的部分。如何使用XML站点地图来推动SEO KPI。
仅在XML站点地图中包含SEO相关页面
XML站点地图是您建议要抓取的页面列表,不一定是您网站的每个页面。
搜索蜘蛛到达您的网站时会收到一个“余量”,表示它将抓取多少页面。
XML站点地图表明您认为包含的URL比未阻止但不在站点地图中的URL更重要。
您正在使用它来告诉搜索引擎“如果您特别关注这些网址,我会非常感激。”
从本质上讲,它可以帮助您有效地使用爬网预算。
通过仅包含SEO相关页面,您可以帮助搜索引擎更智能地抓取您的网站,以获得更好的索引编制的好处。
你应该排除:
- 非规范页面。
- 重复的页面。
- 分页。
- 基于参数或会话ID的URL。
- 网站搜索结果页面。
- 回复评论网址。
- 通过电子邮件URL分享。
- 通过过滤创建的URL对于SEO是不必要的。
- 存档页面。
- 任何重定向(3xx),丢失页面(4xx)或服务器错误页面(5xx)。
- 由robots.txt阻止的页面。
- 没有索引的页面。
- 可以通过潜在客户表单访问的资源页面(例如,白皮书PDF)。
- 实用程序页面对用户有用,但不打算作为登录页面(登录页面,联系我们,隐私政策,帐户页面等)。
我想与Michael Cottam分享一个关于优先页面的例子:
假设您的网站有1,000页。这1,000页中的475页是SEO相关内容。您在XML站点地图中突出显示了这475个页面,实质上是要求Google对其余内容进行优先级排序。
现在,让我们说谷歌抓取那475页,并在算法上决定175是“A”级,200是“B +”,100“B”或“B-”。这是一个很强的平均成绩,可能表示一个高质量的网站,可以发送给用户。
与通过XML站点地图提交所有1,000个页面相反。现在,Google会查看您所说的与SEO相关的内容的1,000个页面,并且超过50%的页面是“D”或“F”页面。你的平均成绩不再那么好了,这可能会损害你的有机课程。
但请记住,Google将仅使用您的XML提交作为您网站上重要内容的线索。
仅仅因为它不在您的XML站点地图中并不一定意味着Google不会将这些页面编入索引。
在SEO方面,整体网站质量是一个关键因素。
做网站:搜索以查看Google已编入索引的所有网页。
一旦找到低质量的页面,花时间来修复它们。这不仅对搜索引擎更好,更重要的是提供更好的用户体验。
重点外卖
通过将XML站点地图URL限制为SEO相关页面并减少网站上的低质量页面来管理爬网预算。
通过Google Search Console中的抓取统计信息跟踪优化的影响。
完全利用站点地图报告
虽然Google Search Console站点地图报告对于发现警告和错误很有用(特别是使用新的索引覆盖率报告),但您可以做的不仅仅是简单验证。
如何使站点地图索引数据可操作?
想象一下,你有一个拥有131,000个SEO相关页面的网站。
由于大小,您需要多个站点地图。
无论谷歌和Schema.org显示例子令人鼓舞编号命名。
所以你可能最终得到了这样的东西:
不是最有洞察力的命名约定。
知道整个网站有64%的网页编入索引并不是特别有用。
您需要发现哪些类型的页面被遗漏了。
问题是,如果您尝试深入了解,顺序站点地图名称不会指示您的网站的哪个部分遇到索引问题。
在sitemap-3中发现所有类型的页面非常耗时。
而是使用反映您的网站结构的描述性站点地图名称。
通过在明确命名的站点地图中对不同类型的页面进行分组,您将人们的产品页面隔离为主要索引问题。
但文章页面也表现不佳。
要了解原因,请根据其他维度将文章站点地图拆分为较小的站点地图。
现在我们已经明确了与健康相关的文章,这些文章在索引方面表现不佳。
站点地图应该是互斥的 – 每个URL只存在于一个站点地图中。否则,它会使分析更加困难,您可能会看到比提交的页面更多的索引页面
重点外卖
除了识别警告和错误之外,您还可以使用XML站点地图作为一种调查工具,通过描述性地命名站点地图来反映您的网站架构,从而隔离索引问题。
站点地图不再被分割,因为它们达到了50,000个网址限制。它们被分组以提供关于页面索引(或缺少索引)的可操作的见解。
XML Sitemap最佳实践清单
投入时间:
✓在XML站点地图中包含hreflang标记
✓包括<loc>和<lastmod>标签
✓使用gzip压缩站点地图文件
✓使用站点地图索引文件
✓仅在索引编制推动您的KPI时才使用图片,视频和Google新闻站点地图
✓动态生成XML站点地图
✓参考robots.txt中的站点地图索引URL
✓将站点地图索引提交给Google Search Console和Bing网站管理员工具
✓仅在XML站点地图中包含SEO相关页面
✓修复所有站点地图错误和警告
✓根据页面类型将描述性命名的站点地图中的URL分组
✓从GSC下载站点地图数据以分析指数化率
✓确保URL仅包含在单个站点地图中
现在,去检查自己的站点地图,确保你做得对。