Shopify 站点地图初学者指南
最后更新于
最后更新于
您可能已经知道什么是站点地图。但如果你不知道,这是谷歌对站点地图的定义:
“站点地图是一个文件,您可以在其中提供有关站点上的页面、视频和其他文件以及它们之间的关系的信息。Google 等搜索引擎会读取此文件以更有效地抓取您的网站。站点地图会告诉 Google 您认为站点中哪些页面和文件很重要,并且还提供有关这些文件的有价值的信息。例如,页面上次更新的时间以及页面的任何替代语言版本。”
您需要站点地图的原因有多种。
例子:
Googlebot 通过遵循内部链接结构以及指向您网站的外部链接来抓取您的网站。如果您的商店相当新,并且没有指向它的网站链接,则 Google 可能需要一段时间才能对您的网站建立索引。
在这种情况下,拥有站点地图将告诉 Google“我的网站存在,这是我网站上的页面列表,请抓取并索引它”,从而使 Googlebot 的工作变得更加容易。
根据 Google 的说法,如果满足以下条件,站点地图可能对您的商店最有利:
你的网站真的很大。
您的网站有大量内容页面档案,这些内容页面是孤立的或彼此没有很好的链接。
您的网站是新的,几乎没有外部链接。
您的网站具有大量富媒体内容(视频、图像)或显示在 Google 新闻中。如果提供的话,Google 可以在适当的情况下将站点地图中的附加信息纳入搜索范围。
这是事实,但这并不一定意味着站点地图可能对您的商店没有好处。事实上,即使您有非常强大的链接策略或者您的网站相对较小,您的商店也绝对没有理由不拥有链接策略。
注意:站点地图有两种类型:XML 站点地图和 HTML 站点地图。您的站点地图文件格式取决于您使用的主题。在本文的范围内,我们仅介绍有关 XML 站点地图的信息。
基本的 XML 站点地图如下所示:
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″>
<url>
<loc>https://build.happypoints.io/</loc>
<changefreq>daily</changefreq>
</url>
<url>
<loc>https://build.happypoints.io/products/add-mega-menu-to-shopify-store-t50</loc>
<lastmod>2021-06-10T09:05:11+07:00</lastmod>
<changefreq>daily</changefreq>
<image:image>
<image:loc>https://cdn.shopify.com/s/files/1/0573/3744/6597/products/T50.png?v=1621911064</image:loc>
<image:title>Add mega menu to Shopify store</image:title>
<image:caption>Add mega menu to Shopify store</image:caption>
</image:image>
</url>
</urlset>
那么所有这些标签的含义是什么?让我们深入了解吧!
属性
描述
<urlset>
必需的
封装文件并引用当前的协议标准。
<url>
必需的
每个 URL 条目的父标记。其余标签是该标签的子标签。
<loc>
必需的
页面的 URL。如果您的 Web 服务器需要,此 URL 必须以协议(例如 HTTP)开头并以斜杠结尾。该值必须小于 2,048 个字符。
<lastmod>
选修的
文件的最后修改日期。该日期应采用 W3C 日期时间格式。如果需要,此格式允许您省略时间部分,并使用 YYYY-MM-DD。 请注意,此标记与服务器可以返回的 If-Modified-Since (304) 标头是分开的,搜索引擎可能会以不同的方式使用两个来源的信息。
<changefreq>
选修的
页面可能更改的频率。该值向搜索引擎提供一般信息,可能与它们抓取页面的频率不完全相关。有效值为: 始终 每小时 每天 每周每月 每年 从不值“始终”应用于描述每次访问时都会更改的文档。值“never”应用于描述已存档的 URL。 请注意,此标签的值被视为提示而不是命令。尽管搜索引擎爬虫在做出决策时可能会考虑此信息,但它们抓取标记为“每小时”的页面的频率可能会低于此,而它们抓取标记为“每年”的页面的频率可能会高于此。爬虫可能会定期爬行标记为“从不”的页面,以便它们可以处理这些页面的意外更改。
<priority>
选修的
该 URL 相对于您网站上其他 URL 的优先级。有效值范围为 0.0 到 1.0。该值不会影响您的页面与其他网站上的页面的比较方式,它只会让搜索引擎知道您认为哪些页面对爬网程序最重要。 页面的默认优先级是0.5。 请注意,您分配给页面的优先级不太可能影响您的网址在搜索引擎结果页面中的位置。搜索引擎在同一站点上的 URL 之间进行选择时可能会使用此信息,因此您可以使用此标记来增加最重要的页面出现在搜索索引中的可能性。 另请注意,为网站上的所有 URL 分配高优先级不太可能对您有帮助。由于优先级是相对的,因此它仅用于在站点上的 URL 之间进行选择。
如果您的图像以爬虫友好的方式编码,并且它们所在的页面也很容易发现和爬行,那么您确实不需要图像站点地图。
但是,如果您的页面上存在以爬虫无法看到的方式延迟加载的图像。这应该是一个很好的例子,您应该将图像标签应用于站点地图。
例如,仅当客户将鼠标悬停在按钮上时才会显示图像。
Google 机器人无法找到这些图像,因此有必要包含图像站点地图。
标签
必需的
描述
<image:image>
是的
包含有关单个图像的所有信息。每个 <url> 标签最多可包含 1,000 个 <image:image> 标签。
<image:loc>
是的
图像的 URL。 在某些情况下,图像 URL 可能与您的主站点不在同一域中。这没问题,只要两个域都在 Search Console 中得到验证即可。例如,如果您使用 Google 协作平台等内容分发网络来托管图片,请确保托管网站已在 Search Console 中经过验证。此外,请确保您的 robots.txt 文件不会禁止抓取您想要编入索引的任何内容。
<image:caption>
选修的
图像的标题。
<image:geo_location>
选修的
图像的地理位置。例如,<image:geo_location>爱尔兰利默里克</image:geo_location>。
<image:title>
选修的
图片的标题。
<image:license>
选修的
图像许可证的 URL。如果您愿意,可以使用图像元数据。
站点地图文件是自动生成的。您可以在 Shopify 商店域的根目录中找到它们,例如 johns-apparel.com/sitemap.xml。
由于您无法在 Shopify 中编辑 robots.txt 文件,因此不会从那里链接站点地图,但这确实意味着您可以将站点地图上传到 Search Console 以跟踪网址的性能并改进这些网址的抓取。
第 1 步:转到我提供的链接,提交您商店的 URL,然后单击“开始”
第 2 步:等待几分钟
第三步:点击查看站点地图详细信息
第 4 步:单击“下载 XML 站点地图”
第 1 步:将您刚刚下载的文件作为文件上传到 Shopify。
转到 Shopify 管理仪表板 -> 设置 -> 文件 -> 上传文件,然后选择您刚刚生成的站点地图
步骤 2:从新的 XML 站点地图 URL 创建重定向
从 Shopify 管理仪表板,转到在线商店>导航>URL 重定向>创建 URL 重定向
重定向自:在此字段中,您只需输入任何不存在的页面 例如:/this-page-does-not-exist
重定向到:在此字段中,您可以复制刚刚上传到 Shopify CDN 的 XML 站点地图的链接并将其粘贴到此处。
在提交站点地图之前,您需要使用 Google Search Console 验证您的域名,以确认您是 Shopify 商店的所有者
第 1 步:在您的 Google Search Console 帐户中,点击 ==,然后从下拉菜单中选择添加资源。
步骤 2:在“选择属性类型”对话框中,选择 URL 前缀,然后输入要添加为属性的域,包括 https://。
第 3 步:单击继续。
步骤 4:在验证所有权窗口中,选择 HTML 标记。或者,如果您熟悉其他验证方法,请选择您喜欢的方法。了解有关使用 TXT 记录验证所有权的更多信息。
步骤 5:突出显示完整的 HTML 标签,然后在 Mac 上使用 cmd + c 或在 PC 上使用 ctrl + c 将其复制到剪贴板。确保选择所有内容,包括 < 和 >。例如:
<meta name=”google-site-verification” content=”IV7BPLESttSpBdxSWN1s4zlr4HIcuHkGQYmE3wLG59w” />
第 6 步:从 Shopify 后台,转到在线商店 > 主题。
步骤 7:找到您要编辑的主题,然后单击操作 > 编辑代码。
第 8 步:在“布局”部分中,单击“theme.liquid”。
步骤 9:将步骤 5 中复制的元标记粘贴到起始 <head> 标记正下方的空白行中:
第 10 步:单击“保存”。
第 11 步:返回 Google Search Console 并单击“验证”。
第 1 步:您的网站经过验证后,转到 Google Search Console。
第 2 步:单击站点地图。
步骤 3:在“添加新站点地图”部分中,输入您所在域的站点地图文件名,然后单击“提交”。您的域的站点地图需要采用类似于 https://www.johns-apparel.com/sitemap.xml 的格式。如果您没有包含所有站点地图网址,那么您可能会收到来自 Google 的错误消息。
大多数情况下,此错误的发生是由于 Google Search Console 中的错误造成的。但要确保这不是 Google Search Console 的错误。首先检查以下两件事:
如果您提交的站点地图 URL 不正确,则可能会出现此错误 => 检查左侧站点地图字段中的 URL 路径是否确实显示“/sitemap.xml”,而不是页面 URL(例如“/homepage”)。如果提交错误,请重新提交。
如果站点地图 URL 和站点地图结构正确,在大多数情况下,它会在几天或几周内自行解决。但是,您可以使用检查工具提交 URL 以加快该过程。
有2种情况:
您的 XML 站点地图中缺少一些 URL。如果是这种情况,那么您需要调查 Google 报告中缺少哪些网址,并将其更新到您的 XML 站点地图。
Google 报告丢失的网站实际上位于您的 XML 站点地图内。如果是这种情况,则可能是由于 Shopify 的错误造成的。这个问题其实没有解决办法。Shopify 确实需要改变他们制作产品站点地图的方式。
您可以手动创建站点地图。但是,如果您的商店页面太多,我建议您使用此生成站点地图。
,确保您的 XML 站点地图具有正确的格式