SEO 谷歌

谷歌索引脚本

48小时内让您的网站在谷歌上建立索引的脚本。

2024年2月2日
indexed-pages
分享

似乎在 2022 年到 2023 年之间,谷歌改变了他们索引新页面的方式。过去,如果网站发布一个新页面,并有足够的内部链接指向它,它就会在几天内被发现并建立索引。

但情况似乎不再是这样了,至少有网站观察到不是这样。

谷歌现在只会在以下情况下索引新页面:

  1. 页面有指向他们的反向链接;
  2. 网站所有者通过 Google Search Console 将页面编入索引;

如果你考虑一下每天发布的新页面的数量,这实际上是有道理的,特别是现在有无数的服务使用人工智能自动编写内容。

手动请求索引大约需要 1 分钟,因此提交少量页面并不那么耗时。

您可以这样做:

  1. 打开 Google 搜索控制台
  2. 输入要请求索引的URL
  3. 稍等一下,然后单击Request Indexing
  4. 等待 24-48 小时即可在 Google 上看到它
  5. 就这么简单!🎉
manual-index-request

批量索引怎么做?

可能每天或者每周都有一些页面想要索引,手动完成非常枯燥,而且要占用大量的时间。手动请求索引不是一个可扩展的解决方案

如果您从事 SEO 领域的工作,您一定已经看到市场上充斥着 SaaS 平台,这些平台承诺在数小时内为您的页面建立索引。

其中大多数都是按月订阅模式的付费服务——真是令人惊讶!如果该服务可以不断为业务增加价值那么也可以接受。但这里的情况并非如此,只需要偶尔提交几页。

Google Search Console 提供了Indexing API。令人惊讶的是,该 API 是免费的、有文档记录并得到 Google 的官方支持。

好吧,那么有什么问题吗?

首先你必须记住这一点Indexing != Ranking。仅仅因为您的网页被编入索引并不意味着您会从 Google 获得任何流量。使用 Indexing API 并不会真正给您带来不公平的优势,您仍然需要付出努力来对您的页面进行排名。

但无论如何,这是官方文档中的重要引用:

目前,Indexing API 只能用于抓取包含嵌入了JobPostingBroadcastEventVideoObject的页面。对于有许多较短生存期的页面(例如职位发布或直播视频)的网站,索引 API 可以使搜索结果中的内容保持新鲜,因为它允许单独推送更新。

简而言之,该 API 旨在供求职板和活动平台使用,据说是因为由于其业务性质,他们必须添加/删除大量页面。

但正如 Twitter 上数百名网站所有者(包括我自己)所报告的那样,它适用于任何页面,无论是职位发布还是活动页面。它甚至不需要有Schema标记。

目前还不清楚这是否是一个错误或者文档是否已过时,但事实是它有效,而且效果非常好!下个月或明年会起作用吗?没有人知道,但就目前而言,这是一个很好的解决方案,据我所知,它至少自 2022 年以来一直有效。

这是一个网站的示例,大约有 35 个页面。所有页面都在站点地图上,并且每个页面都有一堆内部链接。直到上周,我什么也没做的情况下,其中只有 3 个页面被谷歌索引。

使用上述 API 后,谷歌在不到 48 小时内就为所有页面建立了索引 🤯

indexed-pages

谷歌索引脚本

所有内容已经打包到一个简单的脚本中,您可以使用它来索引整个网站。该脚本是免费且开源的,因此您也可以对其进行修改以满足您的需求。它可以在 GitHub 上获取:goenning/google-indexing-script

您可以在README文件中找到有关如何使用它的说明。这非常简单,特别是如果您熟悉 Node.js 和 JavaScript。

以下是该脚本功能的简单说明:

使用站点地图查找所有站点页面。
对于每个页面,检查它是否已编入索引或者之前是否已请求。
{
  ✅ 如果是,请跳过。我们不想向 Google 发送垃圾邮件。
  ❌ 如果没有,请求索引。
}

要求

准备

  1. 下载或克隆仓库
  2. 请遵循 Google 的指南。最后,您应该在 Google Cloud 上拥有一个启用了 Indexing API 的项目,以及一个您拥有Owner权限的网站
  3. 确保在Google Project ➤ API Services ➤ Enabled API & Services上启用Google Search Console APIWeb Search Indexing API
  4. 下载包含服务帐户凭据的JSON文件,并将其保存在与脚本相同的文件夹中。该文件应该命名为service_account.json

用法

  1. 打开终端并导航到克隆仓库的文件夹
  2. 确保您使用的是最新的 Node.js 版本,优先选择 v20 或更高版本。使用node -v检查您当前的版本
  3. 运行npm install以安装依赖项
  4. 运行npm run index <domain or url>以索引您网站的所有页面
  • 如果您的网站在GSC上是Domain模式,那么像npm run index seogets.com这样运行它
  • 否则,如果它是一个URL Prefix模式,那么像npm run index https://seogets.com这样运行它
  • 如有疑问,可以两个都试试😀

下面是一个例子。共找到 82 个页面,79 个已建立索引,1 个不需要建立索引,2 个需要建立索引。

google-indexing-script-3

就是这样!

来自:

更多文章

一款开源的手绘风格的虚拟白板,支持协作和端到端加密。

2024年2月1日 · 白板
llm
通过从零开始构建大语言模型 (LLM),了解如何创建、训练和微调大语言模型 (LLM)!
2024年1月31日 · LLM 书籍
umiocr-2
免费、开源、可批量的离线OCR软件。
2024年1月30日 · OCR 文字识别
zed
Zed是一款高性能、多人代码编辑器,由Atom和Tree-sitter的创建者开发。它也是开源的。
2024年1月29日 · 代码编辑器