谷歌和 OpenAI 之间的 AI 竞赛持续加剧。虽然后者在几个月前发布了 GPT-4,但谷歌在 2023 年 5 月的 Google IO 大会上展示了其“多模态系统”:Gemini。通常与双子座星座或阿波罗之前的第二次太空飞行相关,在谷歌的设计中,它代表“通用多模式智能网络”。
我们对双子座了解多少?
据报道,谷歌已向多家公司提供其 Gemini 系统早期版本的访问权限。关于这个“多式联运系统”已过滤内容的概述。
“想象一下,如果语言模型绿巨人和托尼·斯塔克的人工智能贾维斯生了一个孩子……繁荣!”双子座说。 “在互联网上,科技迷们对谷歌的生成式人工智能系统赞不绝口,其中有许多或多或少令人愉快的流行文化参考。
但 Gemini 的多式联运模式是如何运作的呢?它的特殊性是什么?它在首映之前就值得所有最高级的评价吗?
之前的 ChatGPT 宁愿让我们相信一个细微差别会更合适:如果 OpenAI 的生成模型在 2023 年 1 月超过 1 亿用户,那么它的访问量在 5 月份停滞不前,然后在 6 月份开始下降。而且,OpenAI模型并非没有风险,甚至出现了一些倒退的迹象。
据这家位于山景城的公司称,Gemini 的设计目标是“多模式、高效的工具和 API 集成”。预计它将“实现内存和调度等未来的创新”。
双子座发展
为了开发这个庞大的模型,Gemini 特别依赖于 Alphabet 通过 YouTube、Google 图书、Google 搜索和 Google Scholar 等平台收集的数据的广度和深度。它还使用名为 TPUv5 的最先进的训练芯片,据称这是世界上唯一能够协调 16,384 个芯片协同工作的芯片。谷歌团队还使用类似于开发 AlphaGo 的方法来训练模型,AlphaGo 是一种比国际象棋更复杂的游戏。此外,与 LaMDA(Google 通过监督学习训练的大型会话语言模型)不同,Gemini 是通过 GPT-3 和 GPT-4 等强化学习进行训练的。这种机器学习技术涉及人工智能代理在动态环境中通过反复试验来学习执行任务。
据 The Information 报道,谷歌 Brain和 DeepMind 团队的几位前成员目前正在致力于该项目,其中包括谷歌联合创始人谢尔盖·布林 (Sergey Brin)。此外,根据同一消息来源,谷歌可能会引入 Gemini 作为 Google Bard 的更新,或者在使用 Gemini 为 Google Docs 等各种产品提供支持之前创建一个新的聊天机器人。 Gemini 可能很快就会发布,可能是为了响应 OpenAI 即将于 2024 年初发布的 GPT-5 之前的 GPT-4.5 版本。谷歌表示,“经过改进和严格的安全测试后,Gemini 将提供多种尺寸和容量,类似于 PaLM 2”,但没有提供更多细节。
可能缩短用户旅程
目前,谷歌SGE(谷歌人工智能增强搜索体验)正在约一百个国家进行测试。这个版本的谷歌提供人工智能生成的文本、提要和对话模块。对于某些查询,该搜索引擎可能会减少用户查询的数量。根据 Exposure Ninja 的一个例子,搜索有关搬家程序的“房地产律师”信息的用户可能只会访问该网站四次,而传统搜索则为八次。
通过 Exposure Ninja 进行用户搜索
来源:来源曝光ninja
如果 Gemini 最终与 SGE 整合会发生什么? Exposure Ninja 创始人蒂姆·卡梅伦-基钦 (Tim Cameron-Kitchen) 警告说:“将 Gemini 回复分发给 SGE 的相关成本最初意味着 Google 不太热衷于提供基于 Gemini 的 SGE 结果,除非有必要。”
如果在 SGE 中实施 Gemini,系统预测用户假定需求的多模式能力可以进一步缩短搜索阶段。使用Gemini可以在搜索结果中为用户后续的问题提供直接的答案。据 Exposure Ninja 称,在前面的示例中,这可能会创建一个仅需要访问三个站点的搜索旅程。
用户搜索意图
来源:来源曝光ninja
Tim Cameron-Kitchen 表示,在 SGE 中使用 Gemini 还可以带来“更少的重复、更好的结构化响应(逻辑上遵循搜索路径)以及更好的多模式功能集成。”值得注意的是,对于这位数字营销专家来说,网站访问量的潜在减少可能会被以下事实所抵消:链接仍然存在于生成的响应中,并且人们仍然通过 Google 购买网站。
Gemini 的潜在用途
Gemini 有潜力用于各种应用,包括:
聊天机器人:Gemini 可用于创建更复杂、更自然的聊天机器人。基于 Gemini 的聊天机器人可用于客户服务、回答问题,甚至进行对话。
文本摘要:Gemini 可用于生成更准确、简洁的文本摘要。 Gemini 支持的文本摘要可用于帮助人们理解长文章或文档。
创意内容生成器:Gemini 可用于生成创意内容,例如诗歌、脚本或音乐。由 Gemini 提供支持的创意内容生成器可用于创造新的艺术或娱乐形式。
机器学习应用:Gemini 可用于提高机器学习应用的性能。 Gemini 可用于训练更准确、更高效的机器学习模型。
我们如何使用 Google Gemini AI
Google Alphabet 首席执行官 Sundar Pichai 在 2023 年 Google I/O 大会上强调了在使生成式 AI 更加用户友好方面取得的进展。这些进步包括 PaLM 2 和 Gemini。 DeepMind 的 Gemini 专门设计为多模式,使其能够理解不同类型的数据,例如文本、图像和代码。这种多功能性使其能够在多项任务中表现出色:
生成不同类型的文本、翻译语言并创建各种创意内容。
处理图表和地图等数据格式。
利用对文本和代码数据集进行广泛培训的庞大知识库。
促进新产品和服务的创造。
分析数据并识别模式。
回答复杂或非常规的问题。
虽然 Gemini 的多模式处理能力仍在开发中,但它有可能彻底改变人机交互。其应用范围广泛,从创建更现实、更有吸引力的虚拟助手到创新的教育工具,以及增加我们对世界的理解。有关 Google Gemini AI 的更多信息,包括其工作原理、突出功能等,请继续阅读。
双子座如何工作?
Gemini 作为一个多模态人工智能系统,能够处理文本、图像和代码等各种类型的数据。它利用大量文本和代码数据集的广泛训练,使其能够理解和生成这些不同形式的信息。
Gemini 的核心是使用 DeepMind 开发的 巴哈马电话号码资源 先进算法和模型来理解和解释多种格式的数据。通过对不同数据集的训练,Gemini 学习数据中的模式、结构和关系,使其能够执行生成文本、处理图表和地图等视觉信息以及分析复杂数据集等任务。
其多模式功能使 Gemini 能够同时处理不同类型的信息,从而促进涉及多种格式或数据源的任务。这种多功能性使 Gemini 成为一种潜在的变革性工具,能够彻底改变我们与计算机交互和处理各个领域信息的方式。

培训和连接
对于 SEO 专业人士来说,充分利用双子座的潜力可能至关重要。 Gstarseo 的 SEO 顾问 Giulio Stella 表示:“如果 DeepMind 的承诺成为现实,并且 Gemini 满足所提出的标准,它将成为每个 SEO 的必备工具。”“我们需要培训来仔细使用它来改善我们的结果。 ”值得注意的是,据 The Information 报道,开发者必须通过谷歌云服务器租赁来支付访问 Gemini 的费用。
对于SEO 专业人士来说,可以提供很多帮助,尤其是 Gemini 的连接性。 “我们可以要求它从 Google 工具加载信息,”Laurent Jean 建议。 “例如,Google Search Console、YouTube 和 Google Sheets 的组合,我们可以从中提取定位关键字的列表。我们还可以要求 Gemini 提供包含相关关键字的工作 URL 列表。我们可以让它创建排名或列表通过从 Google Sheets 和 YouTube 中绘制内容来完成它是关于利用 LLM 的能力生成用户优化的文本,同时使用 Gemini 数据和推理重新集成外部数据以进行 SEO 优化。”