Google 发布了「他们规模最大、能力最强的 AI 模型」 Gemini

Gemini 是 Google 今天发布的一个多模态的 AI 模型，它能够归纳并流畅地理解、操作处理包括文本、代码、音频、图像和视频在内的信息。另外，Gemini 的最小版本。Nano 可以直接部署在手机上。@Appinn

先不要去研究它是怎么实现的，也不需要去搞清楚如何训练的，看了下面这段视频之后，我有一种预感，著名电影《钢铁侠》里的贾维斯，真的可以在没多久后的未来，进入千家万户。

先来看视频吧：

视频来自 @宝玉

我不知道该怎么样描述这样一个我们正在经历的时代，从 ChatGPT 出现到现在，也才过了仅仅 1 年的时间。我们与机器的交流已经可以流畅到如此地步了么？这台机器，可能还掌握了人类有史以来的全部知识。

目前的英文版 Bard 已经可以使用 Gemini Pro 了，而未来几个月 Gemini Nano 就将直接内置在手机（Pixel 8 Pro）中，就有一种未来已经来到的感觉。最强的 Gemini Ultra 将在明年部署到 Bard 中。

在向公众推出之前，我们对 Gemini Pro 进行了多项行业标准基准测试。在八项基准测试中的六项中，Gemini Pro 的表现优于 GPT-3.5，包括在 MMLU（大规模多任务语言理解）（衡量大型 AI 模型的主要领先标准之一）和 GSM8K（衡量小学数学推理）方面。

Gemini 也在官网放出了和 GPT-4 的性能对比，从数据上对比，Gemini 要比 GPT-4 厉害。这可能会让2024年更有趣，比如 OpenAI 是不是真的要推出 GPT-5。

不知道在2025年，AI 能否拥有属于自己的记忆，会不会产生情感？我不知道，魔幻的世界已经不再魔幻了。

参考链接：