Gemini 是 Google 今天发布的一个多模态的 AI 模型,它能够归纳并流畅地理解、操作处理包括文本、代码、音频、图像和视频在内的信息。另外,Gemini 的最小版本。Nano 可以直接部署在手机上。@Appinn
先不要去研究它是怎么实现的,也不需要去搞清楚如何训练的,看了下面这段视频之后,我有一种预感,著名电影《钢铁侠》里的贾维斯,真的可以在没多久后的未来,进入千家万户。
先来看视频吧:
视频来自 @宝玉
我不知道该怎么样描述这样一个我们正在经历的时代,从 ChatGPT 出现到现在,也才过了仅仅 1 年的时间。我们与机器的交流已经可以流畅到如此地步了么?这台机器,可能还掌握了人类有史以来的全部知识。
目前的英文版 Bard 已经可以使用 Gemini Pro 了,而未来几个月 Gemini Nano 就将直接内置在手机(Pixel 8 Pro)中,就有一种未来已经来到的感觉。最强的 Gemini Ultra 将在明年部署到 Bard 中。
在向公众推出之前,我们对 Gemini Pro 进行了多项行业标准基准测试。在八项基准测试中的六项中,Gemini Pro 的表现优于 GPT-3.5,包括在 MMLU(大规模多任务语言理解)(衡量大型 AI 模型的主要领先标准之一)和 GSM8K(衡量小学数学推理)方面。
Gemini 也在官网放出了和 GPT-4 的性能对比,从数据上对比,Gemini 要比 GPT-4 厉害。这可能会让2024年更有趣,比如 OpenAI 是不是真的要推出 GPT-5。
不知道在2025年,AI 能否拥有属于自己的记忆,会不会产生情感?我不知道,魔幻的世界已经不再魔幻了。
参考链接:
- Gemini 简介:我们最大、能力最强的人工智能模型(英文)
- 支持下一代人工智能工作负载: 发布 TPU v5p 和人工智能超级计算机(英文)
- Gemini 官网(DeepMind)