今日,谷歌官方正式发布了名为 Gemini 的超级 AI 大模型!这是迄今为止 Google 构建的最强大、最通用、最灵活的多态模型,能力甚至能“碾压”目前 ChatGPT 最强的 GPT-4。这也是「Google Bard」问世以来最大的一次更新。
Gemini (双子星) 是一个多模态大模型,意味着它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、图片、代码、音频、和视频,从官方发布的实测效果来看相当的震撼!
下面是一段演示视频,对 Gemini 进行了全方位的测试,从正常对话、视图能力、逻辑推理能力、语言翻译能、图像生成能力等可以看到,其实力简直逆天!
谷歌表示,Gemini 1.0 经过训练,可以同时识别并理解文本、图像、音频等多种形式的信息,因此它能更好地理解那些细微差别的信息,并回答与复杂主题相关的问题。尤其在解释数学和物理等复杂科目中的推理方面,它表现得尤为出色!
其中,视频演示是基于 Gemini Ultra 的,但目前 Google 还在测试阶段,未对公众开放。而集成到 Google Bard 上的将会是 Gemini Pro,能力大概是 ChatGPT 3.5 的水平。而 Gemini Nano 则更加有趣,它专为小型设备设计,是一款可运行在手机上的 AI 大模型!未来将会集成在 Google Pixel 手机系列里面。
根据谷歌公布的基准测试结果来看,Gemini 在与 OpenAI 的 ChatGPT 的 GPT-4 模型对比时展现出了非常强大的性能。除了 HellaSwag 数据集外,Gemini 在其他基准测试中都全面领先 GPT-4。
在 32 个广泛使用的学术基准测试中,Gemini Ultra 有30个超过了当前最领先水平,更令人惊叹的是,在 MMLU(大规模多任务语言理解)测试中,Gemini Ultra 以 90.0% 的分数成为第一个超过人类专家的模型(这个测试结合了数学、物理、历史、法律、医学和伦理等 57 个科目)。
同时,在 MMMU 基准测试中,Gemini 也取得了 59.4% 的分数,这个测试涵盖了多领域的多模态任务,需要仔细推理。相比之前的 AI 只凭第一印象去回答问题,Gemini 会有明显的思考,得分表现也有了明显的提升。
总的来说,根据上面的视频测试看了,Gemini 确实非常强大!只希望这个能力不是播片效果,实装之后能给人工智能业界带来新的震撼吧。
/ 关注 “异次元软件世界” 微信公众号,获取最新软件推送 /
如本文“对您有用”,欢迎随意打赏异次元,让我们坚持创作!
赞赏一杯咖啡
异次元软件世界、iPcFun.com 网站创始人。
本来名字很酷,但很无辜地被叫成小X,瞬间被萌化了。据说爱软件,爱网络,爱游戏,爱数码,爱科技,各种控,各种宅,不纠结会死星人,不折腾会死星人。此人属虚构,如有雷同,纯属被抄袭……
本文作者