Google 发布的以图生图工具 Whisk
Google 推出图片生成工具 Whisk,基于 DeepMind、Gemini 和 Imagen 3 技术,通过组合三张图片(主体、场景、风格)生成新图,支持高分辨率和多种艺术风格。 2025-1-23 00:0:0 Author: blog.einverne.info(查看原文) 阅读量:4 收藏

之前介绍过 Google 发布的在线笔记 NotebookLM ,也介绍过 Google 发布的知识学习 Learn About ,Google 虽然在 AI 上落后了 OpenAI 一节,但是内部的各个团队一直都在探索 AI 的不同能力。今天要介绍的就是 Google 刚推出的图片生成工具 Whisk,Whisk 和其他图片生成模型 [[DALL E3]]、 [[Stable Diffusion]] 、[[Midjourney]] 有所不同,抛弃了通过文字生成图片的模式,而是通过图片和图片组合,合成来生成新的图片。

Xf-clsZSAu

Google Imagen 3

谷歌推出的 Whisk 融合了 DeepMind 的生成式 AI 技术、Gemini 的多模态能力和 Imagen 3 的文本到图像生成功能,打造出一个非常有意思的图片到图片生成 AI。

Imagen 3 是 Google 最新推出的人工智能图像生成工具,Imagen 3 可以生成极高质量的图片

  • 细节更丰富
  • 最高可生成 1024 * 1024 的高分辨率图片
  • 在多种风格中表现出色,从超写实到印象派风格都能呈现
  • 多模态,除文本外,可接受草图等多种输入

使用

Whisk 会组合三张图片,分别是 Subject(主体),Scene(场景),Style(风格),然后根据三个图片以及文字描述来生成最终的图片。


文章来源: https://blog.einverne.info/post/2025/01/google-ai-whisk.html
如有侵权请联系:admin#unsafe.sh