谷歌一直在积极提升 Gemini 的图像生成能力。继推出可在网页上进行原生 AI 编辑的 AI Studio 之后,谷歌现在也将其中的一些功能扩展到了移动端的 Gemini 应用。这项扩展功能将允许用户向聊天机器人上传图片,并通过自然语言指令进行编辑。

谷歌的 AI Studio 可通过 Gemini 网页界面访问,采用的是 Gemini 2.0 Flash 模型。它的优势在于能够理解上下文并处理复杂的文本提示,从而实现图像生成与编辑,无需传统的编辑工具或专业技能。而现在,谷歌正将类似的图像编辑功能推送到 Gemini 移动端应用中。
在 Gemini 应用中直接编辑你的图片
借助此次更新,用户可以直接在 Gemini 应用中上传 AI 生成的图片或原始照片,并通过文本指令进行编辑。用户对每张图片的编辑次数没有限制。谷歌表示,这项工具特别适用于更换背景、调整风格,以及添加、移除或修改图像中的特定元素等操作。

应用内的图像编辑功能采用了多步骤处理的设计,允许用户反复细化自己的编辑内容。你可以从初始提示开始,逐步扩展,甚至有可能创作出类似图画书的视觉叙事作品。此外,谷歌表示,文本提示将带来“更直观且更具上下文理解”的编辑效果。编辑后的图像还会包含 SynthID 水印,类似于标准的 Gemini 生成图像。
与目前仅支持 Gemini 2.0 Flash 模型的 AI Studio 不同,使用新版应用内图像编辑功能时,用户可以选择任意可用的 Gemini 模型。因此,Android 版本的普通用户在功能上线后也将能免费使用这一功能,这可能让 Gemini 在与 OpenAI 的 ChatGPT 等聊天机器人和 AI 平台的竞争中占据一定优势。
该功能目前正逐步推送,谷歌预计将在未来几周内在大多数国家和 45 种语言中上线。
你认为这项原生的 Gemini 图像编辑功能对于不熟悉 Photoshop 和 Lightroom 等专业图像编辑软件的用户来说,会是一项有价值的工具吗?欢迎在评论区分享你的看法。