谷歌的 Gemini 在 2025 年继续强势扩展,推出了越来越多的模型和多模态集成功能。其中包括上个月率先向高级用户推出的 Gemini Live 摄像头与屏幕共享功能。现在,谷歌已确认,这项先进功能将通过 Gemini 免费版向更广泛用户开放。

根据谷歌在 X(原推特)上的公告,Gemini Live 的摄像头与屏幕共享功能现已扩展至无需订阅 Gemini Advanced 的用户。这意味着,使用此功能不再需要 One AI 高级套餐。
Gemini Live 能“看懂”它所看到的内容
Gemini Live 功能基于 Project Astra 模型,该模型专为视觉上下文理解和更拟人化的交互方式而设计。在使用该功能时,你可以共享手机屏幕或通过设备摄像头提供实时画面。随后,你可以通过语音与 Gemini Live 互动,提问内容包括识别物体、理解屏幕上的内容等实时信息。
摄像头画面共享功能就像一个具备物体与文字识别能力的视觉助手,可用于识别环境、解答数学题等实际场景。同时,屏幕共享功能则与 Gemini 现有的“关于此图片提问”或“关于此 PDF 提问”等功能形成互补。

谷歌表示,这项功能从今天开始逐步推送,可能需要几天时间才能覆盖更多 Android 用户。值得注意的是,由于这是基于云端的 AI 功能,即便是旧款 Android 设备也能使用,无需旗舰级处理器支持。
目前尚不清楚谷歌是否会将此功能扩展至 iPhone 和 iPad 上的 Gemini 应用。不过,如果最终实现,这将成为一大优势,因为目前其他聊天机器人(如 OpenAI 的 ChatGPT)在多模态功能方面仍有局限。
就在本周,谷歌还在 Gemini 中推出了一项视频生成功能,由 Veo 2 模型驱动。该模型允许用户通过简单或详细的提示生成真实的 8 秒视频片段。不过,目前这项功能仅面向付费用户开放,但未来谷歌为免费用户提供试用版本也并非不可能。
你认为谷歌在不断扩展 Gemini 功能的方向上做得对吗?有哪些 Gemini 高级功能是你最想体验的?欢迎在评论区分享你的看法!