AI编辑照片标签文章列表

Google推出Gemini Omni多模态模型：图像、音频与文本均可生成视频，并支持自然语言编辑照片

Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start

Google在I/O开发者大会上发布Gemini Omni多模态模型家族，支持从图像、音频、视频和文本生成一致的高质量视频，并能通过自然语言指令编辑照片。该模型结合Gemini的推理能力与媒体模型渲染能力，被视为AI从预测文本走向模拟现实的下一步。用户还可使用数字形象创建视频，防止深度伪造需经过验证流程。

阿逸
2026年5月20日