标签: AI编辑照片

Google推出Gemini Omni多模态模型:图像、音频与文本均可生成视频,并支持自然语言编辑照片

Google’s Gemini Omni turns images, audio, and text into video — and that’s just the start

Google在I/O开发者大会上发布Gemini Omni多模态模型家族,支持从图像、音频、视频和文本生成一致的高质量视频,并能通过自然语言指令编辑照片。该模型结合Gemini的推理能力与媒体模型渲染能力,被视为AI从预测文本走向模拟现实的下一步。用户还可使用数字形象创建视频,防止深度伪造需经过验证流程。