DDIM之父宋佳铭(Jiaming Song)近日在领英上宣布从Luma AI离职。DDIM(Denoising Diffusion Implicit Models)是扩散模型领域核心加速采样技术,被Stable Diffusion、DALL-E、Midjourney等主流图像生成工具采用。宋佳铭离职时,Luma AI正凭借Dream Machine、Uni-1.1等产品跻身全球多模态第一梯队。
宋佳铭1994年出生,2016年获清华大学计算机系学士学位,毕业时获得Outstanding Honor(排名前1%)。在清华期间,他曾与教授朱军、杜克大学教授Lawrence Carin合作。
随后他在斯坦福大学攻读博士学位,师从Stefano Ermon,主攻生成模型、概率建模与计算机视觉。博士期间,他先后在旷视科技(2016)、OpenAI(2017)和Meta FAIR(2018)担任研究实习生。
2021年至2022年,他在斯坦福大学从事博士后研究,同时参与英伟达的“Picasso”人工智能基础研究项目。2023年,他离开英伟达高级研究科学家岗位,加入初创企业Luma AI,担任首席科学家。
DDIM技术奠基与Luma AI的三年转向
任何基于扩散模型的图像生成工具都离不开DDIM带来的采样加速。宋佳铭2020年以第一作者提出的DDIM,与DDPM共同奠定了扩散模型在图像生成领域的理论基础,直接影响Stable Diffusion、DALL-E、Midjourney等产品的技术路线。除DDIM外,他还参与了SDEdit等早期扩散模型工作。宋佳铭被视为扩散模型落地的开创者之一。
在Luma AI的三年,宋佳铭经历了公司从3D生成到视频生成再到多模态基础模型的三次关键技术转向。他在领英动态中表示,参与推动了几次关键技术转向:从3D生成到视频生成,再到多模态基础模型。
具体而言:2023年AI 3D生成赛道全面爆发,行业争相探索NeRF、文生3D技术落地方案,Luma AI凭借Genie系列模型站稳脚跟。2024年文生视频成为风口,OpenAI Sora带动竞赛,Luma AI推出Dream Machine,以画面一致性和电影级运镜出圈。2025年至今单一模态逐渐遇顶,多模态与AI世界模型成为新叙事,Luma AI快速迭代Uni-1.1多模态模型。Luma的转型轨迹几乎就是AI生成赛道过去三年的缩影。
宋佳铭加入Luma AI的节点,正是其从3D生成向多模态基础模型加速转型之时。彼时Luma AI刚完成a16z领投的B轮融资,一边发布Genie 1.0继续押注文生3D,一边将融资用于基础模型算力、数据和团队扩张。他回忆,在Luma能与出色的研究者一起工作,并搭建了一些很多人原本认为不可能由这样规模公司完成的系统。近三年后,他决定离开。
目前宋佳铭的LinkedIn职业信息已更新为“已于本月离职”,尚未标注新任职公司或创业计划,下一步去向暂未公开。
本文参考来源:量子位



