GPT Image 2 凭什么这么强? 是扩散模型又迭代了一版?是把 DiT 的参数量从 7B 扩到 20B?是训了更多高质量数据? 这些答案都对,但都不够。 以下是我们与多位从业者交流后,提炼出的几个值得关注的技术方向,并尝试做出更清晰的解释。 先给结论:OpenAI 很可能已经不在“纯扩散模型”这条主赛道上了。他们已经把图像生成从“美术课”调到了“语文课”——用一个能读懂指令、能记住上下文、能 ...
就在刚刚,Stability AI发布了自家最强的模型Stable Diffusion 3.5,而且是一个全家桶,包含三个版本。 Stable Diffusion 3.5 可以满足科研人员、业务爱好者、初创公司和企业的多样化需求,其中包括: Stable Diffusion 3.5 Large:该基础模型拥有 80 亿参数,性能优于竞品模型 ...
SD3在视觉美观度、提示遵循和排版等方面表现出色。 上个月,Stability AI 发布了其第三代文生图大模型 Stable Diffusion 3。该模型展现出了超越现有文本到图像生成系统的强大性能,为文本到图像生成技术带来了重大突破。 今天,Stability AI 终于发布了 Stable Diffusion 3 ...
本文介绍了一种名为 Diffusion-DPO 的方法,该方法改编自最近提出的直接偏好优化 (DPO)。DPO 作为 RLHF 的简化替代方案,通过分类目标直接优化策略,以更好地满足人类偏好。 诸如 GPT-4 和 Llama 2 等高性能大型语言模型 (LLM) 的训练通常分为两个阶段: 预训练阶段 ...
近期,NVIDIA在人工智能领域的领先地位不仅得益于其强大的硬件性能,还归功于其生态系统的高度优化,使得AI应用能够发挥最佳效能。相比之下,AMD虽然在这一领域起步稍慢,但正奋力追赶,不断缩小与NVIDIA的差距。 值得注意的是,Stability AI近期发布了一项 ...
电子艺界(EA)宣布与Stability AI建立新的合作关系,后者是AI图像生成工具Stable Diffusion的创造者。两家公司将"共同开发变革性的AI模型、工具和工作流程",希望在保持质量的同时加快游戏开发速度。 "我使用'更智能的画笔'这个词,"EA SPORTS技术美术总监史蒂夫· ...