EN
uoa.zqysoft.com

最好看的日本MV片视频清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式

最好看的日本MV片视频
最好看的日本MV片视频北京时间6月27日9时,皇家马德里将在世俱杯小组赛末轮对阵萨尔茨堡红牛。皇家马德里方面公布了球队此役的大名单,贝林厄姆领衔,姆巴佩仍然缺阵。第三,提供端到端解决方案。随着AI系统日趋复杂,客户要的不再只是单颗芯片,而是经过整合优化的全栈解决方案。为此,AMD近年来通过自身发展和战略并购(如收购ZT、Nod.ai、Silo.ai、Lamini等公司),不断增强其在机架级设计、软件和编译器等领域的技术实力,从而为客户提供“开箱即用”的AI平台。“过去一年间,AMD已完成超25项战略投资,有效拓展了合作伙伴网络,并为未来AI软硬件领域的创新企业提供支持。”Lisa Su博士指出。最好看的日本MV片视频美女被咬小头头二是引发伊朗国内混乱。以军此番袭击针对伊朗的政治和军事领导人,据称目前多名伊朗军方高层遭暗杀。以色列希望此举能够引发伊朗国内政治变化,甚至影响伊朗政权。6月16日,记者联系曲靖市公安局开发区分局西城派出所,询问调查进展,民警答复称:“这个案子现在还在侦办中,嫌疑人的身份还没有确定。”
20250814 🔞 最好看的日本MV片视频多位分析人士认为,洛杉矶冲突的急剧恶化,很大程度上源于白宫的主动升级。有文章称,这是“特朗普渴望已久的一场战斗”:在一个民主党大本营的深蓝州,围绕其核心政治议题(移民问题),与一位重要的政治对手(加州州长纽森)展开正面摊牌,并进行一场军事力量展示。回乡下叔叔家被轮流欺负是哪一集小红书虚假内容治理负责人蒂法介绍,虚假不实内容、虚假人设和AIGC造假是当前社区打击“虚假”的三个重点。 其中,在AIGC技术爆发式发展的当下,虚假低质AIGC内容也成为治理的重中之重。小红书介绍平台不断加大对AIGC识别模型的研发投入,进一步提高识别精准度,减少虚假低质AIGC内容的曝光。同时,平台对AIGC生成内容做主动标识工作,提升信息透明度。半年共处置治理虚假低质AIGC笔记60万篇。
最好看的日本MV片视频
📸 盛超记者 马森乐 摄
20250814 🔞 最好看的日本MV片视频然而,火星任务不仅比迄今为止的任何太空旅行都耗时更长,而且还需要在崎岖不平的山区环境中完成各种高难度任务,例如小型探险、建立宜居基地等,这需要超乎寻常的心理素质。NASA人类研究项目的科学家布兰登·维西负责航天科学监督,他表示NASA已经在为执行6个月的任务挑选和训练宇航员,同时也会考虑更长时间的太空旅行计划。9.1破解版港交所官网显示,云知声于6月12日晚通过聆讯并披露资料集,中金公司和海通国际担任联席保荐人。这意味着,云知声即将登陆港股,成为今年备受瞩目的“AGI第一股”。 从财务表现看,随着营收增长,云知声亏损幅度在扩大。2022至2024年云知声的营收分别为6.01亿元、7.27亿元、9.39亿元,但三年间云知声累计净亏损已超过12亿元。招股书解释,亏损主要由于业务增长产生大量研发开支。公司预期亏损状况会持续,直至实现更大规模收入。
最好看的日本MV片视频
📸 罗香艳记者 周惠忠 摄
🍆 以色列总理内塔尼亚胡19日还称,以色列将摧毁伊朗所有核设施,以色列有能力这么做,至于特朗普是否让美军参战,是“他自己的决定”,“让我们说每一项贡献都受到欢迎。”满18岁免费观看高清电视剧推荐
扫一扫在手机打开当前页