英伟达TiDAR技术：AI文本生成速度提升5倍！_知识学习

英伟达TiDAR技术：AI文本生成速度提升5倍！

创始人

2025-12-02 15:30:55

0次

12月2日，科技媒体Tom'sHardware报道了英伟达最新论文中介绍的TiDAR新型AI解码方法。TiDAR结合了自回归和扩散模型机制，通过利用GPU的“空闲槽位”加速文本生成。自回归模型按顺序生成文本，而扩散模型则一次性生成多个可能的词。TiDAR的核心在于在不牺牲质量的前提下，通过单步生成多个Token来提升响应速度并降低GPU运行时长。

TiDAR技术原理上创新性地训练单个Transformer模型同时执行自回归“下一词预测”和基于扩散的“并行起草”。它通过结构化的注意力掩码将输入分为三个区域：前缀区、验证区和起草区。这种设计让模型在利用扩散头并行起草新Token的同时，还能通过自回归头验证这些草稿，确保了KV缓存的结构有效性。

研究团队基于Qwen系列模型进行了测试。在HumanEval和GSM8K等基准测试中，TiDAR的准确率与基准模型持平甚至略有提升。在速度方面，15亿参数版本的TiDAR模型实现了4.71倍的吞吐量增长；而80亿参数版本的表现更为抢眼，吞吐量达到了Qwen3-8B基准的5.91倍。这表明TiDAR能有效利用GPU的显存带宽，在不增加额外显存搬运的情况下生成更多Token。尽管实验数据亮眼，TiDAR目前仍面临规模扩展的挑战，未来将在更大规模的模型上进行验证。

上一篇：众擎T800人形机器人震撼亮相：空中回旋踢，性能超人类！

下一篇：以下是一些改写“回应民生关切”的方式，你可以根据具体情境和表达需求进行选择：对民生关切予以回应：强调了主动去做、给予回应的动作，突出了积极的态度。针对民生关切作出回应：明确了是针对特定的民生问题进行回应，使回应更具针对性。以回应民生关切为导向：将回应民生关切作为行动的导向，体现了重视民生的理念。对民生关切进行积极回应：强调了回应的积极态度，即主动、认真地对待民生关切。用回应民生关切来体现：表明通过回应民生关切来展现某种价值或态度，突出了回应的重要性。以回应民生关切为己任：将回应民生关切视为自

英伟达TiDAR技术：AI文本生成速度提升5倍！

相关内容

热门资讯