谷歌DiffusionGemma发布:AI推理速度提升4倍,代码生成效率惊人
创始人
2026-06-11 07:32:44
0

今日,谷歌宣布推出DiffusionGemma,一款基于文本扩散机制的开放AI模型。该模型相较于自回归模型,在本地推理速度上提升了4倍。DiffusionGemma通过从噪声中逐步去噪的方式生成输出,与自回归模型逐个生成token不同,扩散模型并行处理所有token,逐步优化整体输出质量,在本地低带宽计算环境下具有显著的推理速度优势。

DiffusionGemma采用Apache2.0许可证开源,用户可从HuggingFace下载模型权重。模型支持迭代优化,能在生成过程中主动纠正错误,输出更加稳定一致。采样速度达到1479tokens/秒,开销仅0.84秒,生成效率显著提升。在性能方面,DiffusionGemma在代码生成上表现优异,LiveCodeBench达30.9%,BigCodeBench达45.4%,HumanEval达89.6%。数学能力表现亮眼,AIME2025取得23.3%,超越对比模型的20.0%。

然而,DiffusionGemma在部分基准上仍存短板。科学推理GPQADiamond仅40.4%,明显低于对比模型的56.5%;推理能力BIG-BenchExtraHard为15.0%,同样落后于21.0%。速度方面,英伟达指出,该模型的扩散设计能充分发挥GPU的TensorCore并行计算能力。在单块H100GPU上,DiffusionGemma达到每秒1000个token的生成速度;在DGXSpark上为每秒150个token;在DGXStation上可达每秒2000个token,约为同等条件下自回归模型的4倍。

相关内容

热门资讯

阿里腾讯高考智能填报大战:千问... 6月10日,阿里巴巴集团旗下的大模型应用“千问”推出了“千问高考志愿填报专家”,宣称为“国内首个全周...
特斯拉FSD欧洲获批加速,比利... 6月11日,特斯拉FSD(监督版)在欧洲的推广取得新进展,比利时成为欧盟第五个批准该系统上路使用的国...
中国智能驾驶系统成全球标准,引... 6月11日,央视新闻报道,国际汽车开放系统架构组织在上海宣布,中国自主研发的智能驾驶操作系统正式成为...
OpenAI或明年上市,AI技... 6月11日,科技媒体The Information披露了OpenAI公司CEO萨姆·奥尔特曼的内部邮...
谷歌DiffusionGemm... 今日,谷歌宣布推出DiffusionGemma,一款基于文本扩散机制的开放AI模型。该模型相较于自回...
新能源车“增重潮”:12年增4... 近日,国内新能源汽车市场出现明显的增重趋势,车身宽度和轴距普遍增加,整车整备重量逐年上升。据统计,2...
小熊猫与黑脚企鹅交换会成为“渗... 6月10日,国台办举行例行新闻发布会。有记者提问,根据2024年上海台北城市论坛双方合作备忘录,上海...
小米MiMoCode开源AI编... 6月11日,小米MiMo官方宣布正式发布并开源MiMoCode V0.1.0,这是一款运行在终端里的...
今晚截止!广州vs云浮,抓紧预... 粤超常规赛下半程将在本周末开启21队全力向季后赛席位发起冲刺本周六广州队将坐镇主场越秀山体育场迎战云...
南沙区纪委监委靠前监督 铁纪... “监控视频是否全覆盖?”“听力设备的备用系统和应急方案在哪里?”……2026年高考期间,南沙区纪委监...