英伟达AI芯片突破:BlackwellUltra性能飙升,成本大幅降低
创始人
2026-02-18 14:25:58
0

2月16日,英伟达宣布其Blackwell Ultra AI架构(GB300NVL72)在能效与成本上取得显著突破。通过DeepSeek-R1模型测试,与前代Hopper GPU相比,每兆瓦吞吐量提升50倍,百万tokens成本降低至35分之一。英伟达还预告了下一代Rubin平台,预计其每兆瓦吞吐量将比Blackwell再提升10倍,进一步推动AI基础设施的演进。

Blackwell Ultra通过NVLink技术将72个GPU连接成统一的计算单元,互联带宽高达130TB/s,远超Hopper时代的8芯片设计。全新的NVFP4精度格式配合极致的协同设计结构,进一步巩固了其在吞吐性能上的统治地位。AI推理成本方面,相比Hopper架构,新平台将每百万Token的成本削减至35分之一;即便与上一代Blackwell(GB200)相比,GB300在长上下文任务中的Token成本也降低至1.5分之一,注意力机制处理速度翻倍,适配代码库维护等高负载场景。

OpenRouter的《推理状态报告》指出,与软件编程相关的AI查询量在过去一年中激增,占比从11%攀升至约50%。这类应用通常需要AI代理在多步工作流中保持实时响应,并具备跨代码库推理的长上下文处理能力。英伟达为应对这一挑战,通过TensorRT-LLM、Dynamo等团队的持续优化,进一步提升了混合专家模型(MoE)的推理吞吐量。例如,TensorRT-LLM库的改进,让GB200在低延迟工作负载上的性能在短短四个月内提升了5倍。

相关内容

热门资讯

福特3万美元电动皮卡将挑战中国... 2月18日,福特汽车宣布计划在明年推出一款起售价3万美元的电动皮卡,旨在与中国车企竞争的同时保持利润...
春运图景不断焕新(新时代画卷) 陕西省西安市,西安北站,旅客向窗外挥手告别。  刘一江摄(影像中国)浙江省金华市330国道春运服务点...
视频丨天地同庆 神舟二十一号乘... 这个春节,在遥远的太空上,神舟二十一号乘组在中国空间站也安排了热闹的迎新春活动。“天宫春晚”有哪些好...
视频丨“十二花神”是如何选出的... 昨晚,中央广播电视总台《2026年春节联欢晚会》为广大观众送上了热气腾腾、温情满满的文化大餐。其中,...
人民论坛锐评 | 新年“新活儿... 日前,商务部、文化和旅游部等9单位印发《2026“乐购新春”春节特别活动方案》,通过文商旅体融合、线...
(新春见闻)拓新、驰骋、交流:... 中新社北京2月18日电 题:拓新、驰骋、交流:北京高校台生的马年关键词作者 李百加凭借优质高教资源、...
爱上中国风丨爱上川剧变脸的冰岛... 在遥远的北欧国家冰岛,有个12岁的男孩,叫李昂。网友们说,他的脸像年画娃娃般喜庆可爱,让人忍不住想要...
酒店年味新!岭南屋脊下过个“宅... 马上过大年,广货伴我行⑤农历马年将至,《羊城晚报》“文化中国行”栏目特别策划“马上过大年,广货伴我行...
加州法院判OpenAI侵权:禁... 2月18日,美国加州北区联邦地区法院作出裁决,支持明星视频祝福平台Cameo的诉讼请求,要求Open...
吉利银河星耀6新车型亮相:28... 2月18日,吉利汽车旗下银河星耀6新车型“HQ7151DCHEV122”现身工信部。该车型延续星耀6...