英伟达AI芯片突破:BlackwellUltra性能飙升,成本大幅降低
创始人
2026-02-18 14:25:58
0

2月16日,英伟达宣布其Blackwell Ultra AI架构(GB300NVL72)在能效与成本上取得显著突破。通过DeepSeek-R1模型测试,与前代Hopper GPU相比,每兆瓦吞吐量提升50倍,百万tokens成本降低至35分之一。英伟达还预告了下一代Rubin平台,预计其每兆瓦吞吐量将比Blackwell再提升10倍,进一步推动AI基础设施的演进。

Blackwell Ultra通过NVLink技术将72个GPU连接成统一的计算单元,互联带宽高达130TB/s,远超Hopper时代的8芯片设计。全新的NVFP4精度格式配合极致的协同设计结构,进一步巩固了其在吞吐性能上的统治地位。AI推理成本方面,相比Hopper架构,新平台将每百万Token的成本削减至35分之一;即便与上一代Blackwell(GB200)相比,GB300在长上下文任务中的Token成本也降低至1.5分之一,注意力机制处理速度翻倍,适配代码库维护等高负载场景。

OpenRouter的《推理状态报告》指出,与软件编程相关的AI查询量在过去一年中激增,占比从11%攀升至约50%。这类应用通常需要AI代理在多步工作流中保持实时响应,并具备跨代码库推理的长上下文处理能力。英伟达为应对这一挑战,通过TensorRT-LLM、Dynamo等团队的持续优化,进一步提升了混合专家模型(MoE)的推理吞吐量。例如,TensorRT-LLM库的改进,让GB200在低延迟工作负载上的性能在短短四个月内提升了5倍。

相关内容

热门资讯

特斯拉Robotaxi夜间无人... 5月5日,特斯拉在奥斯汀的Robotaxi服务实现了新的里程碑,首次在晚间开启无人监管运营模式,打破...
嘉兴移动充电站“五一”高效服务... 5月4日,全国高速公路在“五一”假期期间车流量激增,浙江嘉兴地区通过在服务区等地点部署移动充电设备,...
日产全固态电池突破:充电快、续... 近日,日产汽车在横滨工厂的试产线上完成了车用全固态电池原型测试。这一原型样品由23层电芯组成,其充放...
领克10量产车下线!最高续航8... 今日,领克汽车销售公司宣布领克10首台量产车正式下线。领克10推出三款配置,分别为701长续航版20...
“女司机炫耀自动驾驶双手离盘,... 近日,浙江温州高速交警接到举报,一名驾驶人在社交平台发布驾驶时双手脱离方向盘的视频。视频中,该驾驶人...
女司机高速上化妆跳舞,交警:辅... 近日,浙江温州高速交警接到群众举报,称一名女子在社交平台发布多条危险驾驶视频。视频中,该女子在高速公...
领克10量产车下线,预售价20... 5月5日,领克汽车销售公司常务副总经理周钘宣布,领克品牌的10首台量产车正式下线。这款新车在2026...
Meta收购AI机器人公司AR... Meta于5月1日完成了对物理AI模型初创企业AssuredRobot Intelligence(A...
OpenAI加速AI Agen... IT之家5月5日消息,天风国际分析师郭明錤更新产业调查报告,透露OpenAI可能正在加速开发首款AI...
大众汽车面临碳排放罚款压力,电... 5月5日,大众汽车集团面临欧盟电动化转型压力,需销售更多电动汽车以减少碳排放,避免巨额罚款。然而,电...