PenguinSolutions发布11TB内存AI服务器，专为低延迟推理而生_知识学习

PenguinSolutions发布11TB内存AI服务器，专为低延迟推理而生

创始人

2026-03-17 18:49:31

0次

3月16日，PenguinSolutions宣布推出业界首款采用CXL技术的量产型KVCache服务器。这款服务器综合了3TB的DDR5系统主内存和8个1TB的CXL内存AIC模块，为AI推理负载提供合计11TB的海量内存空间。PenguinSolutions指出，AI推理工作负载中，30%依赖于算力，而70%依赖于内存，这一比例与模型训练/调优有显著不同。此外，延迟表现对推理场景的用户使用体验影响重大。

MemoryAIKVCache服务器旨在为AI推理系统提供更低的延迟、更短的首Token响应时间、更高的吞吐量以及更高的XPU集群利用效率。这些特性使得服务器能够持续满足严苛的服务水平一致性要求，特别适合实时金融分析、海量数据集RAG、监管合规性分析等需求大窗口和低延迟的企业级任务。

上一篇：【与你为邻】格鲁吉亚记者：一种只存在于中国的爱

下一篇：岚图泰山“黑武士版”上市！50.99万起，全尺寸SUV新标杆

热门资讯

奥迪E7X纯电SUV亮相北京车... 2026年4月24日，奥迪与上汽合作的豪华新能源汽车品牌AUDI在2026北京车展上发布了其首款纯电...

吉利银河A7EM/A7EV双车... 今日，吉利汽车发布了2026款银河A7EM/A7EV双车系列，标志着品牌在新能源汽车领域的进一步拓展...

比亚迪2026款夏露营改装版亮... 今日，2026北京车展上，比亚迪王朝网旗下中大型旗舰MPV——2026款夏带来重磅惊喜，官方定制露营...

DeepSeek-V4模型震撼... 4月24日，DeepSeek公司宣布推出其新一代基础模型DeepSeek-V4，该模型已在官网、官方...

比亚迪大唐EV预售开启，950... 4月24日，比亚迪王朝网旗下全新全尺寸旗舰SUV大唐EV正式开启预售，预售价25万元至32万元。新车...

华为问界M6上市15分钟订单破... 4月22日，华为常务董事余承东宣布，搭载鸿蒙智行系统的问界M6汽车上市15分钟内，大定订单已突破10...

千里科技发布AI战略，2027... 4月22日，千里科技在北京举办了AI战略暨产品发布会，宣布了其“AI+车”战略的最新成果，并探讨了A...

越南青年来华“红色研学之旅”广... 文、图/羊城晚报全媒体记者张小悦通讯员岳青4月11日至13日，由共青团中央主办，中央团校、共青...

广州南沙：智能育秧显优势，稻苗... 清风催新绿，春耕正当时。当许多地方仍在沿用传统手工育秧方式时，广州南沙多家育秧中心已率先引入智能化生...

把植物新品种繁殖换个名销售，法... 故事梗概2023 年4月，A公司发现B某、C公司及D公司（法人代表B某）大量对外销售、宣传销售被诉侵...

PenguinSolutions发布11TB内存AI服务器，专为低延迟推理而生

相关内容

热门资讯