11月21日,华为在AI容器应用落地与发展论坛上推出了Flex:ai AI容器软件。该软件通过算力切分技术,能够将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度可精准至10%。这一技术突破使得单张卡能够同时承载多个AI工作负载,并且可以聚合集群内各节点的空闲XPU算力,形成“共享算力池”,从而提高资源利用率和计算效率。
Flex:ai的发布标志着AI算力资源管理的新阶段。它不仅能够实现更精细的算力分配,还能够根据实际工作负载动态调整资源分配,优化AI应用的性能和成本。此外,Flex:ai计划在发布后同步开源,这将使得更多的开发者和企业能够参与到这一技术的创新和应用中,推动AI技术的进一步发展和普及。
