华为大动作!AI新技术
创始人
2025-11-21 22:46:24
0

11月21日,2025AI容器应用落地与发展论坛在上海举行。华为公司副总裁、数据存储产品线总裁周跃峰在论坛上发布AI容器技术——Flex:ai。同时,会上宣布,将此项产学合作成果向外界开源,助力破解算力资源利用难题。

公开资料显示,容器技术作为一种轻量级虚拟化技术,可以将模型代码、运行环境等打包成一个独立的、轻量级的镜像,实现跨平台无缝迁移,解决模型部署“环境配置不一致”的痛点。容器还可以按需挂载GPU(图形处理器)、NPU(神经网络处理器)算力资源,按需分配和回收“资源”,提升集群整体资源利用率。

研究机构Gartner称,AI负载很多都运行在容器中,强扩展性的容器技术将进一步推动AI应用的部署落地。其预测,到2027年,75%以上的AI应用将采用容器技术进行部署。

当前,AI产业高速发展催生海量算力需求,但全球算力资源利用率偏低的问题日益凸显,“算力资源浪费”成为产业发展的关键难题:小模型任务独占整卡导致资源闲置,大模型任务单机算力不足难以支撑,大量缺乏GPU/NPU的通用服务器更是处于算力“休眠”状态,供需错配造成严重的资源浪费。

“大任务单机算力不够用,需要多个机器能够合成一个更强大的卡。还有多任务并发的时候,调度怎么办?”周跃峰说,Flex:ai需要解决这些问题。

华为介绍,本次发布并开源的Flex:ai XPU(各种类型处理器)池化与调度软件,是基于Kubernetes容器编排平台构建,通过对GPU、NPU等智能算力资源的精细化管理与智能调度,实现AI工作负载与算力资源的精准匹配,可大幅提升算力利用率。

周跃峰表示,华为将和相关合作高校持续完善AI容器软件Flex:ai,让Flex:ai的用户和开发者将软件用得越来越好,让AI能够真正实现平民化。

相关内容