11月21日下午,华为在上海举办“2025 AI容器应用落地与发展论坛” ,会上正式发布并开源了创新AI容器技术Flex:ai 。
目前,行业内算力资源的平均利用率仅为30%至40%,据华为介绍 ,Flex:ai通过算力切分技术,将单张GPU(图形处理器)/NPU(神经网络处理器)算力卡切分为多份虚拟算力单元,切分粒度精准至10%。此技术实现了单卡同时承载多个AI工作负载 ,在无法充分利用整卡算力的AI工作负载场景下,算力资源平均利用率可提升30%。
与英伟达旗下Run:ai只能绑定英伟达算力卡不同,华为AI容器技术Flex:ai通过软件创新,可实现对英伟达 、昇腾及其他第三方算力资源的统一管理和高效利用 ,有效屏蔽不同算力硬件之间的差异,为AI训练推理提供更高效的资源支持 。
大幅提升算力资源利用率
据介绍,华为Flex:ai是基于Kubernetes容器编排平台构建的XPU池化与调度软件 ,通过对GPU、NPU等智能算力资源的精细化管理与智能调度,实现AI工作负载与算力资源的“精准匹配 ”,大幅提升算力资源利用率。
据了解 ,容器技术作为一种轻量级虚拟化技术,可以将模型代码、运行环境等打包成一个独立的 、轻量级的镜像,实现跨平台无缝迁移 ,解决模型部署“环境配置不一致”的痛点。容器还可以按需挂载GPU、NPU算力资源,按需分配和回收“资源”,提升集群整体资源利用率 。
AI时代需要AI容器
根据Gartner的报告 ,目前AI负载大多都已容器化部署和运行,据预测,到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行。
谈及为什么推出Flex:ai AI容器技术 ,华为公司副总裁、数据存储产品线总裁周跃峰表示,传统容器技术已无法完全满足AI工作负载需求,AI时代需要AI容器。
具体而言 ,周跃峰表示,首先,大型语言模型(LLM)的容器镜像轻松突破10GB ,多模态模型镜像甚至可达TB级别,传统容器无法支持超大镜像的快速拉起,环境构建时间往往长达数小时。
其次 ,传统容器主要针对CPU(中央处理器) 、内存等通用计算资源进行管理与调度,而AI大模型训练与推理还需大幅依赖GPU、NPU等智能算力资源,传统容器无法对异构智算资源做到算力细粒度切分与智能调度 ,导致即使很小的AI工作负载也独占整张算力卡,且无法进行远程调用 。
最后,传统容器的资源调度以固定分配、通用调度为主,而AI工作负载的资源调度需要以保障任务完成效率为目标 ,对不同任务的特性进行感知,实现动态弹性的资源分配。
据介绍,与英伟达今年年初收购的Run:ai公司的核心产品相比 ,华为Flex:ai在虚拟化、智能调度等方面具备独特优势。
具体来看,在本地虚拟化技术中,Flex:ai支持把单个物理GPU/NPU算力卡切割为数个虚拟算力单元 ,并通过弹性灵活的资源隔离技术,可实现算力单元的按需切分 。
同时,Flex:ai独有的“拉远虚拟化 ”技术 ,可以在不做复杂的分布式任务设置情况下,将集群内各节点的空闲XPU算力聚合形成“共享算力池”,此时不具备智能计算能力的通用服务器通过高速网络 ,可将AI工作负载转发到远端“资源池”中的GPU/NPU算力卡中执行,实现通用算力与智能算力资源融合。
在智能调度方面,Flex:ai的智能资源和任务调度技术,可自动感知集群负载与资源状态 ,结合AI工作负载的优先级 、算力需求等多维参数,对本地及远端的虚拟化GPU、NPU资源进行全局最优调度,满足不同AI工作负载对资源的需求。
加速AI行业化落地
周跃峰表示 ,Flex:ai将在发布后同步开源在魔擎社区中 。Flex:ai将与华为此前开源的Nexent智能体框架、AppEngine应用编排 、DataMate数据工程、UCM推理记忆数据管理器等AI工具共同组成完整的ModelEngine开源生态,加速赋能AI行业化落地。
周跃峰表示,不同行业、不同场景的AI工作负载差异较大 ,通过开源,Flex:ai可提供提升算力资源利用率的基础能力和部分优秀实践,与业界一道结合行业场景完成落地探索。
此外 ,华为还希望通过开源推动形成以AI容器技术为载体的资源高效利用新范式 。周跃峰说,开源的Flex:ai可以在产学研各界开发者的参与下,共同推动异构算力虚拟化与AI应用平台对接的标准构建 ,形成算力高效利用的标准化解决方案。
东财图解·加点干货股票网站排名哪个好:股票融资利率是多少-华为将发布AI领域突破性技术 有望解决算力资源利用效率难题
股票问答平台:手机能买股票不-华为发布Flex:ai AI容器技术 实现单卡同时承载多个AI工作负载
手机股票开户哪个证券公司好:十大配资公司平台-谷歌发布Pixel 10系列手机:AI全面加持 直面苹果挑战
在手机上买股票哪个平台最好:股票软件app-冲刺科创板?宇树科技拟四季度提交IPO申请
在手机上怎么开户买股票:手机股票软件哪个最好-超5.7亿股反对“修船闸”议案!长江电力股东会十大关键问答曝光
炒股票哪个平台好:买股票在哪里开户-特斯拉AI官方微博首条内容展示最新人形机器人 机构高频调研股是这几只
广盛网app-低息配资开户平台|实现低利率并保持服务的高质量提示:文章来自网络,不代表本站观点。
广盛网app-低息配资开户平台|实现低利率并保持服务的高质量㉖合规的股票配资平台会加强对投资顾问的资质审核和持续培训,确保投资顾问具备专业的投资知识和经验。
消息面上,4月9日消息,美国总统发表讲话称,美国将对药品征收关税。我国生物医药行业对美商品贸易以仿制药出口为主,国产创新...
特朗普宣布暂停“对等关税”90天,纳指隔夜暴涨超12%。今日(4月10日),A股三大指数集体高开,沪指涨1.29%,深证...
中国商务部国际贸易谈判代表兼副部长李成钢10日晚在英国伦敦说,过去两天,中美双方团队进行了深入交流,就落实两国元首6...
界面新闻记者|李科文界面新闻编辑|谢欣2月18日,据港交所公告,真实生物已递表港交所主板。据招股书,中金...
7月15日有关部门召开钾肥保供稳价会议,骨干流通企业均认为近期钾肥价格异常上涨严重偏离基本面,后期将加强市场供应,推...
界面新闻记者|孙艺真3月21日晚间,沪深交易所发布《以上市公司质量为导向的保荐机构执业质量评价实施办法(试行...
近期美国所谓“对等关税”政策引发全球资产巨震,本周一科技板块调整尤为明显。为了稳定资本市场,汇金、央行等机构稳市打出组合...
界面新闻记者|龙力近期,部分全天候策略私募产品净值出现了较为明显的回撤。Wind数据显示,名称中含有...
记者|张乔遇半导体前道设备的国产化进程一直备受关注。截至2023年末,前道量检测设备的国内企业市场份额约...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...
3月24日,海洋王照明科技股份有限公司(以下简称“海洋王”,002724.SZ)早盘一字跌停,此后股价拉涨,尾盘封涨停板...
界面新闻记者|龙力开年两个多月,不少头部量化私募都在积极“上新”。Wind数据显示,截至3月17日,...
2025年3月24日下午三点A股收盘后,港股科技板块持续走强至四点十分收盘。消息面上,一方面美元相对于人民币连续3个交易...