12月23日,华为数据存储与中科弘云正式发布AI推理加速联合解决方案。该方案以华为OceanStor A系列存储为数据底座,结合中科弘云智算互联网云服务平台HyperCN平台,实现软硬件协同创新,有效提升算力资源利用率,优化长序列推理体验,为AI推理应用落地提供有力支撑。

当前,AI产业的发展重心已从偏重模型训练,转向训练与推理并重、并更强调规模化落地的新阶段。随着大模型应用场景不断扩展,Token调用量迎来爆发式增长,长序列推理面临“推不动、推得慢、推得贵”三大核心问题。同时,算力平台需适配多元存储、异构算力以及不同AI框架,叠加算力孤岛化、成本黑盒化、开发碎片化与迁移协同等复杂痛点,进一步制约了AI应用发展。
为破解上述困境,华为数据存储与中科弘云充分发挥各自技术优势,强强联合,推出AI推理加速联合解决方案。该方案深度融合华为OceanStor A系列存储、华为UCM推理记忆数据管理技术以及中科弘云HyperCN平台能力,通过KV Cache多级缓存管理、秒级算力调度、分钟级推理大模型部署及全流程AI工具链,将智能算力精准输送至业务一线,为企业业务赋能。该联合方案的核心优势如下:
经实测,在智能问答的典型推理场景中,该方案实现首Token时延(TTFT)降低57.5%,且序列长度越长,优化效果越显著;在长文档推理场景中,结合GSA稀疏加速算法,当序列长度为39K时,并发能力提升86%,推理吞吐提升36%,大幅提升推理效率与体验。
目前,该联合方案已在能源电力、智能制造、国家实验室等关键行业启动试点应用。未来,华为将与中科弘云持续深化战略合作,聚焦技术创新与产业需求融合,助力更多企业加速数智化转型步伐。
更新时间:2025-12-25
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号