IBM宣布即将全面推出IBM Spyre Accelerator,这是一款AI加速器,能够实现低延迟推理,以支持生成式AI和代理AI应用,同时优先考虑核心工作负载的安全性和弹性。今年早些时候,IBM宣布Spyre加速器将在IBM z17、LinuxONE 5和Power11系统中提供。Spyre将于10月28日在IBM z17和LinuxONE 5系统上正式上市,并于12月初在Power11服务器上推出市场。
今天的IT环境正在从传统的逻辑工作流程转变为代理人工智能推理。AI代理需要低延迟推理和实时系统响应。IBM认识到,大型机和服务器需要在不影响吞吐量的情况下运行人工智能模型以及最苛刻的企业工作负载。为了满足这一需求,客户需要支持生成和代理人工智能的人工智能推理硬件,同时保持核心数据、交易和应用程序的安全性和弹性。该加速器还旨在使客户能够将关键任务数据保存在本地,以降低风险,同时解决运营和能源效率问题。
IBM Spyre加速器反映了IBM从研究到产品的实力,将IBM研究AI硬件中心的突破性创新与IBM Infrastructure的企业级开发相结合。Spyre最初是作为原型芯片推出的,通过快速迭代进行了改进,包括在IBM约克敦高地校区的集群部署,以及与奥尔巴尼大学新兴人工智能系统中心等合作伙伴的合作。
IBM Research原型已经发展成为一种企业级产品,用于IBM Z、LinuxONE和Power系统。如今,Spyre加速器作为一个商用片上系统,拥有32个独立的加速器内核和256亿个晶体管。每个Spyre采用5nm节点技术生产,安装在75瓦的PCIe卡上,这使得在IBM Z或LinuxONE系统中最多可以集群48张卡,或者在IBM Power系统中集群16张卡,以扩展AI功能。
“我们的一个关键优先事项是推进基础设施建设,以满足新兴人工智能工作负载的需求,”IBM基础设施首席运营官兼IBM系统总经理Barry Baker说。“借助Spyre Accelerator,我们正在扩展系统的功能,以支持多模型人工智能,包括生成和代理人工智能。这项创新使客户能够以毫不妥协的安全性、弹性和效率扩展其支持人工智能的关键任务工作负载,同时释放其企业数据的价值。”
“我们于2019年成立了IBM研究人工智能硬件中心,其使命是满足人工智能不断增长的计算需求,甚至在我们最近看到的LLM和人工智能模型激增之前,”IBM半导体总经理兼IBM混合云副总裁Mukesh Khare说。“现在,在对先进人工智能功能的需求不断增加的情况下,我们很自豪地看到该中心的第一个芯片进入商业化阶段,旨在为IBM的大型机和服务器客户端提供更高的性能和生产力。”
对于IBM客户,Spyre加速器通过本地AI加速提供快速、安全的处理。这标志着一个重要的里程碑,使企业能够大规模利用人工智能,同时保留IBM Z、LinuxONE和Power系统上的数据。在大型机系统中,结合用于IBM Z和LinuxONE的Telum II处理器,Spyre提供了增强的安全性、低延迟和高事务速率处理能力。利用这种先进的硬件和软件堆栈,企业可以使用Spyre扩展多个AI模型,以支持高级欺诈检测和零售自动化等商业预测用例。
在基于IBM Power的服务器上,Spyre客户可以利用一系列AI服务,为企业工作流程实现端到端的AI。客户只需点击一下即可从目录中安装AI服务。Spyre Accelerator for Power与片上加速器(MMA)相结合,还可以加速生成AI的数据转换,为深度过程集成提供高吞吐量。此外,它的提示大小为128,可以在一小时内接收800多万份文档进行知识库集成。这种性能与IBM软件栈、安全性、可扩展性和能效相结合,支持客户将生成式人工智能框架集成到企业工作负载中。
NVIDIA DLI 与Ai时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。欢迎扫码加入我们!
更新时间:2025-10-10
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号