过去几年,大型科技公司一直在竞相将人工智能应用于一切。老牌巨头微软在很大程度上依赖于外部模型来推动这一进程,从OpenAI的GPT驱动的Copilot到在Azure上运行的越来越多的开源系统。这种方法帮助它快速发展,但现在该公司正在进入一个新阶段——它将更多引入内部能力。
本周,微软推出了两款完全由自己的人工智能团队打造的新模型。MAI-1预览版是一个在数千个GPU上训练的大型语言模型(LLM),而MAI-Voice-1则提供快速、富有表现力的语音生成,两者都嵌入Copilot。这些不仅仅是实验性的发布。它们反映了微软战略的一个更大转变,即专注于构建它完全拥有、调整和扩展的人工智能系统。
微软在一篇发布新模型的博客文章中表示,它希望创造“赋予地球上每个人权力”的技术。据该公司称,其目的是创造一些有用和有根据的东西。它提供了可以根据人们实际生活和工作方式进行调整的工具。它称这种愿景为“应用人工智能”,旨在支持实际需求,而不是追逐炒作。该公司表示,这些首批模型是朝着这一长期计划迈出的一步。
MAI-1预览版在大约15000个Nvidia H100 GPU上进行训练。它使用专家设计的混合体,通过模型的专门部分来路由不同的任务,以提高性能和效率。该模型正在社区运营的基准测试网站LMArena上进行公开测试,并将很快开始在Copilot上推出基于文本的精选功能。微软认为这是朝着构建能够随着时间的推移而发展并更直接地响应用户需求的系统迈出的重要一步。
第二个模型MAI-Voice-1是关于语音的。它旨在生成快速、自然的音频,听起来比典型的人工智能语音更有表现力。微软表示,它可以在一个GPU上在不到一秒钟的时间内产生整整一分钟的语音输出,这将使其成为目前最有效的语音模型之一。
它已经在Copilot Daily和Copilot Podcasts中上线,并可在Copilot Lab进行测试。用户可以探索不同的音调、声音和情绪,包括讲故事和引导冥想等格式。微软认为这是朝着让语音成为与人工智能工具更自然的交互方式迈出的一步。
消费者至上的方向是微软深思熟虑的选择。微软没有将其内部模型瞄准企业工作负载,而是优先考虑人工智能出现在日常应用程序和个人用户体验中的用例。
微软人工智能首席执行官Mustafa Suleyman表示:“我的逻辑是,我们必须创造出对消费者非常有效的东西,并真正针对我们的用例进行优化。”“因此,我们在广告、消费者遥测等方面拥有大量非常有预测性和非常有用的数据。我的重点是构建真正适用于消费者伴侣的模型。”
在幕后,微软一直在悄悄地扩大其基础设施,以实现其雄心壮志。该公司表示,其下一代GB200集群现已投入运行,使其具有通常为前沿人工智能实验室保留的原始计算能力。这表明需要长期投资,完全在内部开发和运行大型模型。这不仅仅是为了跟上Copilot的需求。这是为了迎接接下来发生的任何事情。
虽然这家科技巨头已经推出了内部LLM,但它并没有完全关闭外部模型的大门。该公司明确表示,它计划使用最适合这项工作的工具,无论是自己的架构、GPT-4这样的合作伙伴模型,还是开源系统。
这种灵活性可能很重要,尤其是当人工智能系统跨越行业、地理和合规边界时。混合方法使微软能够更好地控制模型的部署方式、数据的处理方式以及平台适应新需求或法规的速度。
尽管微软开始构建自己的模型, OpenAI仍然是深度合作伙伴。但微软希望对其人工智能的下一步发展有更多的控制权。对外部模式保持开放,使微软能够开辟一条中间道路。谷歌正在全力推进其Gemini堆栈,Meta正在推动LLaMA和开放模式,亚马逊则专注于通过Bedrock提供广泛的人工智能应用菜单。
微软的战略是不同的。它正在构建自己的模型,同时为其他模型留出空间,并将其直接置入到Copilot等面向用户的产品中。如果人工智能的未来是跨环境协同工作的系统的融合,那么这可能就是未来的样子。
更新时间:2025-09-05
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号