谷歌又来整活?A2A协议统一世界!

A2A(Agent2Agent)协议 是由 Google Cloud 推出的一个开放协议,旨在促进不同 AI 代理之间的互操作性。其主要目标是允许这些代理在动态的、多代理的生态系统中进行有效的通信和协作,无论它们是由不同的供应商构建的还是使用不同的技术框架。

谷歌官方也表示,A2A是在MCP之后的补充,也就是MCP可以强化大模型/Agent的能力,但每个大模型/Agent互为孤岛,不能相互协作干活,我们一直需要在中间做协调,虽然AI帮我们干了一部分活,但我们还需要盯着他们,就有点鸡肋,现在有了A2A,Agent理论上就可以下场真正干活了,我们只需要验收成果。

举个现实中的例子,让大家更能感受到A2A的魅力。

我们现在想让AI帮你策划一场完美的周末旅行。我们需要先去问AI A(行程规划大师)搞定了路线,然后复制粘贴给AI B(机票酒店预订专家),结果B说格式不对读不懂… 你又手动输给AI C(当地美食玩乐推荐官),最后对着三个分裂的窗口,感觉自己才是那个“人工智能”。这种AI越多、用户越累的“智能”困境,是我们现在使用AI时的一个通病。

行业里天天喊AI Agent要爆发,但Gartner预测(据不完全统计,超过70%的用户觉得同时操作多个单一功能AI Agent效率低下,体验割裂),多数Agent还停留在“单打独斗”的阶段。然而,另一边却是对复杂任务自动化需求的指数级增长,这种“供需倒挂”的矛盾,就是 A2A 要解决的核心痛点。

别被“Agent2Agent”这个名字吓到,说白了,A2A就是谷歌给AI智能体们定的一套“通用社交礼仪”+“标准沟通语言”。就像互联网世界的HTTP和TCP/IP协议一样,让原本“鸡同鸭讲”的各种Agent,能互相找到对方、听懂对方的话、还能一起协作干活。本质上,就是把之前各种机构、公司、个人等不同平台,甚至是不同架构搭建的AI Agent,在他们之间架起一座桥,让所有AI Agent都能在上面沟通,互相操作。

其实最让人惊讶的就是,A2A刚发布就获得了大批著名企业的青睐和加入,包括埃森哲、波士顿咨询集团、凯捷、科尼、Salesforce、德勤、甲骨文、HCL科技、印孚瑟斯、KPMG、SAP、麦肯锡、普华永道等50多家日常大家能经常听到的企业。

A2A 的设计原则总结

A2A(Agent2Agent)协议的设计原则旨在提升代理之间的协作能力,确保灵活性、安全性和与现有系统的兼容性。以下是这些原则的综合总结:

1. 拥抱代理能力

• 允许代理在其自然、非结构化的模式下进行协作,无需共享内存、工具或上下文,从而实现真实的多代理场景。

2. 基于现有标准构建

• 协议建立在广泛接受的技术标准之上,如 HTTP、SSE 和 JSON-RPC,便于与企业现有的 IT 堆栈集成。

3. 默认安全

• 设计支持企业级身份验证和授权,确保只有经过授权的用户和系统可以访问代理,增强了系统的安全性。

4. 支持长时间运行的任务

• 灵活支持从快速任务到复杂研究的多种场景,能够在任务执行过程中提供实时反馈、通知和状态更新。

5. 模态无关

• 支持多种交互形式,包括文本、音频和视频流、form 、 iframe 等,增强了代理的交互能力和适应性。

A2A工作原理总结

A2A的工作原理是通过促进客户端Agent和远程Agent之间的通信来实现的。客户端Agent负责制定和传达任务,而远程Agent则根据这些任务采取行动,以提供正确的信息或执行相应的操作。在这个过程中,A2A协议有以下几个关键能力。

首先,Agent可以通过“Agent卡”来宣传它们的能力。这些“Agent卡”是以JSON格式存在的,它们能够让客户端Agent识别出哪个远程Agent最适合执行特定的任务。

一旦确定了合适的远程Agent,客户端Agent就可以利用A2A协议与之进行通信,将任务分配给它。

然后,任务管理是A2A协议中的一个重要环节。客户端和远程Agent之间的通信都是围绕完成任务展开的。协议定义了一个“任务”对象,这个对象具有自己的生命周期。

对于一些简单的任务,可能可以立即完成;而对于一些复杂的、长期的任务,Agent们可以相互沟通,以保持对任务完成状态的同步。当任务完成时,其输出被称为“工件”。

此外,A2A还支持Agent之间的协作。Agent们可以相互发送消息,这些消息可以包含上下文信息、回复、工件或者用户指令。通过这种方式,Agent们能够更好地协同工作,共同完成复杂的任务。

最后,A2A还具备用户体验协商的功能。每条消息都包含“部分”,这些部分是完整的内容片段,例如,生成的图像。

每个部分都有指定的内容类型,这使得客户端和远程Agent能够协商所需的正确格式,并且明确包括用户界面能力的协商,比如iframe、视频、网络表单等。这样,A2A就能够根据用户的需求和设备的能力,提供最佳的用户体验。

开源地址:
https://github.com/google/A2A


本文转载自微信公众号:果然亮的技术大菠萝

原文链接:


https://mp.weixin.qq.com/s/XWHk3VrC1eMCWRGZe17t8w

更多精彩内容请关注微信公众号:果然亮的技术大菠萝

展开阅读全文

更新时间:2025-04-22

标签:协议   工件   上下文   客户端   原则   能力   操作   通信   格式   用户   世界   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top