开始抢人!美国一周挖走4名中国顶尖人才,年薪1个亿美元令人咋舌

|议史纪

编辑 |议史纪


同样是写代码,有人正在被科技巨头用上亿美元级的筹码追着请。

美国一家公司,从另外一家公司那里,在一周时间里挖走了四个华人顶尖工程师,总包待遇往上算是一个亿美金级别。

美国科技圈对中国培养出来的高端人才彻底改了打法,也是在用最直接的方式承认一件事:中国理工教育体系和工程训练,已经成了他们竞争 AI 的关键资源池。

当下全球 AI 竞争最真实的战场之一,只不过战场不在会谈桌上,落在一份份 offer 上。

四位工程师身上的隐形筹码

一周挖走四名华人顶尖人才,总包一个亿美元级别。真正让美国公司盯上的,并不是某个简历上的光鲜头衔,而是这四个人背后代表的一整套能力。

这几位工程师有一个共同点:都不是只会写某一段模型代码,他们参与的是整条模型从提出设想到落地成产品的完整流程。

有人负责模型架构,有人抓多模态感知,有人把实时语音对话的体验抠到极致,还有人专门做后训练、调教模型行为、设计演示方式。

简单讲,就是从大脑构造,到它怎么看世界、怎么开口说话,再到怎么在产品里稳定、安全地跑,都涉及到了。

以赵晟佳为例,他在 OpenAI 不只是普通研究员,而是参与了 ChatGPT 和 GPT-4 从无到有的全过程,这意味着他对这些大模型是怎么堆出来的、哪里是关键瓶颈、什么设计会踩坑,有非常具体的一手经验。

这种东西,很难靠文档完全写清楚,也不是看几篇论文就能补上的,它是多年实验、失败、重来后,逐步形成的一整套“直觉”和判断。

再看余家辉,他带的是感知团队,面对的是多模态这个近两年 AI 里最重要的方向之一。

让模型不仅能读文字,还能看图、听声音,听上去只是多了几种输入方式,技术层面却涉及数据对齐、延迟控制、不同模态的权重平衡、推理顺序等等。

他在 GPT-4o 上做的事情,本质上是在教模型在复杂感官信息下依然保持稳定逻辑,而这正是下一代 AI 工具争夺的核心卖点。

毕树超的经历很典型,属于在传统互联网巨头打磨了十几年产品和商业模型,再转到 AI 一线的人。

他在谷歌和 YouTube 做过广告算法、做过短视频产品,用多阶段深度学习模型去优化广告收益、用户停留时间,这些经验延伸到 AI 时代,就是怎么让大模型的能力变成高频应用场景,并且在真实用户流量下跑得稳。

到了 OpenAI 后,他又参与了 GPT-4o 的语音能力和小型模型的开发,这种跨产品、跨形态的能力,是很多只待在学术圈或者纯研究岗的人不具备的。

任泓宇则是典型的“后训练、演示”专家。他不只是在给模型调参数,而是在决定模型怎么回答问题、怎么表现风格、怎么在公开演示中把能力展示出来。

这类经验,是连接技术团队和公众认知的关键环节,也是商业化推进时的核心接口。

四个人拿出来,各个都是业内稀缺资源。但把他们放在同一个时间段,被同一家美国公司一口气挖走,这件事的味道就完全变了。

它不是简单补充人手,而是直接把一个成熟大模型公司里,从研发、工程、应用到展示的关键链条,复制了一条走到自家阵地里。

华人背景、受过中国理工教育或训练。这一点,美国公司不是没算过,他们非常清楚这样的组合意味着什么——扎实的数学功底、熟练的工程实现、长期高压环境下形成的执行力,叠加在一起,已经被证明是当前大模型时代最好用的工程人才。

Meta急着补课,一口气干到底

为什么是 Meta 出手?为什么是现在?

这个时间点,配合他们内部的产品进展,其实挺好理解的。

这两年,全球大模型层出不穷,大家聊得最多的名字绕来绕去也就那几家:OpenAI、Google、Anthropic,再加上中国这边的几家头部团队。

Meta 原本靠 Llama 系列在开源社区混得风生水起,但真要拿效果和节奏去对比,Llama 4 的表现确实没达到外界对“社交+广告巨头”那样的期待。

再加上其他公司一轮轮发布更强的多模态、语音、推理能力,Meta 如果再慢半拍,后面就不只是产品差距问题,而是开发者生态和应用落地都可能被甩开。

于是扎克伯格的选择很直接,既然起步慢了,那就别绕弯子,砸钱补课,从人到算力一起补。新成立的 Superintelligence Labs,就是在这种思路下搭起来的。

拉来做领导的,不是传统意义上的研究院院长,而是 Scale AI 的创始人,再加前 GitHub CEO、创业投资圈里名气不小的那几位,目的很明确——要做的不是论文,而是能在产品线上立刻打出效果的新一代基础模型。

为了撑起这套玩法,Meta 把大笔预算压在数据中心和 GPU 上。数百亿美元级别的投入,对于一家本就以重资产著称的公司来说,这已经不只是一笔技术升级,而是一次方向性押注。

再加上股市对 AI 题材的追捧,一段时间内 Meta 股价被推到新高,给了管理层更大动作的资本空间。

在这种背景下,一周挖走四位关键工程师,就不难理解了。对于 Meta 来说,时间是最贵的成本。

算力可以用钱堆,机房可以请工程公司连夜赶工,但真正熟悉大模型全栈、能在短时间内把团队拉到战斗状态的人,不是随便在简历市场上能捞到的。

越是起步阶段,越需要这种“到岗即能开工”的角色。

更重要的一层,是这些人能迅速把以前积累的那一套经验迁移过来。

比如构建长上下文模型时,该怎么处理记忆开销;做多模态的时候,怎么在保持效果的前提下降低延迟;实时语音里,怎么处理网络抖动和响应延时带来的体验落差。

后训练阶段,安全策略和可用性之间怎么做权衡。这些都是纸面上看不出的门道,而他们已经在 OpenAI 那边帮着踩过不少坑。

这也是为什么 Meta 并不把这次高薪挖人包装成一次性“挖角秀”,而是刻意强调综合补偿、长期激励、参与核心模型路线设计等内容。

对公司来说,吸引这些人来,不只是一张签约奖金的账,而是把整个 Llama 5 甚至之后的路线,交给一批有过实战经验的总工程师来主导,把之前落下的那部分基础架构、工程体系和产品组合,尽量在一两年内追上去。

而从结果看,这种狠劲确实起到了一定作用。

几个月后,Meta 新版 AI 工具上线,性能指标拔高的不只是跑分,还有对话流畅度、多模态配合、语音实时性等体验层面的提升。

这些变化,很难只用多加 GPU 来解释,更像是组织结构调整、技术路线重构、人选到位多方面叠加的结果。

Meta 花的是实打实的巨额投入,换的却是减少试错次数、缩短路径、快速搭起完整团队的机会。

更有意思的是,这套策略对美国本土人才供给的信心其实不算高,反而把目光更多投向全球,尤其是那些从小在高强度理工环境里成长起来的工程师群体。

抢人战打到明面上,中国该怎么看?

无论是 Meta、还是芯片巨头英伟达,近一两年都在有针对性地布局中国背景的 AI 人才招募计划,尤其是面向那些在高校、顶级实验室、国内头部公司里已经证明过自己的一线研究者和工程师。

美国对中国技术的封锁并没有带来他们原本期待的效果,反而在看到 DeepSeek 这一类中国大模型的进展后,意识到再堵库、堵芯片,只能拖慢一部分节奏,很难从根子上抑制创新速度。

在这种情况下,挖人战就成了他们手里最现实的一张牌。直接从对手那里把能推动技术路线的人拿走,让对方团队变薄,让自己的团队变厚,这是非常直接粗暴但有效的办法。

硅谷内部已经不避讳谈这件事,只要是中国理工体系培养出来、对技术方向有影响力的核心人物,报价往往不会太吝啬。

从中国的角度来看,这既是挑战,也是很清晰的提醒。

挑战在于,如何在全球人才高度流动的今天,把更多顶级工程师和科学家的创造力留在本土,同时还能给他们足够宽广的舞台、足够公平的回报。

提醒在于,这次事件已经说明,中国的教育体系和科研土壤,确实有能力稳定培养出 AI 时代最重要的一批人才,而这些人正在被对手视为关键资产去争夺。

也就是说,我们并不是站在人才链条的末端,而是正在成为上游的重要来源。

在这个行业里,真正被疯狂抢夺的,不是会调一个现成 API,更不是做几个花哨 demo,而是在数学、工程实现、系统架构、产品落地之间,能形成一套完整能力闭环的人。

这次美国挖人,反而是一种另类的肯定。

它说明这条路是走通的,中国理工教育的硬度是被认可的,国内团队在模型、算法、算力调度、产品闭环上的综合实力,也已经进入了对方必须认真对待的层级。



参考资料:Meta连续两年削减股权激励 去年降10%今年降5% 同步翻倍AI资本支出并裁元宇宙1500岗

2026-02-21 04:26·金融界

由于平台规则,只有当您跟我有更多互动的时候,才会被认定为铁粉。如果您喜欢我的文章,可以点个“关注”,成为铁粉后能第一时间收到文章推送。

展开阅读全文

更新时间:2026-02-26

标签:科技   美国   年薪   中国   美元   人才   模型   团队   公司   理工   产品   工程师   能力

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight All Rights Reserved.
Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034844号

Top