理想汽车发布 VLA 司机大模型,引领智能驾驶新变革

2025 年 5 月 7 日,理想汽车举办 “理想 AI Talk 第二季 —— 理想 VLA 司机大模型,从动物进化到人类” 活动。理想汽车董事长兼 CEO 李想在活动中分享了人工智能的前沿思考,详细介绍了 VLA 司机大模型的创新突破、训练方法,以及理想汽车在技术研发与企业成长方面的战略布局,展现出理想汽车在智能驾驶领域的领先探索。

李想对 AI 工具进行了创新性分层,即信息工具、辅助工具和生产工具。当前多数人仅将 AI 当作获取信息的工具,其存在大量无效内容,价值有限。辅助驾驶虽提升了效率,但仍需人类参与。而李想认为,只有当 AI 进化为生产工具,能独立完成专业任务时,才会迎来真正的爆发。VLA 司机大模型便是理想汽车在交通领域打造的专业生产工具,致力于让 AI 成为像人类司机一样可靠的 “驾驶伙伴”。

VLA 的发展历经三个阶段,模拟了生物智能进化的过程。早期,理想汽车依赖规则算法和高精地图的辅助驾驶技术,如同 “昆虫动物智能”,按既定规则行事。2023 - 2024 年,端到端 + VLM 辅助驾驶技术出现,接近 “哺乳动物智能”,能处理更复杂情况,但端到端模型在复杂问题处理和与人类沟通上存在局限,VLM 基于开源模型,在交通领域的能力也受限。2024 年起,理想汽车开启 VLA 研究,它融合 3D 和 2D 视觉,拥有完整的 “脑系统”,具备语言和思维链推理能力,真正踏入 “人类智能” 阶段,能像人类司机一样理解并执行驾驶任务。

VLA 的训练过程模拟人类学习驾驶的步骤,分为预训练、后训练和强化训练。预训练阶段,通过海量高清 2D 和 3D 视觉数据、交通语言语料及联合数据,训练出云端 VL 基座模型,再转化为车端高效运行的端侧模型,如同人类学习驾驶常识。后训练加入动作数据,让 VL 基座模型进化为 VLA 司机大模型,凭借短链条思维链和扩散模型预测能力,在复杂交通环境中具备实时博弈能力,类似人类在驾校学习实际驾驶技巧。强化训练旨在让模型更安全、舒适,通过基于人类反馈的强化学习实现安全对齐,在世界模型中训练提升舒适性,使模型最终符合人类驾驶习惯和价值观。

在实际应用中,VLA 司机大模型以 “司机 Agent(智能体)” 形态与用户交互,用户可通过自然语言与其沟通,简单指令由端侧 VLA 直接处理,复杂指令经云端 VL 基座模型解析后再处理,极大提升了交互的便捷性和智能化程度。

安全性和模型黑盒问题一直是 AI 发展的难题,理想汽车为此采取了有力措施。组建超 100 人的超级对齐团队,在强化训练中注入职业素养,确保模型像职业司机一样安全、规范驾驶。同时,打造真实、符合物理规律的世界模型,结合重建和生成路径,覆盖所有交通要素,利用仿真能力低成本、准确验证现实问题,有效破解模型黑盒难题。

理想汽车在技术研发上的深厚积累是 VLA 司机大模型成功的关键。从研究、研发到能力表达,再到业务价值转化,理想汽车扎实推进每个环节,尤其注重研究投入。例如,面对英伟达 Orin - X 芯片无法直接运行语言模型的难题,理想汽车自研底层推理引擎,实现芯片通过 INT4 量化运行 VLM,还凭借综合技术能力,让不同芯片运行同等规模的 VLA 司机大模型。此外,DeepSeek 的开源助力 VLA 语言能力研发提速,节省大量时间和成本,但理想汽车仍加大投入打造自研模型。同时,理想汽车开源自研的汽车操作系统 —— 理想星环 OS,回馈行业。

在企业成长与个人发展方面,李想分享了深刻见解。理想汽车即将迎来成立十周年,创业过程虽充满艰辛,但李想保持积极心态,将挑战视为成长机遇,使企业成长为行业领军者。他认为个人成长关键在于关注自我,接纳自身优缺点,用成长替代改变,同时强调亲密关系的重要性,家人和同事间的互补支撑能汇聚强大力量。

理想汽车凭借 VLA 司机大模型在智能驾驶领域迈出坚实步伐。在辅助驾驶发展的关键节点,理想汽车将继续以技术创新为驱动,挑战成长极限,为行业发展和用户体验创造更多价值,推动智能驾驶行业迈向新高度。

展开阅读全文

更新时间:2025-05-13

标签:科技   模型   司机   理想   智能   汽车   人类   能力   生产工具   基座   交通

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号

Top