首页 / 雷锋网 / 正文

千里智驾RLM大模型,是智驾系统的下一条通路

雷锋网 2025-06-26 21:01:39

自AI领军人物印奇挂帅上任后,千里科技的动作受到了越来越多的外界关注。自2024年开始,千里科技启动了以AI+车为核心的战略转型。在智驾方面,今年3月,千里科技宣布与吉利、迈驰、路特斯等,共同投资设立智驾合资公司——重庆千里智驾有限公司。

千里智驾的设立,标志着千里科技正式进军智能驾驶领域。

6月23日,千里科技在重庆举办发布会,千里科技联席总裁王军、技术负责人杨沐亮相,面向 L2+级的智能辅助驾驶解决方案——千里智驾1.0也正式发布。另一方面,千里科技进一步披露了面向L3级、L4级别智驾方案的全景路线图。

根据规划,千里科技将在未来六个月内发布L3级别智驾方案——千里智驾2.0。在2026年下半年,计划推出面向Robotaxi场景的L4级智驾方案——千里智驾3.0。

就在这场发布会的前两天,特斯拉的自动驾驶出租车Robotaxi在得克萨斯州奥斯汀正式登场。特斯拉初步部署了约10辆Robotaxi。根据马斯克的口径,他希望年底前Robotaxi扩展至更多城市,2026年实现数百万辆特斯拉上路自动接单。可以说,千里科技3.0踩住了技术和商业的节奏,即避免了前期的巨额亏损,又可以在市场教育完善后拿出更好的“作品”。

进入AI时代,千里科技在智驾领域的版图正在逐步展开。

千里智驾1.0“发布即上车”,智驾产品路线图首次公开

千里科技最新发布的"千里智驾1.0"解决方案,分为基础版、专业版和旗舰版三大类别。这是一整套面向第三方整车厂商的智驾平台方案,将全面覆盖高、中、低端硬件配置,满足客户对于不同价位车型的多样化需求。

千里智驾1.0方案将最低标配100TOPS以上算力。其中,旗舰版方案搭载了高达700TOPS的行业顶级算力平台,可实现多场景自主决策与复杂交互、车位到车位等核心功能。

千里智驾RLM大模型,是智驾系统的下一条通路

今年3月,千里科技和吉利汽车集团基于深度技术合作,发布了千里浩瀚智驾系统。其中,千里浩瀚 H3、H5、H7 对应于此次发布的千里智驾1.0方案的三个版本。目前,千里智驾1.0解决方案已在客户多款车型上搭载,真正实现了“发布即上车”。 

据雷峰网(公众号:雷峰网)了解,千里智驾1.0方案将会在第三季度上车。第四季度,千里科技还将会向国家工信部申请L3的准入。

吉利是千里科技的大股东,而且千里科技也是率先与吉利共同发布智驾方案。这样紧密的合作关系不免让外界产生一种疑问:双方到底是一种什么关系?

对此,王军表示,吉利是千里科技的战略合作伙伴,并不只为吉利服务,而是一个提供全栈式解决方案的Tier1公司。因为与吉利合作,所以双方确定了千里浩瀚的方案名称。对于其他客户,千里同样可以合作推出名为“千里A”方案、“千里B”方案。

千里科技将自己的智能化战略归结为“一横一纵”:横向上,千里科技要做技术整合,集公司所有的产业资源,将各自独立的感知、规控和执行模块整合为大模型驱动的全栈端到端方案;纵向上,要做产品整合,将传感器、控制器、执行器等产品整合为全套系统。

因此,这就不意味着千里科技要全栈自研软硬件,而是选择产业链里最优秀、最好的产品,通过整体的解决方案给到客户。王军总结到,“千里科技的自身定位是“弱水三千,只取一瓢”,不会什么都做,但是会做最关键,也是最终能给客户带来核心价值的一部分。 ”

加入千里科技前,王军曾有很长一段时间在日韩等地工作的经验,因此也见证了日韩等大型Tier1随本国车企出海的案例。据雷峰网了解,在市场方面,今后千里科技还会与几家国内客户深度合作,同时也会积极拓展海外客户。“海外是更广阔的市场,我们作为一个零部件供应商,要跟随中国车企逐步走向海外,做B端大客户生意。”

联合研发千里智驾RLM大模型,多模态和强化学习范式行业领先

正如上文所说,千里智驾的成立是在今年,而一个现实情况是智能驾驶的发展已至下半场,地平线、华为、Momenta等方案供应商分占了大部分市场。摆在千里科技面前的问题是:如何突围,靠什么去打动主机厂客户?

王军认为,虽然现在涌现出了很多的智驾技术方案,但是从智能化走到AI化后,大家真正认可了“端到端+大模型”的发展方向。如果以这一方向为基准线,大家的转型和储备时间都不长,都在同一起跑线。

从2021年开始,作为旷视联创的杨沐及其代表的团队就投入大模型以及在自动驾驶领域落地的工作。杨沐表示,为什么千里科技从2021年开始投入智驾的研发,也是因为原先的技术路线已经到了一个转折期——从规则驱动开始走向数据驱动。

在这一转型过程中,VLM是一个关键的技术节点,起到了承上启下的作用。

最早的辅助驾驶采用模块化架构,由于感知、规划及执行系统相对独立,且每个步骤都要占用一定的计算时间,整体系统的响应较慢,信息也有损耗。后来,在特斯拉的带领下,端到端的概念兴起,通过喂养“人类驾驶行为”可以应对大部分泛化场景,但仍然很难解决从未遇到过或特别复杂的问题,这时候就需要VLM的配合。

VLM就像是一个外挂,是车辆的“副驾驶教练”,通过图像识别和语义分析理解复杂交通场景,并为自动驾驶系统提供决策支持。

举一个简单的例子:早期并不在智驾主流圈的理想,正是在2024年通过“端到端+VLM”的技术组合成功跻身第一梯队。这直接证明了在“AI+车”时代,原本的技术范式与行业格局已经被打破,VLM成为下一个抢占技术制高点的利器,这也是千里科技的核心竞争力所在。

千里科技的大模型合作伙伴是阶跃星辰。经过联合研发,千里科技基于阶跃星辰行业一流的多模态基础大模型底座、领先的强化学习范式,推出了全新的千里智驾RLM大模型。

在杨沐看来,前沿的大模型具备极高的能力上限,通过与阶跃星辰的深度技术合作,能将在大模型行业经过充分验证的能力快速迁移至智驾领域,从而推动智驾大模型的研发落地。

千里智驾RLM大模型,是智驾系统的下一条通路

千里智驾RLM大模型,全面覆盖基础大模型训练、智驾数据特训,以及强化学习三个密切相关的环节。

第一,在大模型预训练阶段,基于强大的多模态基础大模型,海量的、跨领域的数据积累带来了更好的数据生成能力,以及更强的通识性,从而大幅提升了智驾大模型的智力上限。

第二,在智驾数据特训阶段,利用驾驶场景的专用数据集,对基础模型进行特训和调优,以确保智驾系统能在车端较低算力条件下,仍能保持充分的泛化性。

第三,在强化学习阶段,通过设置奖励模型(reward model),降低对数据分布的强依赖,抑制不良驾驶行为的出现概率,并进一步降低了兜底规则接管的频率。

这三个环节就像是将一个儿童培养成“老司机”的过程:儿童具备认知世界的基础能力,通过眼、耳、鼻等“多模态传感器”接收外界信息;第二个阶段就是接受驾校教练的培训,学习交通法规、路面标志以及上路实践,最终拿到驾照;第三个阶段就是上路实习,通过规避剐蹭、急刹等极端场景的能力提升,最终成为一个能应对各种情况的“老司机”。

这三个环节中,最难的仍然是最后一个。例如,如何解决系统压实线的问题。有些团队的传统做法是将所有的上传数据清洗一遍,删除所有有压线行为的数据,这种做法耗时费力,也显得不AI。

千里智驾RLM大模型正是通过强化学习的方式,避免了上述方式的弊端,途径是奖励模型会提供更连续、泛化、更多维的奖励信息给到强化学习。简而言之,告诉智驾“什么是好的”,并以此让系统尽可能接近这些表现。这就有点类似于AlphaGo与AlphaZero,后者通过自我博弈和学习实现了比前者更强的泛化性能。另外,还有蔚来等车企通过设置“世界模型”,构建一个实时建模和反馈系统,帮助大模型突破过去“模仿学习”的窠臼,这也是一种可取的方法。

当然,从今年开始,业内正在推进VLA技术的落地应用。在一些业内人士的眼中,VLM是端到端1.0的一次技术优化,而真正的2.0换代升级是VLA。

与传统的视觉语言模型VLM相比,VLA的优势在于其不仅可以解析图像和文本信息,还能实现类人推理与全局理解。不过,VLA上车还面临一些难点,比如车端算力不足,理想车端双Orin-X芯片运行端到端+VLM算力已经比较吃紧。而VLA的模型结构更复杂,参数也会进一步扩大,对硬件算力和数据闭环的迭代能力要求就更高。

杨沐和王军都认为,千里科技正在通过VLM去实现业界所需要的VLA功能。

事实上,业内的研究成果也正在沿着这一方向前进。

2025年1月,来自清华、伯克利分校和上海姚期智研究院的论文“Improving Vision-Language-Action Model with Online Reinforcement Learning”,已成功地将VLM通过使用专家机器人数据集进行监督微调(SFT) 集成到低级机器人控制中,从而产生视觉-语言-动作 (VLA) 模型。

除了基于强化学习的智驾大模型,千里科技还发布了新一代以 AI Agent 为核心的智能座舱产品方案。该产品方案具备多模态融合的超自然交互、基于全融合地图的人机共驾、第三生活空间,以及端云一体的融合记忆等特性,旨在将座舱打造成一个“超级AI Agent”。 

据王军透露,千里科技将会在2025年Q4发布新一代智能座舱产品。

双线并行,积极卡位

从2025年开始,大规模普及的智驾浪潮将带动新一轮市场洗牌,两极分化的现象正在出现。

一类是向下的“智驾平权”类代表如比亚迪、吉利,将智驾成本卷到最低,强调覆盖率;一类是向上的“智驾理想”代表如理想、小鹏,要做难度更高、更接近于人类决策流程的智驾系统。目前,理想已开始研发下一代VLA智驾大模型,目标在今年下半年实现项目落地。吉利汽车和元戎启行也在积极推动VLA,各家都在比拼落地时间。

从这次发布会可以看到,千里科技的智驾方案涵盖了从低到高的各类智驾需求,并且在L3/L4的布局上也正在积极卡位。

2023年,印奇曾判断AI未来会沿两大方向演进:一是AIinDigital,以 ChatGPT为代表的技术,给数字世界带来新技术范式的迁移;二是AIinPhysical,以特斯拉为代表的企业,将AI技术引擎与硬件载体结合,产生自动驾驶、机器人等不同类型的智能机器,改造物理世界。

而千里科技延续了印奇所提的“软硬一体化”战略,这是其区别于其他很多AI公司的一个特征。千里科技的“AI+车”,既是软硬件一体的代表,也是未来AI乃至物理世界的一个丰富载体。

雷峰网原创文章,未经授权禁止转载。详情见转载须知