智能座舱将走向智能体方向-电子工程世界

随着AI技术的快速发展，智能座舱的交互方式完成了多次演进。从最初单一的触控式交互、到简单的指令式交互、再进阶到复杂的语音交互，用户的使用频次也呈快速提升态势，从过去日均不到10次，提升到60多次。

“但日均交互次数是越多越好吗？”8月9日，在中国电动汽车百人会主办的“智能汽车产业生态发展路径”高端研讨会上，百度Apollo智舱业务部总经理李涛指出：“这可能因为车机没有真正满足用户需求。例如，用户在一天内和车对话100次，可能代表车机好用，也可能代表车机太笨拙，无法理解或预测用户需求，用户只能重复多次和车机对话。”

另外，李涛表示，目前车机的Pad化趋势非常严重，“把iPad或Android平板放在车机中央，并安装所有应用程序，这些程序都是用户真正需要的吗？”他认为，根据帕累托分布定律（即80/20原则），80%的功能很少会有人使用。过多的程序不仅意味着要增加用户理解和认知负担、占用宝贵车机资源，也意味着车厂需要付出大量成本。

那么，智能座舱应该向什么方向发展？大模型强大的语义理解、文本生成、逻辑推理和多模态等多种能力，又会为智舱带来哪些改变？百度Apollo做了哪些实践？李涛在演讲中一一给出答案。

百度Apollo智舱业务部总经理李涛

以下为他的演讲实录：

当前，我们处于AI与汽车深度融合的时代。我们先来看一下智能汽车的发展现状，用几组数据展示：在新能源车领域，L2智能驾驶的搭载率约40%左右，智能座舱装配率已经超过60%，预计今年将达到70%以上。另一方面，我们也看到一个趋势，即消费者对交互的满意度有所下降。这可能因为车机没有真正满足用户需求。

过去几年，座舱的控制方式经历了一些演变。最初通过精准指令控制实现，即说出A就是A，说出B就是B，没有泛化。后来出现了初步的泛化命令式交互，过去日均交互次数还在十次以下，现在有些车型上的语音日均交互次数已经达到了六十多次。行业里开始讨论，在向自然语言对话方向的演变过程中，日均交互次数是否还会增加。

但日均交互次数是越多越好吗？例如，用户在一天内和车对话100次，可能代表车机好用，但还有可能代表车机太笨拙，无法理解或预测用户的需求。因此，当用户需要什么时，他们只能重复多次和车辆对话。

另外，Pad化趋势非常严重。目前的实现方式是将iPad或Android平板安装在车机中央，并安装所有应用程序。这些程序都是用户真正需要的吗？过多的程序不仅意味着用户理解和认知负担的增加、宝贵车机资源的占用，也意味着车厂需要付出大量成本。这都在遵循帕累托分布，即80/20原则，80%的功能实际上很少有人使用。

在这种情况下，我们需要考虑，智能座舱最终会走向哪个方向。从大模型角度出发，我们认为智能座舱会走向智能体的方向，能够理解场景信息，很自然地了解用户需求，生成场景化的解决方案并完成执行。因此，我们推出Apollo超级座舱系列产品。它是一种智能体，能够实现全感融合、全局规划和全域执行的智能体。

用户希望车辆能够理解他们的需求、记录他们的习惯，并根据当前场景为他们提供最适合的车内环境或应用程序配置。这正是大模型最擅长的思想能力，即理解和记忆、逻辑和生成。我们有其他专业的模型分析架构。在这个框架中，可以让智舱自动理解、构建，并生成相应的模型。对于整车厂来说，这可以大大降低各种场景的适应成本，最终实现全域执行。我们也有一个底层的大模型，可以真正调度全车的能力，能够真正理解用户需求，并主动执行，为用户提供更好的体验。

我们在某些场景中取得了突破，例如将车内DMS、OMS和整个座舱语音结合起来。我们也采集了外部数据，如减速带预测、高速音乐内部播放以及多人检测等。比如在高速、开窗场景下，由于噪声过大，人声被淹没在噪声中，非常容易导致真实语音的检出困难，通过音&视频语音增强技术，高速、开窗场景下的语音检出成功率可提升至99%，这比普通车辆关闭窗户的情况还要好。