ChatGPT 改造汽车的序幕已经拉开,奔驰率先出手。
不久前,梅赛德斯– 奔驰将ChatGPT 整合到了车机上,开启了为期三个月的测试,结果显示,它的语音助手不仅可以完成简单地指令,还能进行连续多轮对话,理解能力和响应质量都有较大提升。
用前端的GPT 能力让车机智能化程度更上一层楼。车机也彻底从最初的「收音机」 变成了功能丰富的智能终端,加上GPT 「大脑」 后,又开始从木讷、鸡肋的机器向行车伙伴转变。
而人车互动不是AI 上车的尽头,自动驾驶才是未来。以往的自动驾驶解决方案过于依赖高精地图,一旦地图更新跟不上瞬息万变的路况,行车安全将受到威胁。AI 大模型的进化升级,让车企们看到了机会。
让AI 主动感知和决策,放弃对高精地图的依赖,正在成为一种主流趋势。几天前,理想汽车开启城市NOA(导航辅助驾驶)内测,它将BEV(Bird’s eye view,鸟瞰图)大模型作为主要解决方案,让汽车模仿人类「脑回路」 驾车。通过连续学习,城市NOA 还能被训练成使用者通勤路线上「代驾」。
接棒网际网路,AI 正在对汽车进行更深层次的改造,四个轮子的大家伙越来越神似变形金刚。
车机+ GPT 奔驰先出手
一场由内而外的「变形记」 正在席卷汽车圈,从传统燃油动力到新能源,从驾驶工具到智能化产品。多年以来,科技驱使下,汽车不断变幻着外貌和内在,网际网路改造汽车后,人工智能又来了。
梅赛德斯– 奔驰在这股新浪潮中一马当先,要把ChatGPT 移植进车机。
6 月16 日,奔驰为期3 个月的ChatGPT 测试计划在美国启动,它与微软合作,通过 Azure OpenAI 服务将ChatGPT 整合到车机中。车主可以通过Mercedes me APP 选择使用ChatGPT,还有更直观测试方式—— 直接在车内使用语音命令「Hey Mercedes,我想加入测试计划」,奔驰的MBUX 资讯娱乐系统就会将语音助手「Hey Mercedes」 自动接入ChatGPT。
过往,Hey Mercedes 可以提供体育、天气等资讯,并回答有关车辆周围环境的问题,还能控制使用者的智能家居,这都是制式化的。ChatGPT 加入把问答变灵活了,使用者能询问目的地详细资讯,获得晚餐建议,可以不断提出问题,连续收到回覆。这是ChatGPT 的看家本领。
当前,仅在美国地区约90 万辆配备MBUX 的奔驰汽车可以优先测试ChatGPT,奔驰打算利用这个初始测试期深入了解使用者提出的请求,来确定未来开发的优先事项,以及调整不同市场和语言的推出策略。
关于接入ChatGPT 这事儿,奔驰给了一个充满感性的宣告,「一切目标都围绕着重新定义您与梅赛德斯的关系。」 奔驰要让ChatGPT 重塑人车互动体验,更形象的类比是,车机从一个木讷的注重功能性的机器「活」 起来了,向着车内生活伙伴的角色转变。
奔驰之后,国内的汽车厂商率先跟上。
6 月19 日,理想汽车推出了自研的认知大模型「Mind GPT」,这个大模型由理想的空间演算法团队研发。据说大模型训练的开始日期早在ChatGPT 释出之前,Mind GPT 基于数10 TB 的原始训练资料,使用了1.3 兆个Token 进行基座模型训练,能识别声纹和语音内容,还能听懂方言,同时能为车主提供出行规划,甚至具备AI 绘画和AI 计算等功能。
理想透露,Mind GPT 释出后,理想汽车将新增LUI(使用者语言介面)互动方式,「比如你想吃个火锅,只需要呼叫理想同学,车机介面就会生成火锅的图片供你选择,随后自动算好出行路线。」
创维汽车也在近日宣布,旗下两款车型创维EV6Ⅱ 及创维HT-iⅡ 在智能车机上集成了ChatGPT,此外,长城汽车、蔚来汽车、小鹏汽车、奇瑞汽车四家车企都在上个月申请了GPT 相关商标。
GPT 上车成为一股潮流。奥纬咨询董事合伙人张君毅认为,GPT 技术的接入能够提升车的人机互动能力和综合环境问题的互动能力。今后车企在同一价位段的硬体方面的品牌差异会越来越小,当舒适性、安全性、动力和续航里程上竞争难以产生太大的差异时,卷智能就成了必然选择。
给智能座舱装上「大脑」
ChatGPT 上车又是汽车进化史上可书的一笔,最前端的自然语言处理大模型应用到了人类的出行工具上,更丰富的车内生活体验将会出现。
回望30 多年前,车载娱乐功能和车机智能化,尚是一片空白。第一代车机诞生于上世纪80-90 年代,当时人们普遍的关注点还是汽车的发动机、底盘和变速箱「三大件」,突然有一些车型不仅能听收音机,还能吞进磁带,自由播放音乐,汽车有了一些第二生活空间的影子。
第二代车机则加入了DVD 播放、MP3,娱乐性凸显的同时,汽车又向驾驶体验迈了一步,加入了车载导航。此时,解决「路盲」 问题成为一个主流趋势。许多老司机一定记得,在没有车联网的时代,凯立德车载导航成了高阶车型的标配,它使用GPS 卫星定位和存在车机里的地图包资料,实现相对准确的导航精度。
但除了导航和听歌、收音之外,当时的人们并不对车机抱有太多期待,车机也往往不是决定购车与否的主要因素。
进入21 世纪,电子数码技术不断发展,手机的形态先变了。循着这个进化思路,车机上出现大屏,智能化成为新卖点。基于linux、WinCE、安卓等系统的车机陆续被汽车厂商采用,而后汽车不仅可以免费即时导航,还具备全景可视系统、汽车驾驶辅助系统,比如360 度影像等。
当汽车连了网,一切由变得更不一样。线上观影、路书、语音控制、预约保养、远端诊断等功能被加入车机,中控台的萤幕越来越大,功能越来越多,一些厂商直接在驾驶室装上了比平板电脑还大的显示屏,甚至厂商们近来卷起了「全面屏」,就连副驾和后排都要装上萤幕。
终于,「第三块屏」 的概念越来越显眼,主机厂们希望,车机能够成为继电脑和手机之后,影响人类生活的第三代智能终端。用富含科技感的车机占领使用者心智,拓展更多的商业模式,成为现在的车企们攻坚的方向。
现在,「车机」 这一原始概念逐渐被「智能座舱」 所替代。蔚来甚至造出了「第二起居室」 的新词,不仅车机越来越智能化,车企们开始卷内饰用料、音响系统、灯光系统,蔚来还发布了一款AR 眼镜,支援随车巨幕观影;理想L9 甚至配备了一个后排冰箱,让汽车成了可移动的房子。
但無論是車機還是智能座艙,語音對話一直都是發展相對滯後的功能,考慮到駕駛安全性,語音操控又十分必要。
過去近十年來,幾乎所有車企和大量的 AI 創業公司,在自然語言處理領域投入頗多,希望優化車內的語音互動體驗。許多車機都能回答簡單的預設命令,比如調高溫度、預報天氣等,升級和創新圍繞拓寬自然語言口令展開,比如當用戶說 「有點熱」 後,車機可以開啟空調製冷或調低溫度。
但想讓車機聽懂更多 「人話」,比如用各種方言規劃路線、甚至找餐館,可能還真不如車主自己用手機地圖和大眾點評來得有效,更豐富的語音式人車互動陷入瓶頸,直到 ChatGPT 出現。
自然語言大模型產品(ChatGPT、文心一言、通義千問等)直接開放給 C 端使用,使智能座艙的開發者們看到了曙光。強大的理解能力和邏輯推理能力,有望讓車機成為行車助手,暗藏商業可能。
比如,車主可以告訴語音助手,「幫我找出目的地附近有團購優惠、評分超過 4.5 的火鍋店,一會有 5 個人用餐,給我預定一下位置,再看一下哪裡停車方便。」 放在以前,車機絕對無法一次性理解如此多的資訊,但對 ChatGPT 來說,這只是它的基操,只要即時資料來源足夠多,需求被滿足的可能效能夠無限大。
GPT 的加入並不只是讓對話更流暢了,而是讓車機具有了 「大腦」,不僅能回答問題,還能理解需求並生成答覆。至於智商有多高、反應有多快,取決於汽車廠商對上車大模型的訓練能力,以及敢不敢 「氪」 金上更牛的硬體(芯片)。
AI 如何让自动驾驶「脑回路」 更像人?
車內生活的豐富,讓汽車逐漸成長為一個充滿溫情的載體,它不再是枯燥、冰冷的代步工具,轉而成為一個舒適的生活空間。
而 AI 主導的汽車進化還不止於 GPT 上車,它對自動駕駛的技術推動更加意義重大。
傳統的自動駕駛研究方法是通過採集大規模的駕駛資料、測試更長的駕駛里程來覆蓋所有可能的駕駛場景,以確保發生突發狀況時汽車有預先設定的應對方案。但突發狀況的複雜程度往往難以預料,一旦系統中沒有應對某種特殊突發狀況的預案,駕駛安全就將受到極大的威脅。
这也是为什么当前的辅助驾驶系统,必须要求驾驶员手扶方向盘以应对即时突发情况。而AI 的学习能力将有可能改变这个现状。
不久前,清华大学研究团队提出了自动驾驶「可信持续进化」 技术,该技术是基于动态评估AI 的可信赖程度进行学习训练,保证自动驾驶汽车在遇到陌生新场景时,其驾驶能力可从基础性的主动避让开始持续提升,在确保安全前提下达到更好的驾驶表现。
简单理解,利用AI,自动驾驶功能的汽车能主动学习、熟悉各种新遇到的场景,进行持续进化,随着驾驶里程与资料量的累积,效能得到持续提升。
理想汽车正将AI 大模型用到自动驾驶领域。6 月17 日,理想宣布开启城市NOA(导航辅助驾驶)内测,并将在下半年向用户开放通勤NOA 功能。与常规解决方案不同的是,理想采用了BEV(Bird’s eye view,鸟瞰图)大模型,来即时感知和理解环境中的道路结构资讯,让汽车更能模仿人类驾驶员的操作习惯。
以往多数汽车上的辅助驾驶系统,大多是采用高精地图方案,相当于即时把路况投喂给自动驾驶系统,让其做出决策。但在复杂的城市道路中,总会有高精地图无法覆盖和无法及时更新的区域,这成为了该方案的一大缺点。而采用BEV 大模型后,相当于AI 主动感知即时路况,自主决策驾驶操作。
当然,BEV 也有缺点,例如在一些跨度较大的路口,通行车辆较多,感测器视野容易被遮挡,导致车端即时感知的结果会丢失区域性的资讯。为了弥补这一不足,理想据称搭配了神经先验网路(NeuralPriorNet,简称NPN)和端到端的讯号灯意图网路,前者的作用相当于每当车走过自动驾驶车队走过的路口,都有影象参考;后者则是学习大量人类司机在路口对于讯号灯变化的反应,帮助自动驾驶系统理解交通讯号。
根据实际的测试回馈,理想城市NOA 还不能够完全实现自动驾驶,它存在转弯不够及时和不擅长超车的问题,此外,面对一些特殊障碍物,演算法无法做出决策,必须进行人工接管。
不过,相比于传统的训练方式,大模型的引入最大的改变还是让自动驾驶系统有了更强的学习能力,这意味着自动驾驶能力会逐渐提升。典型的案例是,理想汽车推出了通勤NOA 功能,在开启该功能之前,车主需要先设定通勤路线,通过日常通勤时的自动化训练积累NPN 特征,大约1 至3 周时间后,AI 可以成长为通勤路段的「代驾」。
这个过程体现了AI 大模型加持下的自动驾驶汽车操作思路:先学习和熟悉路况,再进行辅助驾驶,「脑回路」 更像人类了。
用AI 大模型研发自动驾驶鼻祖不是理想,而是特斯拉。早在2021 年,特斯拉就曾推出基于Transformer 架构的BEV 感知方案,随后华为、百度等企业也在「BEV+Transformer」 上展开布局,目前,特斯拉、小鹏汽车、问界汽车等都在落地和不断优化类「城市NOA」 功能。
大模型的持续进化,很可能让车企们找到了自动驾驶技术的突破方向,摆脱对高精度地图的依赖是第一步。现在的自动驾驶还停留在「辅助驾驶」 阶段,未来,你很有可能会将你的交给AI 接管。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun239996.html