設置
  • 日夜間
    隨系統
    淺色
    深色
  • 主題色

自動(dòng)駕駛理論新突破登 Nature 子刊!清華、密歇根聯(lián)合提出三條技術(shù)路線(xiàn),劍指「稀疏度災難」

新智元 2024/6/26 18:23:31 責編:問(wèn)舟

近日,清華大學(xué)與密歇根大學(xué)聯(lián)合提出的自動(dòng)駕駛汽車(chē)安全性「稀疏度災難」問(wèn)題,發(fā)表在了頂刊《Nature Communications》上。

研究指出,安全攸關(guān)事件的稀疏性導致深度學(xué)習模型訓練難度大增,提出了密集學(xué)習、模型泛化改進(jìn)和車(chē)路協(xié)同等技術(shù)路線(xiàn)以應對挑戰。

隨著(zhù)自動(dòng)駕駛技術(shù)的快速發(fā)展,交通系統迎來(lái)了前所未有的變革。盡管自動(dòng)駕駛技術(shù)在過(guò)去二十年中取得了顯著(zhù)進(jìn)步,但 L4 級別自動(dòng)駕駛汽車(chē)尚未實(shí)現商業(yè)化,其主要原因是安全性能尚未達到大規模應用的要求。

自動(dòng)駕駛汽車(chē)(Autonomous Vehicle,AV)在真實(shí)道路上的測試已達數百萬(wàn)公里,但仍無(wú)法有效處理多種安全攸關(guān)事件,這些事件的概率分布呈現長(cháng)尾特征,稱(chēng)為自動(dòng)駕駛汽車(chē)安全性的長(cháng)尾挑戰(Long-Tail Challenge)。

然而,此問(wèn)題在已有文獻中尚未正式定義,這種理解的缺乏嚴重阻礙了解決這一問(wèn)題的進(jìn)程。

為此,清華大學(xué)助理教授封碩和密歇根大學(xué) Mcity 主任、講席教授劉向宏(Henry Liu)合作在國際上首次提出了自動(dòng)駕駛汽車(chē)安全性挑戰背后的關(guān)鍵科學(xué)問(wèn)題 —— 稀疏度災難(Curse of Rarity,CoR),該研究成果作為評論文章(Comment)發(fā)表在 Nature 子刊《Nature Communications》

論文鏈接:https://doi.org/ 10.1038 / s41467-024-49194-0
前序工作:https://www.tsinghua.edu.cn/ info / 1175/102314.htm

研究證明,隨著(zhù)安全攸關(guān)事件的稀疏度增加,深度學(xué)習梯度的估計方差會(huì )指數增加,使得模型訓練所需數據量和計算量指數增加,嚴重阻礙了模型在安全攸關(guān)任務(wù)的學(xué)習能力。

由于深度學(xué)習在自動(dòng)駕駛領(lǐng)域應用的廣泛性,稀疏度災難廣泛存在于自動(dòng)駕駛的感知、預測、決策、測試等安全攸關(guān)任務(wù)中,造成了自動(dòng)駕駛汽車(chē)的安全性挑戰。

在此基礎上,研究提出了三種解決稀疏度災難的技術(shù)路線(xiàn),包括使用安全攸關(guān)數據進(jìn)行密集學(xué)習、改善模型泛化和推理能力以及利用車(chē)路協(xié)同等技術(shù)降低安全風(fēng)險事件發(fā)生概率。

什么是稀疏度災難?

通俗地講,稀疏度災難是指真實(shí)駕駛環(huán)境高維空間中的安全攸關(guān)事件(Safety-critical Events)的發(fā)生概率極低,導致車(chē)輛駕駛數據中包含的安全攸關(guān)事件的信息極端稀疏,安全攸關(guān)事件的信息被大量的常規駕駛數據所掩蓋,導致深度學(xué)習模型難以對這些安全攸關(guān)事件進(jìn)行學(xué)習。

更糟糕的是,自動(dòng)駕駛汽車(chē)更好的安全性能也意味著(zhù)安全攸關(guān)事件的發(fā)生頻率進(jìn)一步降低,導致深度學(xué)習模型更加難以對安全攸關(guān)事件進(jìn)行學(xué)習。

理論上分析,稀疏度災難是指深度學(xué)習的梯度方差隨著(zhù)安全攸關(guān)事件的稀疏度增加而指數增加,導致深度學(xué)習所需數據和計算量相應指數增加。

深度學(xué)習的關(guān)鍵在于獲得神經(jīng)網(wǎng)絡(luò )的最優(yōu)參數,梯度下降方法在每個(gè)訓練步使用一批數據來(lái)估計損失函數的梯度,然而隨著(zhù)安全攸關(guān)事件稀疏度的增加,梯度估計的方差可能會(huì )呈指數增長(cháng),導致稀疏度災難。

圖 1 深度學(xué)習模型的稀疏度災難示意圖。

稀疏度災難給自動(dòng)駕駛帶來(lái)哪些挑戰?

由于深度學(xué)習方法在自動(dòng)駕駛領(lǐng)域應用的廣泛性,稀疏度災難廣泛存在于自動(dòng)駕駛的感知、預測、決策、測試等安全攸關(guān)任務(wù)中,導致自動(dòng)駕駛汽車(chē)面臨安全性挑戰。

1. 感知

自動(dòng)駕駛的感知任務(wù)是從周?chē)h(huán)境中獲取信息并提取相關(guān)知識。在這一任務(wù)中,不少研究者討論了數據不平衡的問(wèn)題,即只有一小部分的數據類(lèi)別具有大量樣本,而其他類(lèi)別只有非常少的樣本。

然而,對于自動(dòng)駕駛汽車(chē)的安全攸關(guān)感知任務(wù)來(lái)說(shuō),不平衡比(Imbalance Ratio)往往極高(例如,可能達到),而現有的方法,如類(lèi)再平衡、信息增強 - 和模塊改進(jìn)等方法,往往不足以解決這一問(wèn)題,因為它們只能處理有限的不平衡比(通常小于)。

不平衡比的這種數量級上的顯著(zhù)差異導致不平衡數據的問(wèn)題轉變?yōu)橄∈瓒葹碾y的問(wèn)題。此外,即使每個(gè)感知錯誤看起來(lái)都微不足道,一系列感知錯誤的累積效應將會(huì )十分危險。

例如,單幀的對象分類(lèi)錯誤可能不是什么問(wèn)題,而連續多幀的分類(lèi)錯誤則可能導致安全攸關(guān)事件發(fā)生,這種序列的發(fā)生概率遠低于任何單個(gè)錯誤的發(fā)生概率,因此稀疏度災難的問(wèn)題會(huì )更加嚴重。

2. 預測

自動(dòng)駕駛汽車(chē)的高安全性能要求需要對周?chē)煌▍⑴c者的行為進(jìn)行精確的建模和準確的預測。在安全攸關(guān)場(chǎng)景下,即使是預測中的微小錯誤也是不可接受的。

例如,在亂穿馬路的情況下,行人軌跡的精確預測對于自動(dòng)駕駛汽車(chē)避免碰撞至關(guān)重要。一個(gè)小的預測誤差可能會(huì )導致誤報或漏報,讓自動(dòng)駕駛汽車(chē)的駕駛決策過(guò)于謹慎或過(guò)于自信,從而導致事故。

同樣的,駕駛行為仿真中的不準確性可能導致低估或高估自動(dòng)駕駛汽車(chē)的安全性能,從而誤導自動(dòng)駕駛汽車(chē)的研發(fā)過(guò)程。

3. 決策

深度模仿學(xué)習和深度強化學(xué)習等深度學(xué)習技術(shù)已被應用于自動(dòng)駕駛汽車(chē)的決策過(guò)程。然而,當涉及到安全攸關(guān)場(chǎng)景時(shí),由于缺乏真實(shí)世界的數據,深度學(xué)習模型可能會(huì )受到稀疏度災難的影響。

這種稀疏性導致策略梯度估計方差較大,阻礙深度學(xué)習進(jìn)行有效學(xué)習。另一類(lèi)確保決策安全的方法則基于一系列假設。

典型假設包括可獲得自動(dòng)駕駛汽車(chē)的系統模型,其特征可能是是有界的未知動(dòng)力學(xué)和噪聲。但是由于存在稀疏度災難問(wèn)題,當遇到高維駕駛環(huán)境中的安全攸關(guān)事件時(shí),這些假設往往難以保證。

4. 測試

自動(dòng)駕駛汽車(chē)安全性的測試評估對自動(dòng)駕駛汽車(chē)的廣泛部署至關(guān)重要?,F階段通常將仿真測試、封閉場(chǎng)地測試和道路測試相結合,在自然駕駛環(huán)境中測試自動(dòng)駕駛汽車(chē)。然而,由于稀疏度災難,評估自動(dòng)駕駛汽車(chē)的安全性往往需要數十億英里。

為了加速這一過(guò)程,研究者提出了多種方法,如基于場(chǎng)景測試方法,這些方法側重于在定制化生成的場(chǎng)景中測試自動(dòng)駕駛汽車(chē)。然而,稀疏度災難給生成時(shí)空復雜的安全攸關(guān)場(chǎng)景帶來(lái)了嚴峻的挑戰。

例如,由于生成復雜安全攸關(guān)場(chǎng)景時(shí)的較大方差,基于重要性采樣的方法可能會(huì )出現嚴重的低效性,因此許多現有方法僅限于處理具有有限動(dòng)態(tài)對象的短場(chǎng)景片段,有較強的時(shí)空局限性,無(wú)法捕捉真實(shí)世界安全攸關(guān)事件的全部復雜性和隨機性。

如何解決稀疏度災難?

針對自動(dòng)駕駛汽車(chē)的稀疏度災難,研究給出了給出三種可能的技術(shù)路線(xiàn),三種技術(shù)路線(xiàn)可以互相補充。

路線(xiàn) 1:使用更多安全攸關(guān)事件數據進(jìn)行有效訓練

第一條技術(shù)路線(xiàn)從數據入手,旨在通過(guò)更好地利用額外數據來(lái)不斷提升對安全攸關(guān)事件的 - 處理能力。

一種思路是只利用與安全攸關(guān)事件相關(guān)的數據進(jìn)行密集學(xué)習(Dense Learning),這可以顯著(zhù)降低估計方差,證明過(guò)程可以參考文章方法部分的定理 1。

隨之而來(lái)的一個(gè)問(wèn)題是,如何定義并識別安全攸關(guān)事件?這一問(wèn)題極具挑戰性,因為安全攸關(guān)事件依賴(lài)于特定問(wèn)題的目標函數,并且受到駕駛環(huán)境時(shí)空復雜性的影響。

更重要的是,目前仍缺乏能夠指導安全攸關(guān)事件數據利用的相關(guān)理論。針對自動(dòng)駕駛汽車(chē)的安全性驗證,作者之前的工作已經(jīng)嘗試通過(guò)開(kāi)發(fā)密集深度強化學(xué)習方法 (Dense Deep Reinforcement Learning, D2RL) 來(lái)解決稀疏度災難問(wèn)題。

理論和實(shí)驗結果表明,密集深度強化學(xué)習方法可以顯著(zhù)降低策略梯度估計的方差,這是解決稀疏度災難的關(guān)鍵一步。

另一個(gè)問(wèn)題是如何收集或生成更多稀疏的事件數據。特斯拉提出了影子模式測試(Shadow Mode Testing)的概念,通過(guò)比較人類(lèi)駕駛和自動(dòng)駕駛的行為來(lái)識別稀疏事件,但文獻中沒(méi)有給出具體細節。除了從自然駕駛環(huán)境中收集數據外,還可以采用各種數據增強方法來(lái)生成安全攸關(guān)場(chǎng)景。

路線(xiàn) 2:改善模型泛化和推理能力

第二條技術(shù)路線(xiàn)則聚焦提高機器學(xué)習模型的 - 泛化和推理能力。直覺(jué)上,人類(lèi)可以通過(guò)有限的駕駛經(jīng)驗(通常不到一百小時(shí)的訓練)掌握駕駛技術(shù),未來(lái)的自動(dòng)駕駛汽車(chē)也可能在不依賴(lài)大量特定任務(wù)數據的情況下克服稀疏度災難。

這需要自動(dòng)駕駛汽車(chē)同時(shí)具備自下而上的推理(感知數據驅動(dòng))和自上而下的推理(認知-期望驅動(dòng))能力,來(lái)彌合數據中沒(méi)有的信息差距。

這些要求符合通用人工智能 AGI 的發(fā)展。近年來(lái),語(yǔ)言大模型和視覺(jué)語(yǔ)言模型等基礎模型通過(guò)采用全監督微調、上下文學(xué)習和思維鏈等技術(shù),在自然語(yǔ)言處理、視覺(jué)理解和推理方面表現出了顯著(zhù)的泛化和推理能力。

盡管目前仍有幻覺(jué)等問(wèn)題需進(jìn)一步研究,語(yǔ)言大模型和視覺(jué)語(yǔ)言模型通過(guò)利用廣泛的數據,為實(shí)現自上而下的 - 推理進(jìn)而解決稀疏度災難問(wèn)題提供了可能的技術(shù)路線(xiàn)。

路線(xiàn) 3:降低安全攸關(guān)事件發(fā)生概率

第三條技術(shù)路線(xiàn)則通過(guò)降低安全攸關(guān)事件的發(fā)生概率來(lái)減輕稀疏度災難對自動(dòng)駕駛汽車(chē)的影響。

一種方法是將傳統的基于模型的方法與深度學(xué)習方法相結合以更好地發(fā)揮兩者的優(yōu)勢,例如,形式化方法(Formal Methods)基于抽象模型來(lái)防止自動(dòng)駕駛汽車(chē)的不安全行為。當然,如相關(guān)文獻所述,想要充分利用形式化驗證方法的潛力,仍需要解決多種挑戰。

另一種方法是通過(guò)利用車(chē)路協(xié)同等技術(shù),基于基礎設施的傳感器或協(xié)同感知來(lái)增強態(tài)勢感知 -,幫助自動(dòng)駕駛汽車(chē)克服其自身車(chē)載傳感器的局限性。

例如,通過(guò)車(chē)載人工智能實(shí)現 4-5 個(gè) 9 的安全可靠性,通過(guò)車(chē)路協(xié)同等技術(shù)再實(shí)現 1-2 個(gè) 9 的安全可靠性,使得系統整體安全性達到大規模落地應用要求。然而,如何有效利用這些額外信息來(lái)提高性能仍然是一項具有挑戰性的任務(wù),特別是在安全攸關(guān)場(chǎng)景中。

參考資料:

  • https://doi.org/10.1038/s41467-024-49194-0

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時(shí)間,結果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

軟媒旗下網(wǎng)站: IT之家 辣品 - 超值導購,優(yōu)惠券 最會(huì )買(mǎi) - 返利返現優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 魔方 酷點(diǎn)桌面 Win7優(yōu)化大師 Win10優(yōu)化大師 軟媒手機APP應用