作為緊隨風口的車企,自然也不能在大模型時代落后:7月31日,吉利預告了大模型技術;8月8日,廣汽推出“廣汽AI大模型平臺”;奇瑞也將發布自己的AI大模型……而在此之前,小鵬、理想、特斯拉都宣稱自己擁有“自動化數據閉環系統”,作為大模型的一種應用方向。
除此之外,平臺級公司,百度、阿里、騰訊、360、華為都推出了自己的大模型。上半年結束的時候,國內大模型已經達到80個以上。中美兩國的大模型數量占據了全球80%。在大模型如此火熱的今天,自動駕駛的落地也在加速,當然,也迎來了新的挑戰。
01
自動駕駛中的大模型
其實“模型”就是一段計算機程序,用來構建一個虛擬的神經網絡。和生物的神經網絡類似,只有刺激到一定程度,神經才會活躍。如果再強化刺激,就會輸出活動。這其實就是多段函數的表達。神經網絡模擬任意連續函數,也就成了可能。上世紀80年代之后,這些計算機概念就建立起來,并在自動駕駛上應用,但一直沒有大的突破。
其根本的原因在于參數量。這是ChatGPT火起來的重要原因。OpenAI公司發現,模型參數如果多到一定程度,系統智能(模型精度)就會極大提升,原理現在無法解釋,但已經有了一個詞匯來形容——“涌現”。多到什么程度呢?一般來說,至少要1億左右。當然,因為自然語言的信息密度高于圖像,所以ChatGPT-2的參數量達到15億個,而ChatGPT-3則達到1750億個,剛好和人類神經元數量級別差不多。
自動駕駛中的大模型更為復雜一些,被稱作為多模態大模型。作為一種可以處理多種不同類型數據的深度學習模型,它可以整合來自不同傳感器的數據,并根據這些數據做出決策。多模態大模型通常由多個分支組成,每個分支處理不同類型的數據,例如圖像、文本、聲音、視頻等。這些分支可以并行運行,并最終將結果合并以進行決策。與傳統的單模態模型相比,多模態大模型的優點在于它可以從多個數據源中獲得更豐富的信息,從而提高模型的性能和魯棒性。例如,在自動駕駛領域中,多模態大模型可以同時處理來自相機、激光雷達和毫米波雷達等多個傳感器的數據,以更全面地理解當前交通環境,并做出更準確的決策。
02
大模型如何顛覆自動駕駛?
具體而言,大模型如何部署在自動駕駛車輛上,又能部署在自動駕駛車輛的哪些模塊呢?
首先是自動駕駛的感知部分,眾所周知,自動駕駛的感知需要融合多個傳感器的輸入,從而完成數據的融合增強。在這個過程中,當傳感器的檢測結果沖突時,更加相信哪一方的結果便成了一大難題。而大模型的一大優勢是可以處理不同類型的數據之間的關系。例如,在自動駕駛中,相機可以提供道路和障礙物的圖像信息,激光雷達可以提供距離和深度信息,而毫米波雷達可以提供速度和方向信息。大模型可以將這些不同類型的數據融合在一起,以更全面和準確地理解駕駛環境。
其次,便是完成目標檢測任務中的自動標注和預標注。以前都是有監督學習(人工訓練),現在讓AI自我訓練,就需要先完成數據閉環。這就是為什么幾家新勢力說自己擁有“自動化數據標注系統”的原因,其實就是大模型的一個功能。而完整的數據閉環則囊括了數據采集、數據回流、數據處理、數據標注、模型訓練、測試驗證諸多環節。其中,“數據標注”是AI自我訓練的前提,也是AI訓練的成本節點。
所謂標注,就是給視頻或者圖像的關鍵信息點貼上標簽,以便讓系統認識并在實際操作中做針對性規劃。顯然,量產車采集的場景基本都是重復的,數據意義不大。專門采集車則比較貴(成本每天6000元-10000元)。重點是,如何盡量多地搜集到“長尾場景”,即不常遇見,但駕駛了很多次之后,每個人幾乎都會遇上的場景(占5%左右)。在大模型上線前,都是人工標注。1000幀的視頻數據,人工標注成本可能達到萬元。而大模型目前最有價值的部分,莫過于自動化數據標注,可能會節約上億元(取決于替代多少人標注數據)。
03
大模型時代,車企迎來全新挑戰
在大模型時代,由于模型參數量的巨大,所采集的數據也在飛速增長,如何應用好車企賴以生存的駕駛數據,并通過分布式系統來進行部署和訓練,最終如何應用在自動駕駛車輛上,都成了一大難題。
一般來說,數據閉環的工作現在已經分割給外包供應商、大模型平臺公司(也可以視為供應商)和車企分別來做。很少有車企能夠徹頭徹尾地自己部署基礎大模型,自己搞定應用層,自己設計預標注并實現數據閉環,再驅動算法更新。這即是L4的進化之路,它的技術復雜度要求車企與供應商充分融合式合作,而非傳統的供應商“交付”-主機廠應用。
車企過于看重價值鏈全盤掌握,強調全棧自研,可能會耽誤迭代進程。如果設計一種規則,比如基礎層大模型由平臺級公司設計,車企負責掌握標注規則,并將后續人工審核交給另外的第三方,拿回標注好的數據之后,自己進行訓練。通過任務拆解,讓自己處于自動駕駛價值鏈的核心地位。避免在關鍵技術上受制于人,也不用被迫接受由某個供應商提出軟硬一體的解決方案。
總而言之,大模型的興起又引起了掌握智能駕駛的新勢力的一場狂歡,作為筆者始終認為想要在L4級別的自動駕駛領域走到最后,必須是智駕、車身一起抓,特斯拉已經為后來者指明了方向,在大模型時代到來之際,也將拉開新勢力與傳統造車廠的進一步差距。
04
總結
在未來,汽車的終極形態必然是一個行走的智能終端,大模型的火熱也帶動了智駕在汽車上的部署落地,使得L4甚至更高級別的自動駕駛成為了可能。
縱然很多人認為corner case對于自動駕駛來說將成為約束其發展的阻礙,但隨著時間發展,采集到的極端場景數據越來越多,越來越全,總有一天可以讓大模型學習到所有的駕駛情況,而那時自動駕駛時代將真正到來,走在前列的智駕公司也將贏得先發優勢。