昨天晚上 8 點,小鵬 1024 科技日如期舉行,核心主題有 4 個:
智能駕駛
智能交互
智能機器人
飛行汽車
我們最為關(guān)注的自然是「智能駕駛」,活動現(xiàn)場吳新宙博士直接給出了 XNGP 的推送時間。
G9 Max 版 XNGP 發(fā)布計劃:
2022 交付即有高速 NGP、記憶泊車等功能;
2023 上半年城市 NGP 發(fā)布,支持廣州、深圳,新增首發(fā)上海,全國范圍開放紅綠燈識別并直行通過路口的能力;
2023 下半年大部分無圖城市開放變道、超車、左右轉(zhuǎn)能力;
2024 全場景打通,實現(xiàn)從車位到車位的智能導航輔助駕駛能力。
P5 E 版 & P7 E 版 XPILOT 發(fā)布計劃:
2022-2023 上半年開放紅綠燈識別、車道級導航功能;
2023 下半年高速 NGP 策略優(yōu)化(限速調(diào)節(jié)、脫手檢測等)。
其中最大的亮點莫過于在 2023 年上半年會在 G9 Max 版本車型上推送城市 NGP,并且支持上海,這個時間點,相比同為新勢力的蔚來和理想則至少有超過 1 年以上的領(lǐng)先,以至于我在看完之后,真的有下單 G9 的沖動。
明確了接下來的迭代計劃,我們回到發(fā)布會,看看小鵬拿什么支撐接下來的更新計劃。
今年的發(fā)布會上,吳新宙博士提出的第一個問題就是:為什么要做難百倍以上的城市場景?
恰巧我們今年 9 月在社區(qū)中討論過這個問題,到底應該繼續(xù)打磨高速領(lǐng)航還是盡早上城市領(lǐng)航。
72 人參與,65% 支持繼續(xù)打磨高速領(lǐng)航,35% 支持盡早上城市領(lǐng)航。
活動現(xiàn)場吳新宙博士拋了一組數(shù)據(jù):
用戶用車里程中城市道路占比 71%
用戶用車時長城市道路占比 90%
途徑城市道路的用戶 100%
這個是用戶總用車場景的數(shù)據(jù)統(tǒng)計。
城區(qū)輔助駕駛周滲透率 84%
城市 NGP 里程滲透率 63%
通行效率相比人類駕駛員 90%
平均百公里被動接管次數(shù) 0.6 次
這是小鵬 P5 城市 NGP 推送之后產(chǎn)生的數(shù)據(jù),數(shù)據(jù)顯示每 100 km 可使用城市 NGP 的道路,就有 63 km 是城市 NGP 在工作。
顯然,城市場景就是用戶的高頻場景和剛需場景,但是為什么大家都希望繼續(xù)打磨高速領(lǐng)航功能?
從大部分用戶的評論中可以看出,大家在希望繼續(xù)打磨高速領(lǐng)航功能的核心原因在于預設了一個立場:因為城市場景過于復雜,現(xiàn)在的技術(shù)下城市領(lǐng)航一定不好用,所以不如去打磨高速領(lǐng)航。
在這種邏輯下,去打磨高速領(lǐng)航似乎是一個很合理舉動,但是再回頭看看上面這組數(shù)據(jù),并不是我們不需要,而是我們認為做不到。
而無論是特斯拉還是小鵬汽車,他們在決定去攻克城市場景的時候,目標必然是推出一個「好用的城市領(lǐng)航」功能。
也正是這種從終局思考問題的邏輯,才讓他們能夠正視困難,并且努力克服。
就像一條好走的路,和一條難走但正確的路,特斯拉和小鵬都選擇難走但正確的路。
至于這里的難度,吳新宙博士同樣給了一組相對量化的數(shù)據(jù):
城市 NGP 的代碼量是高速 NGP 的 6 倍;
城市 NGP 感知模型的數(shù)據(jù)是高速 NGP 的 4 倍;
預測/規(guī)劃/控制相關(guān)的代碼是高速 NGP 的 88 倍。
這還是在有高精地圖輔助情況的數(shù)據(jù)對比,而小鵬也明確表示,目標在明年下半年做到無圖城市開放道路的變道、超車、左右轉(zhuǎn)能力。
為了克服城市場景的各種刁鉆場景,小鵬從「感知」這個源頭開始解決問題。
在發(fā)布會上,吳新宙首次對外透露,在 G9 上小鵬將采用 XNet 全新一代感知架構(gòu)。
處理方式和特斯拉類似,均會將周身攝像頭的感知結(jié)果輸入 Transformer 神經(jīng)網(wǎng)絡,進行多幀時序前融合,輸出 BEV 視角下動態(tài)目標物的 4D 信息和靜態(tài)目標物的 3D 信息。
簡單來說就是,原來的技術(shù)框架下,相當于讓你通過多個只有模糊位置關(guān)聯(lián)的視角、通過多張類似于連環(huán)畫的圖片來感知周圍的世界,而且還要判斷周圍車輛的速度預測他們的行駛軌跡。
這樣的感知結(jié)果下,哪怕是讓一個老司機來判斷,也是十分困難的。
而現(xiàn)在的技術(shù)框架下,系統(tǒng)會直接輸出一個帶周圍車輛動態(tài)信息的上帝視角。
這樣操作帶來的好處是可以大幅提升靜態(tài)目標物的 3D 信息監(jiān)測的精度。用吳新宙的話來說就是:「這套感知架構(gòu)有實時產(chǎn)生高精地圖的能力!
更精準的動態(tài)目標物的 4D 信息,也意味著系統(tǒng)可以做到更強的變道能力和博弈能力。
當然這套強大的大模型神經(jīng)網(wǎng)絡也不是說有就有的。
活動現(xiàn)場吳新宙博士透露,強大的 XNet 背后,用了最新的 Transformer 網(wǎng)絡架構(gòu),為了順利部署這套大模型網(wǎng)絡,需要 50—100 萬的短視頻來進行訓練優(yōu)化,如果直接部署,不做優(yōu)化則需要吃掉超過一個 Orin-X 的算力。
但是,這些視頻中動態(tài)目標的數(shù)量是以億為單位,如果以人工的方式進行標注,這至少需要 2,000 個人 1 年的時間。
為了解決這個問題,小鵬的自動駕駛團隊開發(fā)了一套「自動標注系統(tǒng)」,把標注的時間壓縮到了 16.7 天。
然后是訓練。
今年 8 月小鵬汽車宣布在烏蘭察布建成中國最大的自動駕駛智算中心「扶搖」,用于自動駕駛模型訓練,算力達到 600 PFLOPS,效率相比原來提升了 602 倍。
接下來小鵬也會通過持續(xù)的「采集」、「標注」、「訓練」、「部署」來完善這套模型。
據(jù)吳新宙博士透露,目前小鵬有接近 10 萬輛用戶的車具備數(shù)據(jù)采集能力,并且在車端設置了超過 300 個觸發(fā)信號,系統(tǒng)可以判斷當前怎么樣的 Corner Case 是對系統(tǒng)有用的,然后進行上傳,采集的數(shù)據(jù)包括車外的動態(tài)、靜態(tài)物體,也包括全棧的數(shù)據(jù)。
最后,小鵬提出了一個新的概念「全場景輔助駕駛——XNGP」,相比現(xiàn)在的 XPilot,能力更強,覆蓋范圍更廣,小鵬汽車的目標是在無圖地區(qū)把城市 NGP 的體驗做到無限接近于有圖地區(qū)。
再回到「應該繼續(xù)打磨高速領(lǐng)航還是盡早上城市領(lǐng)航」這個話題,答案是顯而易見的,在現(xiàn)有技術(shù)路線下,雖然可以把城市導航輔助駕駛的體驗打磨到一個比較好的狀態(tài),但是注定做不到城市領(lǐng)航輔助。
如果拿造房子來比喻,你的目標是造一棟 100 層的摩天大樓,小鵬在做的是為了實現(xiàn) 100 層的高度,重構(gòu)可以支撐住的地基。
而還在打磨高速導航輔助駕駛的車企更像是在一個只能承載 3 層樓的地基,給這 3 層樓做了一個豪華的裝修,就算裝修得再好,仍然需要從地基開始重建。
今年 1024 的第二個重點是「全場景語音」。
在 2020 年小鵬汽車首次提出了全場景語音的概念,小鵬的目標是將語音打造成新的交互方式,可以做到平替物理按鍵的效果。
在 2020 年這套系統(tǒng)已經(jīng)做到了「可見即可說」、「連續(xù)對話」、「多音區(qū)對話」等等,這些功能的出現(xiàn)把車載語音從一個不可用的狀態(tài)拉到了一個可用的狀態(tài),推出之后也相繼成為了許多車企模仿的對象,而今年,小鵬希望把語音從「可用」變?yōu)椤负糜谩埂?/p>
關(guān)于這套系統(tǒng)我們已經(jīng)在之前的試駕中做過詳細的體驗,可以給出的明確結(jié)論是:這是目前能力最強的一套語音系統(tǒng),也必將再次成為行業(yè)里追隨的對象。
具體的亮點可以總結(jié)為以下 4 點。
免喚醒
無論是車上的語音助手還是智能家居的語音助手,對于社恐的人來說,最大的使用門檻就是「喚醒」,載著一車人的時候,或者家里來朋友的時候,喚醒語音助手這一下總有巨大的阻力。
但是語音助手就不能做到免喚醒嗎?
可以,但很難。
有喚醒詞的情況下,系統(tǒng)可以非常清晰地知道,你的接下來的這句話是對 ta 說的。
但是無喚醒詞的情況下,系統(tǒng)需要自己判斷你說的 10 句話中哪幾句是和副駕說的,哪幾句是和 ta 說的,這背后不僅需要系統(tǒng)具備出色的識別能力,更需要具備類似人類的語義判斷能力。
而在小鵬 G9 上,免喚醒語音支持全車 4 個座位。
多音區(qū)同時對話
在 2020 款理想 ONE 上我們第一次體驗到了多音區(qū)語音,但是受限于算力和技術(shù),理想 ONE 的多音區(qū)只可以做到 4 路識別,1 路執(zhí)行,說白了就是全車最多只能 1 個人使用語音。
而在 G9 上,小鵬做到了 4 路,車上的 4 個人可以同時向小 P 發(fā)出指令,并且小 P 會同時執(zhí)行 4 個指令,這種感覺就像小 P 有了 4 個分身。
快
小鵬官方給出的數(shù)據(jù)是喚醒到界面反饋 245 ms、到語音反饋 700 ms。
在傳統(tǒng)的語音助手上,乘客需要說完指令,系統(tǒng)才會進行識別,拿到識別的文本之后,再理解執(zhí)行。
在 G9 上,小鵬參考了人類的思考方式,⼩ P 可以⼀邊識別⽂本、⼀邊實時理解及查詢數(shù)據(jù),在乘客話剛說完⼀瞬間,所有理解已經(jīng)完成,這個就是流式理解。
這種邏輯下,交互的效率自然遠高于上一種。
沒網(wǎng)也能用
現(xiàn)有的語音助手所有的文本識別均需要通過網(wǎng)絡上傳到云端處理,所以在高速、隧道、地庫等網(wǎng)絡不好的環(huán)境下,語音則是一個完全不可用的狀態(tài)。
基于 8155 芯片更大算力,小鵬在 G9 上實現(xiàn)了邊緣計算,依靠車端的算力既可以識別并執(zhí)行用戶的指令。
用一句話總結(jié)這四點目標就是:降低人類的使用門檻。
看到 1024 發(fā)布會上小鵬城市 NGP 的規(guī)劃,我發(fā)了一條微博:「G9 Max 會在 2023 年上半年交付城市 NGP,首發(fā)城市有上海,就因為這個還挺想買 G9 的。」
隨后同事在評論區(qū)中寫到:「G9 的智能化非常有吸引力,但 G9 沒有!
仔細想想,雖然 G9 并不至于沒有吸引力,但是 G9 智能化的吸引力是大過于車的。
今年的 1024 是小鵬歷史上最硬核的一屆 1024,毫無疑問的是,小鵬的技術(shù)能力達到了一個全新的高度。
但比起往年,也是小鵬所處環(huán)境最復雜的一年,從最早的 G9 發(fā)布延期,到發(fā)布后的 SKU 調(diào)整,再到小鵬組織架構(gòu)的調(diào)整,每一個事件傳遞出來的都是小鵬在解決一個又一個的問題。
從悲觀的角度來看,小鵬現(xiàn)在確實存在很多問題,但是樂觀來看,當小鵬解決掉一個又一個問題之后,小鵬也在變得越來越好。
就輔助駕駛現(xiàn)在的硬件成本和研發(fā)支出,在這個階段必然需要一輛「貴」的車來承載。
從 G9 的配置來看是完全撐得起這個價格的,甚至可以說很有性價比,但是當價格超過 30 萬,品牌的段位是消費者很難忽視的一個點。
E_Mail:vip@gxqcw.com 電話:15077070808 地址:南寧市青秀區(qū)濱湖路48號南湖聚寶苑D區(qū)15樓 桂ICP備06004827號 經(jīng)營許可證編號:桂B(yǎng)2-20090044 |