2026年3月,小鵬(HK9868)發(fā)布了自動駕駛世界模型(X-World)的技術(shù)報(bào)告,揭示了小鵬(HK9868)世界模型X-World的構(gòu)建與使用,并展示了這一技術(shù)在小鵬(HK9868)汽車自動駕駛中的實(shí)際使用價(jià)值。
近日,小鵬集團(tuán)(XPEV)世界模型技術(shù)再突破,發(fā)布了X-Cache技術(shù)報(bào)告。X-Cache 是面向少步自回歸世界模型的跨段塊級緩存。世界模型生成未來畫面時(shí),X-Cache 能在基本不犧牲畫質(zhì)的前提下,復(fù)用相鄰兩段畫面、同一去噪步驟的中間結(jié)果,大約減少七成的重復(fù)計(jì)算,對世界模型的去噪主干(DiT,Diffusion Transformer)實(shí)現(xiàn)最高約 2.7 倍的推理加速。
X-Cache“偷懶”但靠譜
利用物理世界連續(xù)性,實(shí)現(xiàn)跨畫面分塊復(fù)用
隨著自動駕駛進(jìn)入模型驅(qū)動階段,對現(xiàn)實(shí)世界的高還原度仿真成為自動駕駛模型不斷進(jìn)化的核心支撐?;谧曰貧w視頻擴(kuò)散的世界模型,雖具備高保真、多視角視頻的生成能力,但其推理成本與延遲仍是制約實(shí)時(shí)交互與大規(guī)模部署的瓶頸。小鵬(HK9868)使用更少的步驟來打磨出最接近現(xiàn)實(shí)世界的畫面(少步蒸餾技術(shù)),如果用傳統(tǒng)的加速方法,即,在每一次去噪步數(shù)之間識別是否相似、能否跳過,也是無法解決推理慢的問題。
X-Cache的核心思路來自于物理事實(shí):自動駕駛行車的畫面是連續(xù)的、順滑變化的。車在行駛過程中,上一幀的道路、路邊樹木、遠(yuǎn)處建筑和下一幀幾乎沒有變化;于是,X-Cache把視頻按時(shí)間切成一段段連續(xù)的「畫面段」,然后比較相鄰兩段片段在去噪網(wǎng)絡(luò)內(nèi)部同一層、同一去噪步上的中間特征相似度。若變化不大,就直接復(fù)用上一段算出來的中間結(jié)果,跳過整層計(jì)算。這就是X-Cache的跨塊緩存邏輯。
簡單來說,X-Cache不依賴“步數(shù)”維度(在少步蒸餾模型中已無冗余可挖),而是沿著“連續(xù)生成的畫面段”這一新維度進(jìn)行優(yōu)化。
X-Cache總體架構(gòu)示意圖
為了保障跨塊復(fù)用的準(zhǔn)確性,X-Cache會生成一個(gè)“指紋”:除了結(jié)合畫面結(jié)構(gòu),也會結(jié)合駕駛動作(如:猛打方向盤)來判斷現(xiàn)在的路況和剛才的路況像不像,更聰明的進(jìn)行復(fù)用;同時(shí),X-Cache也具備“保命機(jī)制”,在車輛轉(zhuǎn)彎、變道、紅綠燈切換等場景突變的關(guān)鍵時(shí)刻(KV更新幀),強(qiáng)制要求全量計(jì)算,防止錯(cuò)誤累積導(dǎo)致的畫面崩損。
由此,X-Cache在不犧牲生成質(zhì)量的前提下顯著提升世界模型的推理效率,為高并發(fā)、高頻調(diào)用場景中的應(yīng)用提供了解法。
X-Cache是聰明、即插即用的小工具
推動世界模型無損加速
X-Cache 是一段無需訓(xùn)練的控制邏輯,緩存內(nèi)容隨生成實(shí)時(shí)刷新,相比模型本身的參數(shù)量,開銷可控。
不同于停留在實(shí)驗(yàn)驗(yàn)證階段的方案,X-Cache這個(gè)聰明的小工具已在小鵬(HK9868)自動駕駛世界模型X-World中成功得到應(yīng)用,并在城市、高速等多類復(fù)雜場景中穩(wěn)定運(yùn)行。通過跨分塊計(jì)算復(fù)用,實(shí)現(xiàn)極高的計(jì)算利用率與推理加速,并通過多重機(jī)制保障生成質(zhì)量與系統(tǒng)穩(wěn)定性,具備面向規(guī)模化應(yīng)用的工程可靠性。
城市快速路的視覺對比:基線模型 VS X-Cache
轉(zhuǎn)彎場景的視覺對比:基線模型 VS X-Cache X-Cache 可達(dá)到 71% 塊跳過率 ,以及 2.6 ~2.7倍實(shí)測推理加速,且畫面質(zhì)量幾乎無損
X-World 作為面向物理世界的仿真引擎,構(gòu)建起可推演、可交互的虛擬環(huán)境,成為模型訓(xùn)練與持續(xù)進(jìn)化的核心基礎(chǔ)設(shè)施。在此基礎(chǔ)上,X-Cache進(jìn)一步解決規(guī)?;抡孢\(yùn)行中的效率與成本問題,使高質(zhì)量仿真具備“跑得動、跑得快、成本可控”的工程化能力。依托這一體系支撐,小鵬(HK9868)第二代VLA的能力上限得以顯著提升。
總結(jié)來說:
第二代VLA負(fù)責(zé)感知與決策,是用戶可直接感知的能力輸出端
X-World承擔(dān)虛實(shí)映射與場景推演,是系統(tǒng)進(jìn)化的核心支撐
X-Cache提供高效推理能力,是支撐大規(guī)模仿真運(yùn)行的加速引擎
通過這一體系,小鵬(HK9868)實(shí)現(xiàn)從數(shù)據(jù)采集、模型訓(xùn)練、仿真驗(yàn)證到持續(xù)迭代的閉環(huán)能力,推動自動駕駛從單點(diǎn)能力優(yōu)化,走向模型驅(qū)動的全鏈路閉環(huán)迭代。
算力基建新突破
賦能規(guī)?;涞嘏c生態(tài)拓展
從X-World的亮相到X-Cache的開發(fā),小鵬(HK9868)在短時(shí)間內(nèi)完成了從“構(gòu)建高質(zhì)量仿真世界”到“高效利用仿真世界”的跨越。這不僅是一次推理加速,更是讓低成本、高并發(fā)的閉環(huán)仿真成為可拓展、常態(tài)化運(yùn)營的能力。
X-Cache 證明,在物理AI時(shí)代,競爭焦點(diǎn)不僅是芯片的峰值算力,更應(yīng)該探索如何借助物理世界的先驗(yàn)知識,最大化每一份算力的價(jià)值,讓每一次計(jì)算都用于探索“未知”。
值得一提的是,X-Cache面向少步自回歸交互式仿真,也能直接拓展至同類具身智能與世界模型,滿足自動駕駛閉環(huán)測試、在線強(qiáng)化學(xué)習(xí)、低算力芯片部署等工業(yè)級需求,為具身智能、機(jī)器人仿真乃至更廣泛的物理世界交互,提供了一套可復(fù)用的算力范式與生態(tài)基石。
上周,何小鵬(HK9868)在北京車展提到,第二代VLA自向用戶推送以來,全系Ultra車主提車第一周每天開啟NGP的比例高達(dá)98.52%,一段完整行程100%NGP駕駛行程數(shù)量環(huán)比增長115.9%,使用智駕已成為廣大車主的日常出行習(xí)慣。小鵬(HK9868)第二代VLA將逐步覆蓋全系Ultra、Ultra SE車型,并計(jì)劃于今年內(nèi)向MAX車主推送蒸餾版第二代VLA,讓更多用戶體驗(yàn)到技術(shù)領(lǐng)先、體驗(yàn)領(lǐng)先的智能輔助駕駛技術(shù)。
未來,小鵬集團(tuán)(XPEV)將持續(xù)探索自動駕駛領(lǐng)域更多技術(shù)突破,讓小鵬(HK9868)智駕在數(shù)字世界練得更強(qiáng)、現(xiàn)實(shí)世界開得更穩(wěn)。
