商湯絕影世界模型全新升級 端到端量產(chǎn)在即
AI的突破性進展正引領(lǐng)人類邁向全新時代,曾經(jīng)的想象觸手可及,智能汽車正成為人類擁抱前沿AI科技的最佳載體之一。
11月27日,2024“絕影實力AI DAY”在上海舉辦,商湯絕影展示了“駕-艙-云”三位一體的通用人工智能(AGI)產(chǎn)品體系與戰(zhàn)略布局,發(fā)布智能座艙交互革新、端到端智能駕駛等前沿領(lǐng)域的創(chuàng)新成果。
面向智能座艙,商湯絕影發(fā)布了其智能座艙大模型創(chuàng)新產(chǎn)品“A New Member For U”(你的家庭新成員);面向智能駕駛,商湯絕影構(gòu)建了“車云一體”的產(chǎn)品矩陣,發(fā)布涵蓋高速、城區(qū)以及泊車等全場景的高階智駕、端到端智駕等絕影量產(chǎn)智駕產(chǎn)品體系,同時全新升級“開悟”世界模型。
商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛表示:“我們已經(jīng)站在AGI時代的門口。作為加速智能汽車駛?cè)階GI時代的戰(zhàn)略合作伙伴,商湯絕影將牢牢把握住新一輪智能汽車變革的時間窗口,與車企伙伴進行全方位深度合作,共享大算力與大模型,共建數(shù)據(jù)基礎(chǔ)設(shè)施,共同打造智能汽車大模型創(chuàng)新應(yīng)用,才能攜手共贏,領(lǐng)航未來!
智能座艙,被動智能到主動服務(wù)
大模型上車伊始,它們主要扮演著工具的角色,為用戶提供基礎(chǔ)的對話、信息查詢和問題解答服務(wù)。隨著技術(shù)的不斷進步,具備邏輯思考和通用任務(wù)處理能力的AI Agent出現(xiàn)了,能夠根據(jù)用戶的指令,完成復(fù)雜的連續(xù)性任務(wù),成為能干的助理。
不過商湯絕影也指出,這類車機都只是聽話和服從的“被動智能”。
此次“絕影實力AI DAY”上,商湯絕影發(fā)布的智能座艙大模型創(chuàng)新產(chǎn)品“A New Member For U”,旨在讓汽車智能助手不再只是冰冷的工具或者機械式的助理。
據(jù)商湯絕影介紹,該產(chǎn)品具備三大特性:察言觀色、心有靈犀、無時不在。三大特性背后,是原生流式多模態(tài)大模型、車載類人記憶框架和持續(xù)運行框架等前沿AI大模型技術(shù)支撐。
據(jù)悉,商湯絕影原生流式多模態(tài)大模型,具備全場景多模感知能力,無論是文字、圖像、音頻還是視頻,都能以端到端優(yōu)化的方式,實現(xiàn)對這些信息的感知和理解。同時,商湯針對車載場景進行了定制訓練,使其更適應(yīng)車輛內(nèi)外的特定場景。
絕影的“記憶框架”則與人類的記憶機制非常相似,其分為臨時記憶、場景記憶和長期記憶三部分。其中臨時記憶能夠快速捕捉車內(nèi)外環(huán)境中的瞬時信息,比如車速、溫度、光線變化等;場景記憶則動態(tài)管理用戶當前的交互內(nèi)容,比如導航歷史、音樂偏好等;長期記憶則是一種自我迭代的能力,能從用戶的長期使用中總結(jié)規(guī)律并不斷優(yōu)化。
這三者組成的記憶框架,支持毫秒級的動態(tài)記憶檢索,覆蓋人、車、物、環(huán)境四大類別,并涉及100多個記憶維度。
此外,商湯絕影的Always-on持續(xù)運行框架,也擁有持續(xù)推理、零拷貝傳輸技術(shù)、實時響應(yīng)等多項核心亮點。該技術(shù)將多模態(tài)感知到的信息與各種記憶相結(jié)合,依托端云協(xié)同架構(gòu),數(shù)據(jù)延遲控制在1毫秒以下,首包延時最快只需60毫秒,推理速度達40 Tokens/秒。
目前商湯絕影的持續(xù)運行框架已在英偉達、高通、聯(lián)發(fā)科等車載芯片平臺上完成部署適配,可快速將技術(shù)落地應(yīng)用在市場上的絕大部分車型。
“開悟”世界模型全新升級,端到端量產(chǎn)在即
今年年初,城區(qū)無圖NOA是智能駕駛領(lǐng)域的核心話題。之后,端到端智駕技術(shù)為行業(yè)帶來了范式革新,逐漸取代模塊化的規(guī)則,成為智駕技術(shù)的進化方向。從北京車展開始,商湯絕影等多家公司陸續(xù)發(fā)布端到端智駕方案,智駕正在邁向端到端時代。
商湯絕影打造了三大量產(chǎn)智駕解決方案,包括基礎(chǔ)智駕方案、覆蓋全場景的高階智駕,以及基于UniAD打造的端到端量產(chǎn)智駕方案。
基于J6E和J6M兩個平臺,商湯絕影打造了AD Pro和AD Max兩個量產(chǎn)智駕方案,其中AD Max能夠?qū)崿F(xiàn)城區(qū)無圖NOP。J6平臺的智駕方案預(yù)計明年2季度就會量產(chǎn)交付。
同時,商湯絕影也正式發(fā)布基于UniAD打造的絕影量產(chǎn)端到端智駕方案AD Ultra。該方案采用無圖、無激光雷達路線,基于1個毫米波雷達和11個攝像頭的傳感器配置,和200+TOPS的車載算力平臺,即可實現(xiàn)一段式端到端智駕。
目前,商湯絕影已經(jīng)與大卓智能、東風汽車等達成戰(zhàn)略合作,量產(chǎn)交付也正在推進中,其基于J6平臺的智駕方案預(yù)計2025年第二季度將量產(chǎn)交付,而量產(chǎn)端到端智駕方案則預(yù)計會在明年年底量產(chǎn)落地。
與此同時,基于行業(yè)研發(fā)范式從規(guī)則驅(qū)動轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動,端到端智駕模型對于高質(zhì)量數(shù)據(jù)的需求呈指數(shù)級的增長。
然而,受限于高階智駕的量產(chǎn)規(guī)模、算力資源,目前大多數(shù)車企和智駕公司都面臨相同的問題,即高質(zhì)量駕駛數(shù)據(jù)的獲取難度大、效率低、成本高。
商湯方面認為,依靠采集車、量產(chǎn)車等所提供的數(shù)據(jù),越來越難以滿足端到端智駕持續(xù)成長和迭代的需求,通過大模型生成仿真數(shù)據(jù),用“真實數(shù)據(jù)+仿真數(shù)據(jù)”的合成數(shù)據(jù)訓練是必然趨勢。
其中,強大的世界模型是生成高質(zhì)量數(shù)據(jù)的關(guān)鍵。
王曉剛表示:“智駕高端局的競爭不止是車端模型的比拼,端到端的決戰(zhàn),戰(zhàn)場在云端。”為此,商湯絕影全新升級“開悟”世界模型。
據(jù)介紹,“開悟”世界模型,具備“理解真實世界”、“生成準確場景”、“可控萬千元素”、“泛化平行世界”等能力,可以滿足端到端模型訓練和仿真對于數(shù)據(jù)質(zhì)量的高要求。在真實的基礎(chǔ)上,“開悟”生成的場景視頻,時間最長為150秒、分辨率可達1080P、視角可以實現(xiàn)11V。
值得關(guān)注的是,通過多模態(tài)大模型,“開悟”世界模型可以支持多樣化的自動駕駛場景及Corner case的可控生成。目前商湯絕影基于1024類場景,打造了千萬級的生成場景庫,預(yù)計2025年對行業(yè)開放。
商湯絕影以其量產(chǎn)智駕方案和“開悟”世界模型為核心,實車采集的真實數(shù)據(jù)和云端生成的仿真數(shù)據(jù)在“車云一體”的新范式下進行閉環(huán)流轉(zhuǎn),目標使端到端智駕系統(tǒng)的訓練更加全面、高效,力圖縮短研發(fā)周期,降低開發(fā)成本。
“單打獨斗難以在AGI時代脫穎而出,主機廠和AI公司必須以全新的方式進行深度戰(zhàn)略合作才有可能形成行業(yè)競爭力!鄙虦矫姹硎。
目前,商湯絕影智駕方案已量產(chǎn)交付廣汽埃安、一汽紅旗等3家車企6款車型。此外座艙AI大模型產(chǎn)品已上車小米SU7、智己、LEVC L380等車型。
值得關(guān)注的是,商湯絕影面向海外市場升級了座艙視覺AI產(chǎn)品矩陣,如今,商湯絕影已與超30家國內(nèi)外車企達成合作,覆蓋100余款車型,預(yù)計至2024年底,量產(chǎn)交付累計將突破350萬輛。
商湯絕影方面表示愿意和車企合作伙伴共享算力豐沛的商湯大裝置,其20,000P算力將為合作伙伴提供基礎(chǔ)設(shè)施保障;同時,絕影將開放性能全面的基礎(chǔ)大模型能力,提升車企的AI實力。

京公網(wǎng)安備: