隨著自動駕駛的快速發(fā)展,系統(tǒng)功能越來越復(fù)雜,對算力的要求也越來越高。
據(jù)相關(guān)分析數(shù)據(jù)顯示,現(xiàn)階段 L2 級別自動駕駛計算量已達(dá)10TOPS,L3 自動駕駛對芯片算力的需求約在 30 ~100TOPS 之間,L4/L5 則分別在 100/1000 TOPS 以上。對于高階自動駕駛而言,高算力自動駕駛芯片已然成了落地的關(guān)鍵所在。
正因為如此,目前很多車企和技術(shù)提供商都將峰值算力作為了衡量自動駕駛芯片能力的重要指標(biāo),由此吸引各大芯片廠商紛紛加碼研發(fā)大算力、高性能自動駕駛芯片。
近日,安霸在CES 2022上發(fā)布了全新的AI域控制器芯片 CV3 系列。該系列芯片基于5nm制程打造,AI等效算力達(dá)500eTOPS,能夠支持ADAS和 L2+ 至 L4 級自動駕駛系統(tǒng)的研發(fā)。據(jù)安霸中國區(qū)總經(jīng)理馮羽濤介紹,和以往一樣,此次新推出的CV3 系列將包括多個不同的版本,此前亮相CES的CV3 - HIGH是該系列的高性能旗艦版產(chǎn)品,后續(xù)安霸將根據(jù)具體客戶需求,對相關(guān)性能進(jìn)行裁剪,進(jìn)一步推出中端和入門級產(chǎn)品。
安霸首發(fā)CV3 系列,單芯片AI算力達(dá)500 eTOPS
作為安霸最新 AI 域控制器芯片,CV3系列芯片采用了5nm制程,基于完全可擴展、高能效比的 CVflow® 架構(gòu),可實現(xiàn)500 eTOPS AI算力,比安霸上一代車規(guī)級 SoC CV2 系列提高了 42 倍,而功耗僅為50W,相當(dāng)于能效比只有10 eTOPS/W,較CV2提升了4倍。
“這里的e指的是equivalent。因為我們的架構(gòu)是特殊的架構(gòu),CVflow®不等同于任何GPU,這就導(dǎo)致CV3芯片AI算力的計數(shù)單位與大家常用的GPU的TOPS有所不同,這里加了e也就是說跟通用芯片架構(gòu)相比,我們可以跑到等效的性能。” 馮羽濤指出。
這是什么概念呢?目前在自動駕駛領(lǐng)域備受青睞的英偉達(dá)Orin芯片,算力也只有254 TOPS,蔚來ET7通過四顆Orin級聯(lián)也僅實現(xiàn)了1016 TOPS算力。而如果采用四顆CV3芯片級聯(lián),意味著可以實現(xiàn)2000 eTOPS的超高算力。正因為如此,對于這款芯片未來幾年的市場前景,安霸也是信心十足。
具體來看,相較于上一代CV2,CV3對CPU進(jìn)行了大幅升級,搭載了多達(dá) 16 個 Arm® Cortex-A78AE CPU 內(nèi)核,這是Arm最新推出的高性能CPU內(nèi)核,由此使得CV3在支持自動駕駛系統(tǒng)的軟件應(yīng)用所需的 CPU 性能上,比CV2 提高了 30 倍。
在設(shè)計上,安霸將這16 個 Arm® Cortex-A78AE分成了四個集群,每個集群4個核,用于實現(xiàn)不同的功能,從而使軟件開發(fā)相對較獨立,并且還可以互為冗余,提升安全性。例如,可以用一個集群做安全島,一個集群負(fù)責(zé)神經(jīng)網(wǎng)絡(luò)以及視覺感知,一個集群用于融合。
“現(xiàn)在我們第一顆芯片雖然有4個集群共16個核,但將來真正落地的時候,如果客戶不需要這么多,也是可以裁剪的。” 馮羽濤表示。不僅如此,CV3還加入了HSM模塊。在馮羽濤看來,未來在汽車域控制器里,HSM將是必須的硬件安全模塊。
另外,CV3還應(yīng)用了安霸全新一代CVflow®架構(gòu),其中對神經(jīng)矢量處理器NVP和通用矢量處理器GVP進(jìn)行了專門的區(qū)分,從而更好地分工協(xié)作,滿足不同客戶的算法開發(fā)需求。據(jù)馮羽濤介紹,就應(yīng)用而言,NVP主要是針對卷積神經(jīng)網(wǎng)絡(luò)運算,可以運行先進(jìn)的神經(jīng)網(wǎng)絡(luò)算法,而GVP則更擅長浮點運算、非神經(jīng)網(wǎng)絡(luò)計算,可以幫助 NVP 引擎分擔(dān)傳統(tǒng)算法等運算處理。CV3里有專用硬件加速用來跑傲酷的 4D 成像雷達(dá) AI 算法。
為繼續(xù)發(fā)揮安霸在圖像處理領(lǐng)域的領(lǐng)先優(yōu)勢,CV3 系列亦搭載了其最新一代 ISP,可同時支持 20 路攝像頭通過 MIPI VC 方式連接,并可以接入激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)等自動駕駛傳感器,進(jìn)行多傳感器的深度融合,通過單顆芯片實現(xiàn) ADAS到L4 不同等級自動駕駛系統(tǒng)的研發(fā)。
在此過程中,馮羽濤指出,最大的挑戰(zhàn)是如何讓一個新平臺同時適應(yīng)不同的研發(fā)需求,并且兼顧功耗和成本。“做一顆超高算力的芯片,理論上只要拼很多核放進(jìn)去一樣可以實現(xiàn)很高的算力。但這種做法很難落地,因為真正應(yīng)用的時候,會面臨各種各樣的瓶頸,包括功耗,包括成本,都是需要考慮的,而且這些也是評價一顆芯片最核心的幾個指標(biāo)。”
支持視覺和雷達(dá)前融合,大幅提升融合感知效果
2021年10月,安霸正式與傲酷雷達(dá)( Oculii)達(dá)成最終收購協(xié)議。通過此次收購,安霸得以將傲酷的算法部署在其 CVflow® 系列芯片上,從而將目標(biāo)市場拓展至雷達(dá)感知與視覺融合領(lǐng)域。此次CV3的發(fā)布,可以說是雙方合作的首個重要成果。
據(jù)安霸中國區(qū)市場營銷副總裁郄建軍介紹,通過對傲酷的收購,安霸在CV3系列中也加入了傲酷4D高精度雷達(dá)的算法,實現(xiàn)了4D成像雷達(dá)和視覺感知原始數(shù)據(jù)集的融合,這也是前一代產(chǎn)品所不具備的。
在視覺和雷達(dá)的融合方面,目前一般做法都是后融合或者目標(biāo)級的融合。這類融合雖然對計算量和通信帶寬的要求相對降低,但由于部分?jǐn)?shù)據(jù)的舍棄使其準(zhǔn)確性也有所下降。CV3基于卓越的 AI 處理性能可以做前融合,即對視頻的像素和雷達(dá)的點云做原始數(shù)據(jù)級的融合,從而使融合感知的整體性能、置信度等大幅度提升,降低誤檢率、漏檢率。
在郄建軍看來,隨著自動駕駛的快速發(fā)展,未來傳感器融合可能都會朝著原始數(shù)據(jù)集前融合的方向發(fā)展。而CV3除了視覺和雷達(dá)的前融合,其實也可以支持激光雷達(dá)的前融合,具體視客戶的需求而定。但無論如何,視覺都將是自動駕駛最重要的感知手段。
在智能駕駛領(lǐng)域,安霸布局由來已久,一直以來安霸堅持的都是“算法優(yōu)先”。通過對VisLab和傲酷的收購,安霸先后入局了自動駕駛算法和雷達(dá)處理算法的研究,以深刻理解這些技術(shù)對于芯片的需求。
除此之外,在圖像處理和壓縮以及AI加速算法等領(lǐng)域,安霸也積累了豐富的經(jīng)驗。尤其是圖像處理,安霸已經(jīng)擁有17年的研發(fā)經(jīng)驗,基于此安霸已經(jīng)先后推出了多款基于視覺感知的車用芯片,包括不帶AI處理器的A12、H22、H32,以及加入了安霸獨有AI加速引擎設(shè)計的CV2x系列、CV5等。
其中CV2x系列采用了10nm制程,在前視ADAS、智能電子后視鏡、DMS、OMS、行泊一體等領(lǐng)域有廣泛的應(yīng)用,例如RIVIAN、Motional、Arrival,都是安霸CV2芯片的合作伙伴。CV5是安霸首顆5nm制程芯片,已經(jīng)于CES 2021正式推出,這意味著安霸的5nm芯片此前就已經(jīng)經(jīng)過了驗證。
盡管如此,馮羽濤指出,隨著自動駕駛的快速發(fā)展,對芯片的算力、多傳感器連接以及信息處理等的需求都在大幅提升,這些產(chǎn)品是遠(yuǎn)遠(yuǎn)無法滿足高階自動駕駛對中央域控制器的需求的,這也是為什么安霸要推出CV3。接下來,馮羽濤表示安霸將會結(jié)合客戶實際的市場需求,對此次發(fā)布的旗艦級產(chǎn)品進(jìn)行功能裁剪,降維應(yīng)用于不同系統(tǒng)的開發(fā),更好地滿足當(dāng)前百花齊放的自動駕駛市場。