PowerVR與神經(jīng)網(wǎng)絡(luò)加速器
近來,如果你對神經(jīng)網(wǎng)絡(luò)有所關(guān)注,那么你一定會發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)的市場如日中天。實(shí)際上,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)已經(jīng)成為了人人所熟知的技術(shù)。如果你還對此很陌生,那么你可以看看我的另一篇博客,里面對相關(guān)概念進(jìn)行了詳細(xì)的解釋。
ImaginaTIon的PowerVR Series2NX集成了神經(jīng)網(wǎng)絡(luò)專用處理器,相信這必定使其性能提高一個(gè)量級。
最近,一家競爭企業(yè)宣稱,他們新一代的SoC芯片組將不僅包含CPU、GPU而且將包含一個(gè)神經(jīng)網(wǎng)絡(luò)加速器NPU。我們非常支持這一做法,并且相信在不久的將來,這將成為移動設(shè)備的標(biāo)配。這家企業(yè)稱新一代產(chǎn)品是“超高速”的,當(dāng)單獨(dú)使用NPU處理器時(shí),一分鐘可以處理1832幅圖像,當(dāng)NPU、GPU、CPU聯(lián)用,一分鐘可以處理的圖片數(shù)是2005,該公司宣稱該速度是同類產(chǎn)品的5倍。為了驗(yàn)證該結(jié)果,我們使用類似的測試程序,在MediaTek X30上進(jìn)行了測試,MediaTek X30中配備了我們的7XT+系列GPU(GT7400+)。測試結(jié)果顯示,圖片的處理速度大概是每秒30幅,相當(dāng)于每分鐘1800幅,這個(gè)速度和競爭對手所宣稱的新神經(jīng)網(wǎng)絡(luò)加速器速度相差無幾,僅僅慢了1.8%
這僅僅是當(dāng)下的成果,在未來,我們的8XT系列,在相同的運(yùn)行頻率下FLOPS將提高50%,在性能上將著實(shí)是一個(gè)大幅度的提升。
目前,我們的GPU的處理速度是1800幅/分鐘,那么再來看看我們的2NX系列神經(jīng)網(wǎng)絡(luò)加速器,這種加速器單核的性能是2048 MACs/cycle,這樣每分鐘可以處理的圖片將是42000幅,粗略計(jì)算,這個(gè)速度比競爭者提高了2233%。
競爭對手聲稱,在神經(jīng)網(wǎng)絡(luò)圖像識別上,他們的GPU比CPU快四倍,而且他們的新硬件解決方案將比CPU快25倍。下圖給出了相關(guān)的對比數(shù)據(jù)。此外,下圖還給出了使用PowerVR Series 7XT和PowerVR Series 2NX NNA的對比數(shù)據(jù)。正如你所看到的那樣,目前我們的GPU可以與其性能相抗衡,而我們帶有神經(jīng)網(wǎng)絡(luò)加速器的硬件是其速度的583倍,實(shí)在是令人難以置信。
我們所關(guān)注的不僅僅是性能,在功耗上,Series2NX也具有很大的優(yōu)勢。Series2NX針對神經(jīng)網(wǎng)絡(luò)進(jìn)行了專門的優(yōu)化。通過靈活bit速率技術(shù)的支持,其功耗將大幅度低于傳統(tǒng)的GPU。
在芯片的物理尺寸上,Series2NX也更勝一籌。Series2NX的硅面積非常小。當(dāng)需要獲得更高的神經(jīng)網(wǎng)絡(luò)性能時(shí),制造商可以選取一個(gè)GPU來滿足他們的需求,如Series8XT甚至更新的Series9XE或9XM,然后選取Series2NX與之相匹配,這樣搭配后在硅面積上我們依然優(yōu)于競爭對手的解決方案。
結(jié)論
我們的消費(fèi)者有很多種選擇,比如在構(gòu)建SoC時(shí),可以選擇單GPU解決方案,這在處理AI和相關(guān)的圖形任務(wù)時(shí)將具有和競爭者相類似的性能。
然而,神經(jīng)網(wǎng)絡(luò)市場發(fā)展迅速,如果沒有超乎尋常的性能,商家將無法提供最具有競爭力的產(chǎn)品。當(dāng)應(yīng)用程序使用更為復(fù)雜的神經(jīng)網(wǎng)絡(luò)時(shí),PowerVR Series2NX NNA將為我們的客戶提供更高的性能,這將使開發(fā)人員以更小的功耗和帶寬,創(chuàng)建真正的下一代產(chǎn)品。
當(dāng)然,如果想要獲得一個(gè)真正的前沿解決方案,那么強(qiáng)大、高效且高度可擴(kuò)展的PowerVR 2NX無疑是市場上唯一的解決方案。