1、NPU能提高AI算法運行效率
根據觀研報告網發布的《中國NPU行業現狀深度分析與投資前景研究報告(2025-2032)》顯示,NPU即神經網絡處理單元,采用專門優化的神經網絡計算架構,來處理特定的任務,主要被用于加速計算。通過對NPU硬件層面優化,能高效處理神經網絡算法中矩陣乘法、卷積等數學運算。相較于GPU和CPU,NPU在AI計算上性能和能效有了明顯提升,用來提高AI算法運行效率。
NPU與GPU區別
特性 |
NPU |
GPU |
設計初衷 |
專用于神經網絡計算 |
最初用于圖形渲染,現廣泛用于通用計算 |
計算能力 |
高效的神經網絡推理 |
強大的并行計算能力,主要用于云端 |
靈活性 |
專用硬件,較低的靈活性 |
通用性高,可以編程實現各種計算任務 |
能效比 |
高 |
相對較低 |
典型應用 |
深度學習推理,邊緣計算,實時處理 |
圖形渲染,深度學習訓練和推理,科學計算 |
資料來源:觀研天下整理
2、AI算力提升帶來NPU行業需求端爆發
NPU專用于AI運算,核心是矩陣乘法運算,CNN是主要算法之一,本質上由大量的乘法累加計算組成。隨新AI應用、模型與需求的發展,NPU有望快速上量。根據數據,2020-2024年我國AI算力規模由134.2 EFLOPS增長至725.3 EFLOPS,CAGR為52.5%。
數據來源:觀研天下整理
同時,在智能手機上運行端側生成式AI的AI算力門檻約為30TOPS,旗艦智能機在2021-2022年逐步達到這一標準、且仍在進步,預計2025年將達到60TOPS以上。而生成式AI應用的繁榮,將驅動所需算力的實質性增長。根據相關資料,每天基于生成式AI的搜索查詢超過100億次,其中移動端占比超過60%;智能手機基于精準的端側用戶畫像,與大模型結合,伴隨對話功能的不斷改進,將逐步成為真正的個人助手。
手機廠商內嵌AI大模型概況
手機廠商 |
大模型研發 |
應用進展 |
|
蘋果 |
與中國多廠商測試大模型 |
iOS18發布Apple Intelligence大模型(端側30億),并積極與OPENAI和谷歌接觸 |
宣布年內國行機引入通義大模型 |
華為 |
HarmonyOS4接入盤古大模型 |
HarmonyOSNEXT搭載盤古大模型5.0(端側15-70億) |
小藝接入DeepSeek |
三星 |
自研大模型Gauss |
GalaxyZ系列首次引入谷歌GeminiNano大模型(端側約30億) |
推出自有生成式多模態AI模型Gauss2;Bixby接入智譜智能AI |
OPPO |
ColorOS14搭載AndesGPT大模型 |
大模型升級為AndesGPT-2.0(端側70億) |
宣布折疊旗艦OPPO Find N5接入DeepSeek-R1 |
vivo |
OriginOS4搭載藍心大模型 |
OriginOS5搭載全新藍心大模型矩陣(最高端側跑通130億參數) |
OriginOS官宣將深度融合滿血版DeepSeek |
榮耀 |
逐步開始引入 |
MagicOS9.0支持30億參數的端側大語言模型 |
YOYO智能體商店上線DeepSeek-R1嘗鮮版 |
資料來源:觀研天下整理
3、智駕滲透率提升,驅動更高算力需求,我國NPU行業需求將持續釋放
而在智能駕駛方面,以高通智駕系統為例,其感知軟件棧和駕駛策略軟件棧需始終于本地運行,所以智駕對時延的要求極其嚴苛,云端無法針對此類工作負載發揮任何作用。高通在2024年末發布的座艙與智駕芯片,應用增強的Hexagon NPU,較此前一代AI算力有大幅提升,且后期可繼續通過外掛NPU的方式繼續擴展算力。
高通車載NPU芯片參數
類別 |
型號 |
發布年份 |
制程 |
核心數 |
場景 |
座艙 |
驍龍Cockpit Elite(8397) |
2024 |
4nm |
- |
配對Ride Elite |
驍龍SA8295 |
2023 |
5nm |
8 |
/ |
|
驍龍SA8155 |
2021 |
7nm |
8 |
/ |
|
智駕 |
驍龍RideElite(8797)(艙駕一體) |
2024 |
4nm |
- |
針對L2+L3 |
驍龍8650 |
2023 |
4nm |
8 |
已應用于零跑、大疆車載“成行平臺”,本田、通用、大眾、寶馬等預計25-26年逐步搭載。 |
|
驍龍8540 |
2023 |
5nm |
16 |
未量產 |
資料來源:觀研天下整理
由此可見,隨著智駕解決方案支持GenAI模型,汽車對端側算力的要求將進一步提升,并且伴隨越來越多車企布局智能駕駛市場,我國NPU行業在該領域的需求將持續釋放。
各車企智能駕駛布局情況一覽
車企 |
產品 |
是否依賴高精地圖 |
感知算法/大模型 |
端到端規劃 |
城市NOA開城進展(需陸續OTA) |
特斯拉 |
FSD12 |
無需高精地圖 |
首個端到端自動駕駛系統 |
(已推送北美所有內部員工)FSDV12可用于北美全地區道路 |
/ |
蔚來 |
NAD |
不依賴高精地圖 |
BEV Transformer大模型:0ccupany占用網絡 |
實現數據驅動(端到端前置能力)的規劃網絡 |
覆蓋726城 |
理想 |
ADMax3.0 |
不依賴高精地圖 |
BEV大模型:0ccupancy占用網絡 |
規劃算法逐步切換為時空聯合規劃算法;模塊化架構提升為大模型為主的端到端架構 |
覆蓋全國 |
小鵬 |
XNGP |
不依賴高精地圖 |
基于BEV Transformer的Xnet(24年Xnet2.0具備0ccupancy) |
2024年XNGP+有望實現端到端 |
覆蓋全國 |
華為 |
ADS2.0 |
不依賴高精地圖 |
Bev Transformer大模型:基于0ccupancy的GOD2.0 |
- |
覆蓋全國 |
資料來源:觀研天下整理
4、機器人產業進入快速發展期,市場需求驅動NPU行業爆發
NPU在機器人使用廣泛,有加速計算、降低系統功耗、實現實時交互和決策等優勢。在機器人進行深度學習任務,如語音識別、圖像分類、目標跟蹤時,NPU能顯著加快計算速度,比傳統CPU和GPU更高效地處理大量數據。進入2025年,國內多家人形機器人企業相繼宣布各自的量產消息,市場需求驅動NPU行業爆發。2025年1月17日,樂聚(深圳)機器人技術有限公司在北汽越野車公司舉行了樂聚第100臺全尺寸人形機器人交付儀式。該公司表示,樂聚人形機器人已邁入批量交付新階段。未來如果技術加速突破、成本快速下降,我國人形機器人規模展望千億元甚至萬億元市場,預計2030年有望達約8700億元。
數據來源:觀研天下整理(WYD)

【版權提示】觀研報告網倡導尊重與保護知識產權。未經許可,任何人不得復制、轉載、或以其他方式使用本網站的內容。如發現本站文章存在版權問題,煩請提供版權疑問、身份證明、版權證明、聯系方式等發郵件至kf@chinabaogao.com,我們將及時溝通與處理。