前言:
我國是數據大國,但不是數據資源強國,數據留存率遠低于發達國家水平。數據的大量浪費制約了我國數據資源價值的發揮,在此背景下,數據標注行業發展受到國家重點關注。海天瑞聲、格靈深瞳、云天勵飛、博彥科技等A股上市公司正圍繞政策要求及市場需求,積極布局數據標注相關產業。未來隨著專業人才短缺問題得以解決,我國數據標注行業發展有望邁上新臺階。
一、數據大量浪費情況嚴重,數據標注行業發展受到國家重點關注
2025年1月13日,國家發展改革委、國家數據局、財政部、人力資源社會保障部四部門聯合發布《關于促進數據標注產業高質量發展的實施意見》?!兑庖姟窂娬{,到2027年,數據標注產業專業化、智能化及科技創新能力顯著提升,產業規模大幅躍升,年均復合增長率超過20%。
在上述政策發布以前,國家已多次出臺相關政策推動數據標注行業發展。如《關于加快建設全國統一大市場的意見》提出加快培育數據要素市場,建立健全數據安全、權利保護、跨境傳輸管理、交易流通、開放共享、安全認證等基礎制度和標準規范,深入開展數據資源調查,推動數據資源開發利用?!丁皵祿亍痢比晷袆佑媱潱?024-2026年)》指出選取工業制造、現代農業、商貿流通、交通運輸、金融服務、科技創新、文化旅游、醫療健康、應急管理、氣象服務、城市治理、綠色低碳等12個行業和領域,推動發揮數據要素乘數效應,釋放數據要素價值。
我國數據標注行業相關政策
時間 | 政策 | 發布部門 | 主要內容 |
2022.01 | 《“十四五”數字經濟發展規劃》 | 國務院 | 充分發揮數據要素作用,強化高質量數據要素供給,提升數據管理水平和數據質量。加快數據要素市場化流通,鼓勵市場主體探索數據資產定價機制。嚴歷打擊數據黑市交易,營造安全有序的市場環境。以實際應用需求為導向,探索建立多樣化的數據開發利用機制。 |
2022.04 | 《關于加快建設全國統一大市場的意見》 | 中共中央、國務院 | 加快培育數據要素市場,建立健全數據安全、權利保護、跨境傳輸管理、交易流通、開放共享、安全認證等基礎制度和標準規范,深入開展數據資源調查,推動數據資源開發利用。 |
2022.06 | 《關于構建數據基礎制度更好發揮數據要素作用的意見》 | 國務院 | 建立數據產權制度,推進公共數據、企業據、個人數據分類分級確權授權使用,建立數據資源持有權數據加工使用權、數據產品經營權等分置的產權運行機制,健全數據要素權益保護制度。 |
2023.12 | 《數據經濟促進共同富裕實施方案》 | 國家發展改革委、國家數據局 | 旨在利用數字技術推動經濟發展,縮小地區、城鄉、群體和公共服務之間的差距,實現共同富裕。到2025年,預期在縮小差距方面取得積極進展,并在2030年取得顯著成效。 |
2023.12 | 《深入實施“東數西算”工程加快構建全國一體化算力網的實施意見》 | 國家發展改革委、國家數據局等五部門 | 差異化統籌布局行業特征突出的數據集群,促進行業數據要素有序流通,打造一批涵蓋算力利用與數據開發的行業數據應用空間,服務行業大模型的基礎實驗及商業化應用。推動各級各類數據流通交易平臺利用國家樞紐節點算力資源開展數據流通應用服務,促進數據要素關鍵信息登記上鏈、存證備份、追溯溯源。 |
2024.01 | 《“數據要素X”三年行動計劃(2024-2026年)》 | 國家數據局等17部門 | 《行動計劃》選取工業制造、現代農業、商貿流通、交通運輸、金融服務、科技創新、文化旅游、醫療健康、應急管理、氣象服務、城市治理、綠色低碳等12個行業和領域,推動發揮數據要素乘數效應,釋放數據要素價值。 |
資料來源:觀研天下整理
數據標注產業的發展受到國家的重點關注,主要由于數據的大量浪費制約了我國數據資源價值的發揮。伴隨著數字中國建設的推進,我國數字經濟邁向了全面擴展期,數據成為了新的生產要素。通用人工智能的發展更進一步催生海量數據,2023年我國數據生產總量超32ZB。我國是數據大國,但不是數據資源強國,2023年保存數據僅有2.9%,數據留存率遠低于發達國家水平。
數據來源:觀研天下數據中心整理
二、我國數據標注市場規模持續增長,目前以數據資源定制服務為主
2021-2024年我國數據標注市場規模已由43.3億元增長至77.3億元,在政策推動下,我國數據標注市場規模將進一步增長,預計至2027年超150億元,至2029年超200億元。
數據來源:觀研天下數據中心整理
從細分市場結構看,我國數據標注以數據資源定制服務為主,占比約為85%,標準化數據集產品占比較小,約為13%。
數據來源:觀研天下數據中心整理
三、相關企業積極布局,數據標注核心技術攻關速度有望加快
數據標注是數字經濟發展的基礎性、戰略性產業,為培育和壯大市場主體,國家鼓勵企業加快科技創新投入;重點布局跨語言、跨領域、跨模態語義對齊、4D標注、大模型標注、數據合成等標注核心技術攻關項目;支持研發專家標注、多模態標注、眾包標注、標注審查、質量評估等智能化高端化工具,提升數據標注科技水平。
截至目前,海天瑞聲、格靈深瞳、云天勵飛、博彥科技等A股上市公司正圍繞政策要求及市場需求,積極布局數據標注相關產業。如在4D數據標注領域,海天瑞聲通過在自動駕駛領域用于標注車輛、行人、交通標志等物體在不同時刻的位置和運動狀態,幫助自動駕駛系統理解道路場景的動態變化,提升自動駕駛系統的感知能力等。
我國數據標注行業相關企業布局情況
企業名稱 | 布局情況 |
海天瑞聲 | 2023年5月,海天瑞聲發布了全新升級的智能駕駛數據處理平臺DOTS-AD,具備3D點云語義分割、BEV、300萬大點云以及4D標注等前沿數據標注能力,并不斷優化算法中臺中樞能力,引入最新SAM開源模型,提升2D語義分割項目中的降本增效能力。在大模型數據服務業務方面,公司與國內眾多知名大模型廠商合作,業務范圍覆蓋RLHF數據評分、Prompt改寫、人機多輪交互等強化學習階段數據需求,并發布了首個大語言模型預訓練數據集DOTS-NLP-216。公司通過前瞻性研究,探索拓展大模型相關數據服務范圍及服務能力,提升大模型數據的規?;a效率。 |
格靈深瞳 | 公司利用自研的底層AI技術平臺深瞳大腦對數十億訓練數據進行清洗,并訓練大規模數據基礎模型,在海量數據下,研發了基于多模態弱監督的大模型訓練算法,節省了大量數據標注資源。公司自研的海量數據算法生產技術通過自有的核心算法結合大數據平臺的分析處理技術,支持在海量數據中進行挖掘,主動觸發模型更新訓練,有效的提高了算法的準確率和生產率。同時,公司自建的數據標注平臺,通過組建具有專業背景的標注團隊,用人工標注加AI模型自動化預識別的方法,為算法提供精準的基礎訓練數據,可覆蓋公司內部99%的算法標注任務。 |
云天勵飛 | 公司自研大規模訓練及部署技術,旨在于打通從數據底座、數據標注、模型訓練、模型部署、模型評測等從數據到模型生產的全鏈條,用于公司內部技術沉淀、降本增效以及外部長尾算法的生產。目前已經形成了智能自研數據標注系統、可標準化高效生產算法的YMIR平臺、支持分布式的模型部署平臺以及自動化模型評測平臺。 |
博彥科技 | 博彥科技依托自身強大的研發與創新能力,廣泛采用基于大數據、人工智能和云計算等新興技術,搭建了人工智能計算平臺,擁有涵蓋樣本標注、模型部署、模型訓練和模型推理服務的一站式AI開發能力,可協助金融、互聯網和制造等行業用戶快速進行模型訓練和部署,管理全周期AI工作流程,降低模型開發門檻,并協助研發人員迅速推出AI模型服務。 |
資料來源:觀研天下整理
四、我國數據標注行業仍面臨挑戰,專業人才短缺問題亟待解決
隨著技術的進步,數據標注行業也在向知識密集型轉變,這意味著對于高學歷和擁有專業技能的人才的需求將會增加。數據顯示,數據標注此前較少有人關注,當ChatGPT火爆全球后,其需求量大幅增長,2023年增速達34.43%。從行業分布來看,數據標注新發職位主要集中于互聯網、計算機軟件、人工智能三大行業,占比為29.65%、12.7%、9.96%。相較日益增長的市場需求,我國數據標注人才數量不足,成為制約我國數據標注行業發展的重要因素之一。
未來,通過加強職業教育和培訓體系建設,支持高校和職業院校開設數據標注相關專業和課程;推動企業與教育機構合作,共建實訓基地和培訓中心,培養具備專業技能和職業素養的數據標注人才;制定吸引和留住高層次人才的政策措施,促進數據標注領域的國際交流與人才合作,我國數據標注專業人才短缺的情況將得到緩解,行業發展也有望邁上新臺階。
數據來源:觀研天下數據中心整理(zlj)
注:上述信息僅作參考,圖表均為樣式展示,具體數據、坐標軸與數據標簽詳見報告正文。
個別圖表由于行業特性可能會有出入,具體內容請聯系客服確認,以報告正文為準。
更多圖表和內容詳見報告正文。
觀研報告網發布的《中國數據標注行業現狀深度分析與發展前景預測報告(2025-2032年)》涵蓋行業最新數據,市場熱點,政策規劃,競爭情報,市場前景預測,投資策略等內容。更輔以大量直觀的圖表幫助本行業企業準確把握行業發展態勢、市場商機動向、正確制定企業競爭戰略和投資策略。
本報告依據國家統計局、海關總署和國家信息中心等渠道發布的權威數據,結合了行業所處的環境,從理論到實踐、從宏觀到微觀等多個角度進行市場調研分析。
行業報告是業內企業、相關投資公司及政府部門準確把握行業發展趨勢,洞悉行業競爭格局,規避經營和投資風險,制定正確競爭和投資戰略決策的重要決策依據之一。
本報告是全面了解行業以及對本行業進行投資不可或缺的重要工具。觀研天下是國內知名的行業信息咨詢機構,擁有資深的專家團隊,多年來已經為上萬家企業單位、咨詢機構、金融機構、行業協會、個人投資者等提供了專業的行業分析報告,客戶涵蓋了華為、中國石油、中國電信、中國建筑、惠普、迪士尼等國內外行業領先企業,并得到了客戶的廣泛認可。
目錄大綱:
【第一部分 行業定義與監管 】
第一章 2020-2024年中國數據標注行業發展概述
第一節 數據標注行業發展情況概述
一、數據標注行業相關定義
二、數據標注特點分析
三、數據標注行業基本情況介紹
四、數據標注行業經營模式
1、生產模式
2、采購模式
3、銷售/服務模式
五、數據標注行業需求主體分析
第二節 中國數據標注行業生命周期分析
一、數據標注行業生命周期理論概述
二、數據標注行業所屬的生命周期分析
第三節 數據標注行業經濟指標分析
一、數據標注行業的贏利性分析
二、數據標注行業的經濟周期分析
三、數據標注行業附加值的提升空間分析
第二章 中國數據標注行業監管分析
第一節 中國數據標注行業監管制度分析
一、行業主要監管體制
二、行業準入制度
第二節 中國數據標注行業政策法規
一、行業主要政策法規
二、主要行業標準分析
第三節 國內監管與政策對數據標注行業的影響分析
【第二部分 行業環境與全球市場】
第三章 2020-2024年中國數據標注行業發展環境分析
第一節 中國宏觀環境與對數據標注行業的影響分析
一、中國宏觀經濟環境
一、中國宏觀經濟環境對數據標注行業的影響分析
第二節 中國社會環境與對數據標注行業的影響分析
第三節 中國對外貿易環境與對數據標注行業的影響分析
第四節 中國數據標注行業投資環境分析
第五節 中國數據標注行業技術環境分析
第六節 中國數據標注行業進入壁壘分析
一、數據標注行業資金壁壘分析
二、數據標注行業技術壁壘分析
三、數據標注行業人才壁壘分析
四、數據標注行業品牌壁壘分析
五、數據標注行業其他壁壘分析
第七節 中國數據標注行業風險分析
一、數據標注行業宏觀環境風險
二、數據標注行業技術風險
三、數據標注行業競爭風險
四、數據標注行業其他風險
第四章 2020-2024年全球數據標注行業發展現狀分析
第一節 全球數據標注行業發展歷程回顧
第二節 全球數據標注行業市場規模與區域分布情況
第三節 亞洲數據標注行業地區市場分析
一、亞洲數據標注行業市場現狀分析
二、亞洲數據標注行業市場規模與市場需求分析
三、亞洲數據標注行業市場前景分析
第四節 北美數據標注行業地區市場分析
一、北美數據標注行業市場現狀分析
二、北美數據標注行業市場規模與市場需求分析
三、北美數據標注行業市場前景分析
第五節 歐洲數據標注行業地區市場分析
一、歐洲數據標注行業市場現狀分析
二、歐洲數據標注行業市場規模與市場需求分析
三、歐洲數據標注行業市場前景分析
第六節 2025-2032年全球數據標注行業分布走勢預測
第七節 2025-2032年全球數據標注行業市場規模預測
【第三部分 國內現狀與企業案例】
第五章 中國數據標注行業運行情況
第一節 中國數據標注行業發展狀況情況介紹
一、行業發展歷程回顧
二、行業創新情況分析
三、行業發展特點分析
第二節 中國數據標注行業市場規模分析
一、影響中國數據標注行業市場規模的因素
二、中國數據標注行業市場規模
三、中國數據標注行業市場規模解析
第三節 中國數據標注行業供應情況分析
一、中國數據標注行業供應規模
二、中國數據標注行業供應特點
第四節 中國數據標注行業需求情況分析
一、中國數據標注行業需求規模
二、中國數據標注行業需求特點
第五節 中國數據標注行業供需平衡分析
第六節 中國數據標注行業存在的問題與解決策略分析
第六章 中國數據標注行業產業鏈及細分市場分析
第一節 中國數據標注行業產業鏈綜述
一、產業鏈模型原理介紹
二、產業鏈運行機制
三、數據標注行業產業鏈圖解
第二節 中國數據標注行業產業鏈環節分析
一、上游產業發展現狀
二、上游產業對數據標注行業的影響分析
三、下游產業發展現狀
四、下游產業對數據標注行業的影響分析
第三節 中國數據標注行業細分市場分析
一、細分市場一
二、細分市場二
第七章 2020-2024年中國數據標注行業市場競爭分析
第一節 中國數據標注行業競爭現狀分析
一、中國數據標注行業競爭格局分析
二、中國數據標注行業主要品牌分析
第二節 中國數據標注行業集中度分析
一、中國數據標注行業市場集中度影響因素分析
二、中國數據標注行業市場集中度分析
第三節 中國數據標注行業競爭特征分析
一、企業區域分布特征
二、企業規模分布特征
三、企業所有制分布特征
第八章 2020-2024年中國數據標注行業模型分析
第一節 中國數據標注行業競爭結構分析(波特五力模型)
一、波特五力模型原理
二、供應商議價能力
三、購買者議價能力
四、新進入者威脅
五、替代品威脅
六、同業競爭程度
七、波特五力模型分析結論
第二節 中國數據標注行業SWOT分析
一、SWOT模型概述
二、行業優勢分析
三、行業劣勢
四、行業機會
五、行業威脅
六、中國數據標注行業SWOT分析結論
第三節 中國數據標注行業競爭環境分析(PEST)
一、PEST模型概述
二、政策因素
三、經濟因素
四、社會因素
五、技術因素
六、PEST模型分析結論
第九章 2020-2024年中國數據標注行業需求特點與動態分析
第一節 中國數據標注行業市場動態情況
第二節 中國數據標注行業消費市場特點分析
一、需求偏好
二、價格偏好
三、品牌偏好
四、其他偏好
第三節 數據標注行業成本結構分析
第四節 數據標注行業價格影響因素分析
一、供需因素
二、成本因素
三、其他因素
第五節 中國數據標注行業價格現狀分析
第六節 2025-2032年中國數據標注行業價格影響因素與走勢預測
第十章 中國數據標注行業所屬行業運行數據監測
第一節 中國數據標注行業所屬行業總體規模分析
一、企業數量結構分析
二、行業資產規模分析
第二節 中國數據標注行業所屬行業產銷與費用分析
一、流動資產
二、銷售收入分析
三、負債分析
四、利潤規模分析
五、產值分析
第三節 中國數據標注行業所屬行業財務指標分析
一、行業盈利能力分析
二、行業償債能力分析
三、行業營運能力分析
四、行業發展能力分析
第十一章 2020-2024年中國數據標注行業區域市場現狀分析
第一節 中國數據標注行業區域市場規模分析
一、影響數據標注行業區域市場分布的因素
二、中國數據標注行業區域市場分布
第二節 中國華東地區數據標注行業市場分析
一、華東地區概述
二、華東地區經濟環境分析
三、華東地區數據標注行業市場分析
(1)華東地區數據標注行業市場規模
(2)華東地區數據標注行業市場現狀
(3)華東地區數據標注行業市場規模預測
第三節 華中地區市場分析
一、華中地區概述
二、華中地區經濟環境分析
三、華中地區數據標注行業市場分析
(1)華中地區數據標注行業市場規模
(2)華中地區數據標注行業市場現狀
(3)華中地區數據標注行業市場規模預測
第四節 華南地區市場分析
一、華南地區概述
二、華南地區經濟環境分析
三、華南地區數據標注行業市場分析
(1)華南地區數據標注行業市場規模
(2)華南地區數據標注行業市場現狀
(3)華南地區數據標注行業市場規模預測
第五節 華北地區數據標注行業市場分析
一、華北地區概述
二、華北地區經濟環境分析
三、華北地區數據標注行業市場分析
(1)華北地區數據標注行業市場規模
(2)華北地區數據標注行業市場現狀
(3)華北地區數據標注行業市場規模預測
第六節 東北地區市場分析
一、東北地區概述
二、東北地區經濟環境分析
三、東北地區數據標注行業市場分析
(1)東北地區數據標注行業市場規模
(2)東北地區數據標注行業市場現狀
(3)東北地區數據標注行業市場規模預測
第七節 西南地區市場分析
一、西南地區概述
二、西南地區經濟環境分析
三、西南地區數據標注行業市場分析
(1)西南地區數據標注行業市場規模
(2)西南地區數據標注行業市場現狀
(3)西南地區數據標注行業市場規模預測
第八節 西北地區市場分析
一、西北地區概述
二、西北地區經濟環境分析
三、西北地區數據標注行業市場分析
(1)西北地區數據標注行業市場規模
(2)西北地區數據標注行業市場現狀
(3)西北地區數據標注行業市場規模預測
第九節 2025-2032年中國數據標注行業市場規模區域分布預測
第十二章 數據標注行業企業分析(隨數據更新可能有調整)
第一節 企業一
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第二節 企業二
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第三節 企業三
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第四節 企業四
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第五節 企業五
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第六節 企業六
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第七節 企業七
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第八節 企業八
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第九節 企業九
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
第十節 企業十
一、企業概況
二、主營產品
三、運營情況
1、主要經濟指標情況
2、企業盈利能力分析
3、企業償債能力分析
4、企業運營能力分析
5、企業成長能力分析
四、公司優勢分析
【第四部分 展望、結論與建議】
第十三章 2025-2032年中國數據標注行業發展前景分析與預測
第一節 中國數據標注行業未來發展前景分析
一、中國數據標注行業市場機會分析
二、中國數據標注行業投資增速預測
第二節 中國數據標注行業未來發展趨勢預測
第三節 中國數據標注行業規模發展預測
一、中國數據標注行業市場規模預測
二、中國數據標注行業市場規模增速預測
三、中國數據標注行業產值規模預測
四、中國數據標注行業產值增速預測
五、中國數據標注行業供需情況預測
第四節 中國數據標注行業盈利走勢預測
第十四章 中國數據標注行業研究結論及投資建議
第一節 觀研天下中國數據標注行業研究綜述
一、行業投資價值
二、行業風險評估
第二節 中國數據標注行業進入策略分析
一、目標客戶群體
二、細分市場選擇
三、區域市場的選擇
第三節 數據標注行業品牌營銷策略分析
一、數據標注行業產品策略
二、數據標注行業定價策略
三、數據標注行業渠道策略
四、數據標注行業推廣策略
第四節 觀研天下分析師投資建議