或許你曾感到好奇,當你打開百度地圖,用粵語說出“導航去韶關東站”,人工智能是怎么聽懂的?家里的智能門鎖如何識別出誰是主人,誰是陌生人?智能駕駛又是如何準確判斷路況的?
答案就在“數據標注”這個人工智能訓練的關鍵環節里。據悉,百度將與廣東韶關數據產業投資發展有限公司積極開展深入廣泛的持續性合作,成立百度智能云(韶關)人工智能基礎數據產業基地(以下簡稱為“百度智能云韶關數據產業基地”)。這將為韶關打造粵港澳大灣區數據標注基地,推動人工智能產業高質量發展注入強勁動能。
數據標注:人工智能的老師
數字經濟時代,算力是核心生產力,算法是重要生產工具,數據是關鍵生產資料。數據標注作為數字經濟產業鏈的基礎服務商,將進一步筑牢數字經濟產業鏈條?! ?/p>
“人工智能就像一個學生,數據標注師帶領它們識別萬物。舉一個最簡單的例子,一開始百度地圖的人工智能是聽不懂粵語的,通過數據標注師把粵語轉化成機器能夠識別的數據要素,讓機器學習、理解和利用這些數據進行模型訓練,人工智能才能聽懂不同語速、語調的粵語。”百度智能云韶關數據產業基地相關負責人告訴記者,數據的數量和質量很大程度上決定了大模型的“智商”,沒有數據標注,人工智能就無法在智能化場景中應用、迭代?! ?/p>
不僅限于語音類標注,在智能駕駛領域,數據標注幫助自動駕駛系統準確識別道路上的信號燈、交通標志、車輛、行人等各種對象,助力自動駕駛更加安全高效;在智能安防領域,數據標注為城市安防擴大了現有的系統感知范圍,數據標注師通過對車輛、行人、道路標識、車道線等的標注,幫助安防系統在不同環境中追蹤目標更快速、更準確……
隨著人工智能的技術不斷進階,對數據的要求也變得更加精細化、專業化,以數據標注為代表的基礎數據服務連結上游數據來源方和下游人工智能算法研發方,其發展和服務水平直接決定了人工智能產業的發展速度和質量?! ∫M百度等行業龍頭企業,打造粵港澳大灣區數據標注基地,正是韶關推動數據中心集群建設以及人工智能產業發展的關鍵一環。
乘“數”而上筑基新質生產力
據了解,百度智能云韶關數據產業基地位于韶關市粵港澳大灣區數據應用產業園,建設規模約2000平方米,計劃于今年6月底啟動運營,現場可容納辦公人員200多人,預計數據標注相關產值將達到千萬元以上?! ?/p>
過去兩年,韶關在國家“東數西算”戰略風口乘風而上,圍繞數據中心集群建設大力布局新興產業,廣東省第一批數據要素集聚發展區在韶關設立,為數據要素相關產業發展塑造良好生態。
“韶關具備豐富的人力資源,營商環境優越,充滿生機活力,當地政府重視數字經濟,重視新質生產力,為基地的落成提供了高質量的支撐。”百度智能云韶關數據產業基地相關負責人表示,韶關展現了大力發展人工智能產業的決心和行動力,這也為企業在韶發展注入了強大動力和堅定信心。
同時,數據標注作為高附加值產業,將有力推動韶關數據服務產業集聚和數據人才培育。“依靠業內領先的規模效應優勢和資源整合優勢,百度智能云可充分發揮龍頭企業的帶動效應,助力區域打造產業生態。”百度智能云韶關數據產業基地相關負責人表示,百度將通過吸引、培訓大量數據標注師及行業相關人才,孵化科技服務領域初創企業,逐漸形成上下游及周邊產業集聚效應,實現數實融合,助推韶關形成從基礎支撐、核心技術到行業應用較為完整的人工智能產業鏈?! ?/p>
“得數據者,得人工智能。”作為人工智能產業的關鍵一環,數據標注已經潛移默化地影響著我們的工作和生活。未來,隨著粵港澳大灣區數據標注基地的建立和完善,韶關將依托該基地,培育構建集數據采集、數據清洗、數據標注、數據交易、數據應用為一體的基礎數據服務體系,在數據標注產業的生態構建、能力提升和場景應用等方面先行先試,打造成為全省乃至全國的數據標注試點樣板,不斷挖掘激活數據要素價值,加快培育發展更多新質生產力。