4月9日發(fā)布的《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》(以下簡稱《意見》)中,首次將數(shù)據(jù)與土地、勞動力、資本、技術等傳統(tǒng)要素并列為要素之一?!兑庖姟肪唧w指出,發(fā)揮行業(yè)協(xié)會商會作用,推動人工智能、可穿戴設備、車聯(lián)網(wǎng)、物聯(lián)網(wǎng)等領域數(shù)據(jù)采集標準化。
“數(shù)據(jù)采集的標準化是數(shù)據(jù)存儲、交易、加工及數(shù)據(jù)服務等一系列數(shù)據(jù)治理的前提,而且這件事只能由政府來主導。”中科院自動化研究所研究員、視語科技創(chuàng)始人王金橋表示,“數(shù)據(jù)的治理涉及政府機關、運營企業(yè)、人工智能公司、用戶等方方面面,要想規(guī)范交易使用,充分利用沉睡的數(shù)據(jù)資源,必須先從數(shù)據(jù)采集的源頭來做標準化和規(guī)范化。”
王金橋介紹,采集標準化的最大價值是解決數(shù)據(jù)采集重復建設的問題。交通、保險、醫(yī)療、天氣、教育等,各行各業(yè)都在生產(chǎn)數(shù)據(jù),數(shù)據(jù)采集存在非常多的重復建設。比如各地有不同的采集標準,每個地方的關注點、區(qū)域特色、數(shù)據(jù)分布都不一樣,對數(shù)據(jù)的訴求不一樣,采集的數(shù)據(jù)也不一樣,這直接導致數(shù)據(jù)的不完備、噪音大,影響數(shù)據(jù)效能的釋放。
“因此,政府驅動是非常重要的。”王金橋說。比如現(xiàn)在出門避開擁堵靠導航軟件,但導航軟件依靠使用它的用戶的定位信息,事實上相當于采樣,結果并不可靠。去年底,交通運輸部印發(fā)通知,決定開展全國高速公路視頻聯(lián)網(wǎng)監(jiān)測工作,充分利用新一代云計算和人工智能技術,建設科學先進、高效統(tǒng)一的視頻云聯(lián)網(wǎng)監(jiān)測體系。這一監(jiān)測體系將全面提升高速公路信息化、智能化水平,提高出行服務保障能力。按照通知要求,今年12月底,將完成全國高速公路視頻接入工作,建設部級視頻云平臺并全國聯(lián)網(wǎng)運行。“高速公路視頻上云后,全國高速公路的標準化數(shù)據(jù)都會集成到云平臺,交通部門也能像氣象部門提供天氣預報一樣提供準確的信息服務,這是充分發(fā)揮交通數(shù)據(jù)生產(chǎn)力的有效手段。”王金橋說。
由于數(shù)據(jù)治理還處在探索階段,數(shù)據(jù)采集的標準化工作也還處于起步階段。各行各業(yè)數(shù)字化程度千差萬別,很多行業(yè)還沒有實現(xiàn)數(shù)字化,高速公路視頻上云就相當于剛剛連入互聯(lián)網(wǎng),距離真正的數(shù)據(jù)處理和服務還很遠。在國家的統(tǒng)一要求下,不同行業(yè)也需要適配各自業(yè)務和場景的采集標準。
“更重要的是,伴隨技術的進步,數(shù)據(jù)采集標準也會隨之變化,標準化工作需要一個長期的不斷完善的過程。”王金橋說,以人臉數(shù)據(jù)的采集為例,直播、售票、征信等不同場景對人臉數(shù)據(jù)的要求不同,各個場景需要根據(jù)應用劃分采集標準,如人證同一性認證、人員身份網(wǎng)絡遠程驗證、人臉門禁、人臉布控等。比如按照國家制定的標準證件照的數(shù)據(jù)采集標準——中臉部寬207±14像素,頭頂發(fā)跡距照片上邊沿7—21像素,眼睛所在位置距照片下邊沿的距離不小于207像素,按這個標準采集的證件照圖像目前已經(jīng)廣泛用于機場、火車站等地的身份認證。
另外,數(shù)據(jù)采集的邊界也需要界定:什么數(shù)據(jù)能采集,什么數(shù)據(jù)不能采集;如何對隱私數(shù)據(jù)進行規(guī)避;如何正確采集數(shù)據(jù)(比如在采集人的行為數(shù)據(jù)時必須把臉部模糊);如何平衡數(shù)據(jù)的有效和去隱私。“數(shù)據(jù)的重要性已經(jīng)充分展現(xiàn)出來,但數(shù)據(jù)治理的問題特別復雜。數(shù)據(jù)是可以被操縱和改變的,數(shù)據(jù)傳輸特別碎片化,數(shù)據(jù)交易的利益誘惑極大……數(shù)據(jù)采集是為數(shù)據(jù)共享和交易服務的,數(shù)據(jù)的標準化要為采集劃定邊界。”王金橋說。(記者 崔爽)
已有0人發(fā)表了評論