南方日報 | 突破“數(shù)據(jù)孤島”,暢通數(shù)字經(jīng)濟發(fā)展動脈
數(shù)據(jù)要素作為數(shù)字經(jīng)濟時代的核心要素,在提高生產(chǎn)要素的配置效率、推動生產(chǎn)要素創(chuàng)新性配置方面發(fā)揮著重要作用。目前,高質(zhì)量中文數(shù)據(jù)庫稀缺,高質(zhì)量數(shù)據(jù)清洗成本高,高質(zhì)量訓練數(shù)據(jù)集匱乏。同時,數(shù)據(jù)標準不統(tǒng)一,數(shù)據(jù)交易規(guī)則不一致,降低了數(shù)據(jù)要素交易活躍度,數(shù)據(jù)共享不充分,催生“數(shù)據(jù)孤島”,制約了高質(zhì)量數(shù)據(jù)生成和供給。高質(zhì)量數(shù)據(jù)要素的迫切需要與不平衡不充分的數(shù)據(jù)要素供給之間的矛盾日益突出。高質(zhì)量數(shù)據(jù)要素供給體系的構建,核心在于激活高質(zhì)量數(shù)據(jù)要素源頭,關鍵在于暢通高質(zhì)量數(shù)據(jù)要素流通渠道,著力點在于發(fā)揮數(shù)據(jù)標注領軍企業(yè)的標桿作用,激發(fā)市場活力。
歸集高質(zhì)量訓練數(shù)據(jù)集,打造高質(zhì)量中文語料數(shù)據(jù)庫。一是政企牽引,擴大高質(zhì)量數(shù)據(jù)要素源頭。發(fā)揮政府機關、科研院所、企事業(yè)單位豐富的數(shù)據(jù)資源優(yōu)勢,支持各類經(jīng)營主體通過數(shù)據(jù)流通交易平臺提供高質(zhì)量數(shù)據(jù)集。二是平臺賦能,建立高質(zhì)量數(shù)據(jù)配套服務機構。搭建高質(zhì)量的文字、圖片、音頻、視頻等多模態(tài)大模型預訓練語料庫,支持在依法設立的數(shù)據(jù)交易機構開展數(shù)據(jù)流通、交易融合應用,探索建設行業(yè)性高質(zhì)量數(shù)據(jù)交易配套服務平臺。三是基地支撐,打造高質(zhì)量數(shù)據(jù)產(chǎn)業(yè)集群。鼓勵開展大模型研發(fā)、訓練和應用,重點支持在通用大模型的基礎上開發(fā)適用于垂直行業(yè)的專用大模型,優(yōu)先提供高質(zhì)量數(shù)據(jù)集推廣示范、低成本算力保障等綜合支持。建立人工智能產(chǎn)業(yè)數(shù)據(jù)資源清單,建設“產(chǎn)業(yè)數(shù)鏈”,打造以數(shù)據(jù)為核心的虛擬產(chǎn)業(yè)集群。四是人才驅動,創(chuàng)建新型高質(zhì)量數(shù)據(jù)行業(yè)隊伍。推動數(shù)據(jù)與行業(yè)知識深度融合,開發(fā)數(shù)據(jù)產(chǎn)品,滿足算法設計、模型訓練、產(chǎn)品驗證、場景應用等需求,逐步建立和完善復合型數(shù)字經(jīng)濟人才隊伍。積極培育大數(shù)據(jù)企業(yè),完善大數(shù)據(jù)產(chǎn)業(yè)服務支撐體系,夯實數(shù)據(jù)要素市場產(chǎn)業(yè)基礎,催生創(chuàng)造數(shù)據(jù)標注師、分析師、數(shù)據(jù)資產(chǎn)評估師等一批新型職業(yè)崗位。
加強公共數(shù)據(jù)高質(zhì)量供給,推動公共數(shù)據(jù)定向開放。一是加大公共數(shù)據(jù)開放共享力度,推動公共數(shù)據(jù)和社會數(shù)據(jù)定向有條件開放和及時更新。二是優(yōu)化公共數(shù)據(jù)開放目錄,進一步完善數(shù)據(jù)治理和審核機制。三是健全公共數(shù)據(jù)開放評價體系,持續(xù)開展公共數(shù)據(jù)開放水平動態(tài)評估,對出現(xiàn)異常的指標及時回溯分析,以評促改推動公共數(shù)據(jù)質(zhì)量提高。四是強化公共數(shù)據(jù)治理能力,加強公共數(shù)據(jù)全生命周期管理,充分利用政務信息化項目管理抓手,將數(shù)據(jù)治理要求貫穿項目管理始終。五是完善數(shù)據(jù)基礎體系,以監(jiān)管促進各級各部門提升公共數(shù)據(jù)開放的種類、數(shù)量和質(zhì)量。
培育數(shù)據(jù)標注領軍企業(yè),構建數(shù)據(jù)產(chǎn)業(yè)服務生態(tài)。一是建設數(shù)據(jù)精細化標注平臺,開發(fā)智能云數(shù)據(jù)管理服務系統(tǒng),研究平臺和服務系統(tǒng)激勵機制,鼓勵企業(yè)研究互聯(lián)網(wǎng)數(shù)據(jù)全量實時更新技術、多源異構數(shù)據(jù)整合和分類方法,研發(fā)數(shù)據(jù)清洗、標注、分類、注釋和內(nèi)容審查等算法及工具。二是培育本土數(shù)據(jù)標注領軍企業(yè),積極探索建立一批數(shù)據(jù)標注產(chǎn)業(yè)基地、園區(qū),推動數(shù)據(jù)的采、存、洗、標、訓等業(yè)務全面發(fā)展。三是制定數(shù)據(jù)標注行業(yè)發(fā)展規(guī)劃,逐步完善數(shù)據(jù)采集標注行業(yè)的規(guī)范和標準,建立智能語音、計算機視覺、自然語言處理、數(shù)據(jù)集交換共享、數(shù)據(jù)集安全隱私等方面的行業(yè)應用標準,形成數(shù)據(jù)標注行業(yè)的標準化體系,推動基礎數(shù)據(jù)服務產(chǎn)業(yè)健康有序發(fā)展。
培育數(shù)據(jù)交易市場生態(tài),盤活高質(zhì)量數(shù)據(jù)資產(chǎn)池。一是打造數(shù)據(jù)要素市場和市場化配置改革先行區(qū)。加強政策支持和引導,明確試點目標和定位。建立跨部門協(xié)調(diào)機制,推動數(shù)據(jù)共享和流通。二是暢通數(shù)據(jù)交易渠道。鼓勵各類經(jīng)營主體通過數(shù)據(jù)交易場所開展數(shù)據(jù)交易活動,推動區(qū)域性、行業(yè)性數(shù)據(jù)流通,鼓勵公共數(shù)據(jù)加工形成的數(shù)據(jù)產(chǎn)品和服務進場交易。三是探索多樣化數(shù)據(jù)定價模式。推動用于數(shù)字化發(fā)展的公共數(shù)據(jù)按政府指導定價有償使用,鼓勵企業(yè)與個人信息數(shù)據(jù)由市場自主定價,促進數(shù)據(jù)要素價格形成。四是拓寬行業(yè)數(shù)據(jù)空間。支持各行業(yè)主管部門引導本行業(yè)龍頭企業(yè)、數(shù)據(jù)經(jīng)紀人打造行業(yè)數(shù)據(jù)空間,對符合條件的數(shù)據(jù)產(chǎn)業(yè)給予相應的補貼或稅收優(yōu)惠,在智能制造、節(jié)能降碳、綠色建造、新能源、智慧城市等重點領域,大力培育貼近業(yè)務需求的行業(yè)性、產(chǎn)業(yè)化數(shù)據(jù)商,助力廣東打造數(shù)字經(jīng)濟創(chuàng)新引領型城市。
作者曾慶鐸、趙超,單位分別系廣東工業(yè)大學經(jīng)濟學院和中共廣東省委黨校??庉嫴?/p>
本文系國家社會科學基金課題(23BJL114)、黨的二十大精神研究專項課題(2022ZXYB07)階段性成果