近日,2024北京智源大會“人工智能+數據新基建”專題論壇在京舉辦。論壇由中國互聯網協會指導,北京智源人工智能研究院主辦,中國互聯網協會人工智能工作委員會(以下簡稱“工作委員會”)、中國移動研究院共同承辦。
中國互聯網協會理事長尚冰
尚冰理事長出席論壇并致辭。他指出,以 AIGC、通用大模型為代表的人工智能技術引發了第四次工業革命,成為全球關注的焦點和科技革命爭奪的制高點,高質量數據已成為AI大模型研發的戰略性資源,數據工程建設成為從 X+AI 轉向 AI+X 根本性變革的關鍵力量。當前,國內開源數據集在數據規模和語料質量上相比海外仍有較大差距,且數據來源較為單一,更新頻率較低。尚冰理事長就此提出四點建議:一是加快高質量數據資源開放共享,推動政府、企業、高校合建公開數據集,尤其是公共數據、政府數據和科學數據;二是及時跟進合成數據等技術發展,推進不同領域、不同模態合成數據的技術發展,繁榮AI產業發展;三是盡快構建完善的數據交易機制,制定適配大模型的數據標準體系,暢通數據確權、價值評估、數據定價等流程。四是堅持數據治理與數據流通并重,確保數據基礎設施安全、數據流通過程尤其是跨境數據流動安全,加快隱私計算、數據隔離等技術發展。
工作委員會主任委員、北京智源人工智能研究院理事長黃鐵軍
黃鐵軍作了題為《 大模型需要大數據流轉模式創新》的主題報告。他通過回顧人工智能的發展歷程、技術演進路徑,分析了計算機“理解”詞語含義的方式,及大模型的發展規模與涌現特點,提出了智能的源頭是數據(環境)的重要觀點;通過分析智源悟道大模型的發展,及傳統數據加工方法、邁向Agent主導數據生產產線的實踐探索,提出未來數據加工主要靠人工智能的重要觀點;通過目前數據到智能轉化路徑的堵點分析,提出“先使用后付費”實現“數據-智能”正反饋的重要觀點,才能加快數據流通,邁向智力、智業時代。
啟動儀式
中國互聯網協會副秘書長戴煒、智源研究院副院長兼總工程師林詠華,以及來自北京市委網信辦、北京市科委、北京市海淀區、北京能源集團、中國移動研究院、工作委員會等相關領導共同參與“北京人工智能數據運營平臺”暨“行業數據集-場景應用創新計劃”啟動儀式。
工作委員會副主任委員南新生
南新生介紹了“行業數據集-場景應用創新計劃”。中國互聯網協會、智源研究院作為發起單位,依托北京人工智能數據運營平臺,向全產業提供開源開放的高價值行業數據集,涉及18個行業4.33TB數據,服務于行業場景的人工智能應用創新與能力提升。
中國移動集團首席科學家、工作委員會副主任委員馮俊蘭
馮俊蘭作了題為《 數據新基建賦能AI+新質生產力》的主題演講。她表示,在行業中真正產生新質生產力當前仍面臨多方面挑戰,實現AI+是一項宏大而復雜的系統工程,開展“AI+”,需要把握好夯實基礎底座、堅持價值導向、守牢安全底線、健全配套機制這四個關鍵點。結合中國移動十多年來在人工智能領域技術研發和規模化落地實踐的模式和經驗,馮俊蘭博士提出,AI+時代,要從大模型的視角重新審視行業:一是需要建立以最低成本來感知和表征復雜系統的行業數據體系;二是構建模擬現網生產的仿真環境,使得智能能夠與環境動態互動、實時反饋和提升;三是建立以價值增長為導向的“數據運河”,使得數據在傳輸過程中價值能得到不斷地提升和反饋,進而保證數據的真正流通。
北京大學人工智能研究院副院長、北京大學數據空間技術與系統全國重點實驗室主任黃罡主題演講
黃罡作了題為《基于數聯網的大模型智能體數據供應鏈》的主題演講,他表示,隨著第四范式從科學領域擴展到全領域,全體數據因復用關系自然形成一種巨型復雜網絡——數聯網,但是第四范式數據基礎設施建設與發展“嚴重滯后于”數聯網的規模和效率增長需求,大數據和大模型為代表的第四范式面臨“高質量數據危機”。數據基礎設施成為網絡空間的新型基礎設施,要打造專網+公網+跨境的一體化數據基礎設施,在互聯網全體數據和應用之上打造“開放式”數據飛輪,實現基于數聯網的大模型智能體數據供應鏈,進一步研究以數據為中心的大模型+人機物的智能體環境研究。
復旦大學教授、博導,上海市數據科學重點實驗室主任肖仰華
肖仰華作了題為《大模型助力數據要素價值變現》的主題演講,他表示人類社會日益演變成為一個人、機、物多元融合的復雜系統,數據內涵發生變化,數據科學日益面臨新環境、承擔新使命。數據要素具有持續流動、多方主體、開放生態、動態增值等特征,對其他生產要素的配置作用日益顯著。當前,大模型成為驅動數據要素市場發展、激發數據價值的智能新引擎,“(大模型+數據要素)×千行百業”或將成為推動數據要素市場發展的重要范式。
中國信息通信研究院人工智能研究所高級工程師,中國人工智能產業發展聯盟數據委員會主任李蓀
李蓀作了題為《面向大模型的數據工程》的主題演講,她指出,大模型時代,數據成為新一輪人工智能競爭的壁壘與制高點,數據工程貫穿于大模型全生命周期。面向大模型的數據工程核心旨在提升大模型數據集管理與運營效率、提升數據集質量和數量、充分挖掘數據資源價值、保障模型數據安全可信,涵蓋管理體系、開發維護、質量控制、資源運營、合規可信等五大核心要素。中國信息通信研究院在2023年成立AIIA數據委員會,深入產業調研,建立數據集分級評估方法,建立大模型評測實施框架和工具平臺,聯合產學研加快共建評測數據集資源池。
中國電子云副總裁、數據產品線總經理馮進
馮進作了題為《全國性數據流通交易體系的探索實踐》的主題演講,他認為數據要素化發展面臨供給難、確權難、入場難、定價難、流通難等問題,需要全國性布局,從合規保障、流通支撐、供需銜接和生態發展四個方面打造覆蓋數據交易全鏈條的賦能能力,加快解決大模型訓練數據荒問題,探索大模型賦能產業高質量發展的可行路徑。
會議現場
圓桌討論環節以“人工智能+數據新基建”為主題。中國移動集團首席科學家馮俊蘭作為主持人,與智源研究院副院長兼總工程師林詠華,復旦大學教授、博士生導師肖仰華,南方電網數字化部大數據管理處高級經理陳彬,中國航信資本運營與創新業務部副總經理趙玉霞,國雙科技副總裁彭俊等專家就數據新基建的發展戰略、數據交易合作模式、數據應用平臺建設、數據智慧運營等新思路,面向人工智能+的數據匯聚、生產、挖掘、交易、流通等新路徑展開了精彩的討論。
來自政府、知名專家、學者、企業代表等200余人出席了論壇,會議由工作委員會副主任委員南新生主持。