“過去很多年,我們在數(shù)據(jù)應用方面仍停留在做一些漂亮的統(tǒng)計報表上,并沒有深挖數(shù)據(jù)內(nèi)在價值。大部分數(shù)據(jù)仍沉睡在云端服務(wù)器上,并沒有轉(zhuǎn)化為企業(yè)真正的資產(chǎn)?!比涨?,在由復旦大學校友會創(chuàng)業(yè)創(chuàng)新俱樂部主辦的第四屆創(chuàng)業(yè)創(chuàng)新數(shù)字經(jīng)濟生態(tài)論壇上,復旦大學計算機科學技術(shù)學院教授、博導、上海市數(shù)據(jù)科學重點實驗室主任肖仰華在主題演講過程中直言,當前,數(shù)據(jù)價值變現(xiàn)也面臨諸多挑戰(zhàn)。
復旦大學計算機科學技術(shù)學院教授、博導、上海市數(shù)據(jù)科學重點實驗室主任肖仰華
肖仰華認為,造成這類現(xiàn)象的困境有多層原因?,F(xiàn)階段數(shù)據(jù)管理處于多主體狀態(tài),“今天可能在生產(chǎn)者手中,明天可能在采集者手中,之后會流通到加工者、使用者、運營者手中”,這種多方主體的狀態(tài),使得數(shù)據(jù)的確權(quán)和數(shù)據(jù)安全是否可控面臨較高要求。
此外,數(shù)據(jù)運行的環(huán)境和生態(tài)也前所未有地復雜。肖仰華指出,數(shù)據(jù)運行的形態(tài)極為多樣。數(shù)據(jù)可能運行于傳統(tǒng)數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫、云數(shù)據(jù)庫,也可能存在于文件中,甚至可能成為大模型的語料。
隨著數(shù)據(jù)管理的復雜性和多樣性增加,肖仰華稱,對企業(yè)發(fā)展統(tǒng)一、標準化的數(shù)據(jù)管理和操作方法也提出新需求。在數(shù)據(jù)價值變現(xiàn)層面上,如何喚醒、盤活“沉睡的數(shù)據(jù)”?
肖仰華認為,人工智能時代,大模型有可能成為盤活沉睡數(shù)據(jù)資產(chǎn)的“利器”,大模型有利于將數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值。
肖仰華稱,大模型之所以被各行各業(yè)積極擁抱,是因為它極大地簡化了傳統(tǒng)的商業(yè)變現(xiàn)流程?,F(xiàn)在甲方只需提前提供數(shù)據(jù),大模型就能自動從數(shù)據(jù)中學習到領(lǐng)域知識支撐下游應用,從而形成商業(yè)價值,無需再與資產(chǎn)方進行復雜的溝通,這種端到端的方式為商業(yè)應用帶來了極大的便利。
此外,在多模態(tài)數(shù)據(jù)的統(tǒng)一價值變現(xiàn)上,以前收集到的數(shù)據(jù)庫服務(wù)器可能是文本格式、圖像格式,也可能是語音或表格,各類各樣都有。但如今,只要將這些數(shù)據(jù)統(tǒng)一轉(zhuǎn)換成序列數(shù)據(jù),就可以通過大模型進行訓練,從而實現(xiàn)統(tǒng)一的數(shù)據(jù)價值變現(xiàn)方式。
不僅如此,大模型還在數(shù)據(jù)庫的智能化運維方面發(fā)揮了重要作用。傳統(tǒng)數(shù)據(jù)庫應用系統(tǒng)需要大量人力和資金投入運營,而大模型的自動化運維能力可以顯著提高運維效率,解放人力資源。
不過,盡管大模型為釋放企業(yè)和各類行業(yè)數(shù)據(jù)價值帶來了全新機遇,但仍面臨諸多挑戰(zhàn)。
肖仰華認為,其中一個挑戰(zhàn)在于,目前的通用大模型以聊天或開放性任務(wù)為主,仍存在“幻覺”現(xiàn)象、專業(yè)知識不足以及專業(yè)思維能力較弱等。還有大模型在可控性和編輯能力上較弱,無法實現(xiàn)像傳統(tǒng)數(shù)據(jù)庫那樣精準地刪除或更新操作,這在行業(yè)應用中帶來了較大的挑戰(zhàn)。
在私域數(shù)據(jù)和專業(yè)數(shù)據(jù)的理解上,大模型也有待提升。譬如,不同行業(yè)數(shù)據(jù)具有兩個基本特點,其一是專業(yè)性強,例如工業(yè)傳感器數(shù)據(jù),如果沒有專業(yè)背景知識,很難理解數(shù)據(jù)背后的含義;其二是私域數(shù)據(jù)的表達有自身獨特性,例如不同數(shù)據(jù)庫中對“性別”的編碼可能截然不同(如0和1分別代表男和女),這類私域數(shù)據(jù)編碼通用大模型能否直接理解,也是大模型在行業(yè)落地時需要解決的關(guān)鍵問題。
肖仰華在演講中也提到,企業(yè)在利用大模型做數(shù)據(jù)處理與價值變現(xiàn)相關(guān)工作時,也需關(guān)注成本問題,“大模型的運行存在成本,因此通常采用大模型蒸餾小模型的方式以降低成本?!贝竽P椭饕糜陉P(guān)鍵場合,或在小模型及人工難以處理的復雜場景中發(fā)揮作用,從而優(yōu)化整體方案的成本。
“我們相信,在大模型和人工智能技術(shù)的助力下,數(shù)據(jù)價值將很快被徹底激活?!毙ぱ鋈A說。
本文鏈接:http://www.enbeike.cn/news-8-2433-0.html肖仰華:大部分數(shù)據(jù)仍沉睡在服務(wù)器,尚未轉(zhuǎn)化為真正的資產(chǎn)
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕