想象未來某天,你的保姆機器人接到下樓買咖啡的指令,自主完成開門、乘坐電梯、尋找便利店、取咖啡、付錢等一連串動作,最后將咖啡遞到你手里。
這不是科幻電影,而是具有自主進化能力的AI智能體帶來的可能——不再局限于在固定場景里完成特定動作,而是能像人類一樣在陌生環(huán)境里“自主學(xué)習(xí)”,并根據(jù)場景變化做出相應(yīng)的動作。
作為人工智能最主要的載體,智能體由硬件、軟件等多種要素組成,能夠感知周圍環(huán)境,并根據(jù)自身所處環(huán)境做出判斷和決策。在我們的日常生活中,一輛輔助駕駛的汽車是智能體,可以根據(jù)路況自主地踩油門或者剎車;家里的掃地機器人也是智能體,能識別地板上是紙屑果皮還是灰塵,并選擇合適的清潔方式。
實際上,智能體并非向來智能,它們的進化史就像一個人的成長史。早期,智能體只會“死記硬背”。例如,1997年擊敗國際象棋冠軍的超級電腦“深藍”,其實是存儲了幾十萬局棋譜的“復(fù)讀機”,遇到規(guī)則外的招式就會卡殼。2014年,谷歌研發(fā)的AlphaGo開啟了“思維訓(xùn)練”的模式,智能體開始通過自我學(xué)習(xí)提升自身能力,并逐漸進階為某個專項領(lǐng)域的高手。2022年,以ChatGPT為代表的大語言模型橫空出世,標志著智能體發(fā)展出較高的智能水平。例如,借助AI大模型破譯甲骨文時,它會自主調(diào)取青銅器紋樣數(shù)據(jù)庫來“腦補”生僻字的字義,甚至根據(jù)上下文的意思“創(chuàng)造”新字符。
與智能體進化相對應(yīng)的,是智能體訓(xùn)練方法的變化。
AI大模型依賴于人工收集的數(shù)據(jù)進行訓(xùn)練?!巴段埂苯o它們什么訓(xùn)練數(shù)據(jù),就學(xué)習(xí)什么知識。例如,給它們提供100萬張貓和狗的圖像,并且標注清楚哪些是貓、哪些是狗,經(jīng)過長時間的訓(xùn)練,它們就能很好地分辨貓和狗,但對于沒見過的動物依然無法識別。
而下一代智能體將具備自主學(xué)習(xí)的能力——通過觀察這個世界、和周圍的環(huán)境互動,來學(xué)習(xí)各種技能。不需要收集和標注好100萬張圖像,只用幾張圖像教會它們最基本的知識,它們就可以自己學(xué)習(xí)更豐富的知識。例如,如果想教智能體騎自行車,只需要示范一次,它就會自己嘗試不同的騎行動作,并不斷試錯,最終學(xué)會騎行的技巧。這意味著下一代智能體將在自主性和適應(yīng)性方面更上一個臺階,能夠主動獲取信息,進行信息加工,然后分解任務(wù)、完成任務(wù)。
基于這種方式,若干年后的智能體或?qū)氐兹谌胛覀兊纳睿簭N房里,智能灶臺不僅能烹飪美味佳肴,還能記住你的口味偏好;醫(yī)院里,AI醫(yī)生為病人診斷出病癥,帶著“定制方案”找主刀醫(yī)生討論……
不過眼下,智能體的發(fā)展還遠未達到人們所期望的“耳聰目明、心靈手巧”,它們只能在固定場景中完成特定任務(wù),并不具備跨場景完成任務(wù)的能力:一個智能體可以為汽車擰螺絲,但換成輪船可能就做不到了;可以在平地上翩翩起舞,但換成山路也許就“四肢不協(xié)調(diào)”了。因此,“跨任務(wù)、跨場景、跨本體”是下一代智能體的發(fā)展目標。
隨著人工智能從數(shù)字世界走向物理世界,智能體的可信性變得愈發(fā)重要。在智能體技術(shù)不斷發(fā)展的過程中,我們始終需要守護“技術(shù)進步須服務(wù)于人性溫暖”的文明底線,從源頭上界定其行為邊界與倫理規(guī)范。
(作者為復(fù)旦大學(xué)智能機器人與先進制造創(chuàng)新學(xué)院副院長,本報記者黃曉慧采訪整理)
本文鏈接:http://www.enbeike.cn/news-8-4142-0.html下一代智能體如何跨界進化
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責(zé)任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕