具身智能是“能夠感知、推理并與物理世界互動(dòng)的智能系統(tǒng)”。而具身智能機(jī)器人,可以視為具身智能系統(tǒng)的載體。而這種有著“人形身體”的人工智能曾經(jīng)是不少科幻電影中的主角,如今已在各行各業(yè)嶄露頭角、大展身手。
那么,具身智能機(jī)器人還有多久能走入我們的家庭?最近,一款居家機(jī)器人上新,它不僅具備完善的運(yùn)動(dòng),還能實(shí)現(xiàn)毫秒級(jí)的交互反應(yīng),提供情緒價(jià)值。讓“未來已來”的預(yù)言照進(jìn)了現(xiàn)實(shí)。
自然行走、坐到沙發(fā)上,這個(gè)名叫靈犀X2的人形機(jī)器人,1米3的身高,30公斤的體重,特殊的設(shè)計(jì),讓它的步態(tài)靈活,動(dòng)作擬人。仔細(xì)看,這個(gè)機(jī)器人的身體材料十分輕盈柔軟。
研發(fā)人員介紹,為了能夠讓機(jī)器人更加親近人,他們?cè)跈C(jī)器人本體的材質(zhì)上費(fèi)了不少心思,未來如果機(jī)器人走入量產(chǎn),他們還會(huì)使用類似美妝蛋的材質(zhì),讓它變得更加柔軟可親。在機(jī)器人的本體上他們進(jìn)行了關(guān)節(jié)、靈巧手等零部件的自研,可以幫助機(jī)器人更好使用大腦來控制身體。同時(shí)靈犀X2搭載了多模態(tài)交互大模型,能夠?qū)崿F(xiàn)毫秒級(jí)的交互反應(yīng),通過人類的面部表情和語(yǔ)音語(yǔ)調(diào)做出回應(yīng)。
智元機(jī)器人公司創(chuàng)始人還展示了靈犀X2處理信息的能力,它大致猜測(cè)出了記者的年齡,令人驚嘆連連。
作為一個(gè)居家陪伴機(jī)器人,X2目前還在研發(fā)中,有望今年進(jìn)入量產(chǎn)。
加強(qiáng)訓(xùn)練
具身智能機(jī)器人更“聰明”
具身智能機(jī)器人在現(xiàn)實(shí)場(chǎng)景中靈活作業(yè),已不是未來科幻。在上海張江的國(guó)內(nèi)最大具身智能“數(shù)據(jù)工廠”里,百余臺(tái)具身智能機(jī)器人正穿梭于家居、餐廳等場(chǎng)景。它們通過人工操控,采集海量實(shí)操數(shù)據(jù),再結(jié)合國(guó)內(nèi)首個(gè)通用具身基座大模型,加強(qiáng)訓(xùn)練,讓機(jī)器人更聰明,離人們的實(shí)際生活更近。
對(duì)于具身智能機(jī)器人而言,有幾種核心能力至關(guān)重要,這些也是“數(shù)據(jù)工廠”著重訓(xùn)練的方向。
先來說推理能力,這并非要求機(jī)器人像偵探般破案,而是讓其在日常生活場(chǎng)景中具備識(shí)別與處理事務(wù)的能力。就拿清理桌面來說,數(shù)據(jù)工廠會(huì)通過清理桌面垃圾、擦拭桌面等具體場(chǎng)景對(duì)機(jī)器人展開訓(xùn)練。經(jīng)過一系列訓(xùn)練后,機(jī)器人能夠精準(zhǔn)識(shí)別桌面上的各類垃圾,靈活操縱機(jī)械臂將垃圾穩(wěn)穩(wěn)扔進(jìn)垃圾桶。不僅如此,面對(duì)桌面的液體污漬,無論污漬的形態(tài)、位置、大小如何變化,機(jī)器人都能敏銳識(shí)別并妥善清理,將桌面擦拭得干干凈凈。而在這一過程中,機(jī)器人所展現(xiàn)出的靈活應(yīng)對(duì)不同污漬狀況的表現(xiàn),其實(shí)也彰顯了其泛化能力,也就是依據(jù)已掌握的推理方法,在未曾預(yù)設(shè)的具體污漬情境下,出色完成清潔任務(wù)。簡(jiǎn)單說就是機(jī)器人“舉一反三”的能力,這一能力是機(jī)器人從單純的“工具”邁向真正“智能”的關(guān)鍵標(biāo)志。
智元機(jī)器人具身業(yè)務(wù)部質(zhì)量與測(cè)試部總監(jiān) 阮丞:機(jī)器人會(huì)根據(jù)實(shí)際感受和觀察到的污漬,做出對(duì)應(yīng)的調(diào)整。同時(shí)因?yàn)楹>d是柔性體,力度必須把握得十分精準(zhǔn),這是具身模型的特點(diǎn),基于傳統(tǒng)模型是很難做到的。
此外,機(jī)器人的遠(yuǎn)程控制和動(dòng)態(tài)響應(yīng)能力也同樣重要。除常規(guī)測(cè)試外,團(tuán)隊(duì)還通過打乒乓球的場(chǎng)景來進(jìn)行驗(yàn)收測(cè)試。
智元機(jī)器人具身業(yè)務(wù)部質(zhì)量與測(cè)試部總監(jiān) 阮丞:包括一些運(yùn)動(dòng)限位、整個(gè)的速度、每個(gè)關(guān)節(jié)的響應(yīng)速度和最終末端的運(yùn)動(dòng)速度,這一部分達(dá)到一個(gè)比較理想的狀態(tài)。乒乓球是一個(gè)相對(duì)來講比較綜合,比較直觀的方式。我們還會(huì)有非常多的定量的分析能力,去給它做一個(gè)更加完整、更加客觀的評(píng)估。
100余臺(tái)數(shù)采機(jī)器人
日產(chǎn)5萬(wàn)條優(yōu)質(zhì)數(shù)據(jù)
這些場(chǎng)景只是這座數(shù)據(jù)工廠的一個(gè)部分,在具備具身智能作業(yè)能力前,還有大量的數(shù)據(jù)采集和分析工作要做,這就需要大量數(shù)采機(jī)器人和采集員們來幫忙。
數(shù)采機(jī)器人在采集員們的操作下,正在做倒水、洗衣服、整理鞋柜等動(dòng)作,同時(shí)錄制重要的具身作業(yè)數(shù)據(jù)。這些采集任務(wù),是根據(jù)模型訓(xùn)練的要求精心設(shè)計(jì)的。
可以說,數(shù)采機(jī)器人提供的數(shù)據(jù)是基礎(chǔ)中的基礎(chǔ),工作人員通過分析、審核這些數(shù)據(jù),最后得出精準(zhǔn)的標(biāo)注,就像給機(jī)器人的成長(zhǎng)“施肥澆水”,讓數(shù)據(jù)能更好地助力機(jī)器人“茁壯成長(zhǎng)”。目前,該數(shù)據(jù)工廠共有100余臺(tái)數(shù)采機(jī)器人,單日產(chǎn)能超過5萬(wàn)條高質(zhì)量的具身數(shù)據(jù)。
不久前,國(guó)內(nèi)首個(gè)通用具身基座大模型GO-1在這里正式發(fā)布。GO-1大模型采用三層金字塔結(jié)構(gòu),
底層整合了互聯(lián)網(wǎng)上公開的文本和圖像數(shù)據(jù),就像給機(jī)器人打基礎(chǔ),讓它先“看書認(rèn)字”;
中層融入跨本體和人類操作視頻數(shù)據(jù),幫助機(jī)器人理解基本操作,相當(dāng)于學(xué)會(huì)了“聽說讀寫”;
頂層則來自數(shù)據(jù)工廠真實(shí)作業(yè)中的具身數(shù)據(jù),助力機(jī)器人精準(zhǔn)執(zhí)行任務(wù)。
目前,該模型的基本原理已經(jīng)對(duì)外公開,其他人形機(jī)器人企業(yè)能基于這個(gè)平臺(tái)開展二次開發(fā),在更多領(lǐng)域取得新突破。這種先打好基礎(chǔ)、再進(jìn)行專項(xiàng)提升的“基礎(chǔ)培訓(xùn)+職業(yè)培訓(xùn)”賦能模式,有力推動(dòng)了我國(guó)具身智能整體研究水平的提升。
智元機(jī)器人具身業(yè)務(wù)部質(zhì)量與測(cè)試部總監(jiān) 阮丞:將整個(gè)(行業(yè))研究拉到世界上比較前列的水平,大家不要再受困于數(shù)據(jù)的有限。除了模型和數(shù)據(jù)之外,我們也提供非常多相關(guān)的機(jī)器人本體開發(fā)工具,他們可以在我們的基礎(chǔ)上進(jìn)行下一步不同方向、不同內(nèi)容的二次開發(fā)。
人形機(jī)器人大規(guī)模運(yùn)用
四大技術(shù)亟待攻克
人形機(jī)器人產(chǎn)業(yè)正迎來革命性巨變,業(yè)內(nèi)專家指出,核心零部件制造、動(dòng)態(tài)運(yùn)控系統(tǒng)、人機(jī)交互界面以及具身智能架構(gòu),是推動(dòng)這一產(chǎn)業(yè)飛躍的四大戰(zhàn)略高地。
對(duì)于人形機(jī)器人來說,有四大技術(shù)難關(guān)亟待攻克。首要是核心零部件的設(shè)計(jì)與制造。像電機(jī)、減速器這類關(guān)鍵執(zhí)行器,其研發(fā)舉足輕重。目前,用于人形機(jī)器人的這些零部件,費(fèi)用普遍較高,如果想要大規(guī)模普及應(yīng)用,不僅要擴(kuò)大生產(chǎn)規(guī)模,還得降低成本。
智元機(jī)器人具身業(yè)務(wù)部質(zhì)量與測(cè)試部總監(jiān) 阮丞:相比于國(guó)外的很多技術(shù)來講,中國(guó)的電機(jī)水平已經(jīng)屬于比較前列的狀態(tài)。但是我們可以看到因?yàn)槿诵螜C(jī)器人目前為止還沒有非常大規(guī)模的大數(shù)量應(yīng)用,所以導(dǎo)致這一部分電機(jī)的成本依然很貴。接下來的發(fā)展更多是從上規(guī)模、降成本的方式,能夠使得產(chǎn)品得到更廣泛應(yīng)用。
其次,是運(yùn)控能力的提升。如今,人形機(jī)器人已經(jīng)能夠完成奔跑、舞蹈甚至空翻等一系列高難度動(dòng)作。但怎樣做到更低延遲、實(shí)現(xiàn)更敏捷的控制,依舊是科研人員攻克的方向。
此外,人機(jī)交互技術(shù)也是一大挑戰(zhàn)。這一技術(shù)通過讓機(jī)器人擁有擬人化的外形、動(dòng)作及語(yǔ)音交互功能,贏得人們的信任。在其他領(lǐng)域,人機(jī)交互技術(shù)較為成熟,但人形機(jī)器人不能直接照搬,需要開辟專屬技術(shù)路徑。
最為關(guān)鍵也最具挑戰(zhàn)的,當(dāng)屬具身智能技術(shù)。機(jī)器人需要像人類一樣,理解現(xiàn)實(shí)物理世界,把復(fù)雜任務(wù)拆解并加以執(zhí)行。雖說行業(yè)已經(jīng)邁出了探索的第一步,但在面對(duì)生活、工作等各類場(chǎng)景中千變?nèi)f化的任務(wù)時(shí),機(jī)器人的泛化能力,也就是靈活應(yīng)對(duì)不同情況的能力,仍是巨大的阻礙。
智元機(jī)器人具身業(yè)務(wù)部質(zhì)量與測(cè)試部總監(jiān) 阮丞:一方面現(xiàn)在模型發(fā)展還依賴于大量數(shù)據(jù),行業(yè)應(yīng)用也依賴于模型的進(jìn)展,基本上還是集中在一個(gè)固定的(場(chǎng)景)。它實(shí)際上有非常多的挑戰(zhàn),泛化能力的一些挑戰(zhàn),我們更加希望一個(gè)家政機(jī)器人能夠決掉家里面所有的家務(wù),但是家務(wù)分解其實(shí)是非常多的,這就需要具身機(jī)器人具備這樣一個(gè)不同的場(chǎng)景之下,對(duì)于不同任務(wù)非常強(qiáng)大的泛化能力。
具身智能注重智能體端到端的感知、推理、決策閉環(huán)過程,它將是未來人形機(jī)器人的重要發(fā)展方向。人工智能與物理實(shí)體的深度融合,會(huì)賦予機(jī)器人更多類似人類的能力,使其能夠在復(fù)雜多變的動(dòng)態(tài)環(huán)境中,自主完成各項(xiàng)任務(wù),進(jìn)而改變?nèi)藗兊纳罘绞健?span style="display:none">eO8即熱新聞——關(guān)注每天科技社會(huì)生活新變化gihot.com
打造“機(jī)器人之城”
加速競(jìng)逐產(chǎn)業(yè)新賽道
在南京,人機(jī)互動(dòng)科技場(chǎng)景隨處可見。當(dāng)?shù)厝Υ蛟臁皺C(jī)器人之城”,成效顯著,各類行業(yè)“爆款”接連涌現(xiàn),令人眼前一亮。
在南京,充滿趣味與科技感的人機(jī)互動(dòng)場(chǎng)景越來越多。據(jù)了解,當(dāng)前南京正聚力打造“機(jī)器人之城”,匯聚超百家企業(yè),涵蓋產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié),誕生了不少行業(yè)“爆款”。比如這家電子技術(shù)公司帶來的全球首款人形防爆機(jī)器人,主要應(yīng)用在應(yīng)急救援等場(chǎng)景,目前,已進(jìn)入小批量試產(chǎn)階段。
南京天創(chuàng)電子技術(shù)有限公司董事長(zhǎng) 劉爽:江蘇在人形機(jī)器人賽道上產(chǎn)業(yè)基礎(chǔ)很好,零部件企業(yè)非常全,但是人形整機(jī)企業(yè)現(xiàn)在數(shù)量還偏少。我認(rèn)為未來隨著產(chǎn)業(yè)的不斷成熟,整機(jī)企業(yè)一定是大有可為的。
為了進(jìn)一步推動(dòng)科技創(chuàng)新與產(chǎn)業(yè)創(chuàng)新深度融合,南京針對(duì)包括機(jī)器人在內(nèi)的四大產(chǎn)業(yè),專門成立產(chǎn)業(yè)攻堅(jiān)辦,集中力量重點(diǎn)突破。省級(jí)概念驗(yàn)證中心、南京科技成果轉(zhuǎn)化學(xué)院等創(chuàng)新載體相繼揭牌,全力催生更多“源頭創(chuàng)新”。而國(guó)內(nèi)外眾多行業(yè)專家與企業(yè)負(fù)責(zé)人,也對(duì)南京機(jī)器人產(chǎn)業(yè)及相關(guān)領(lǐng)域給予高度關(guān)注,紛紛拋出合作意向。
億嘉和科技股份有限公司人形機(jī)器人研發(fā)總監(jiān) 陳張:除了我們制造業(yè)非常豐富,具備大量落地實(shí)際的應(yīng)用場(chǎng)景之外,長(zhǎng)三角地區(qū)人口稠密,有巨大的市場(chǎng)需求,很多企業(yè)也能在這里面做一些細(xì)分的市場(chǎng)。
德國(guó)柏林勃蘭登堡汽車產(chǎn)業(yè)集群國(guó)際部門負(fù)責(zé)人 米歇爾·波瑟:未來的南京一定是有創(chuàng)新性的,尤其是在技術(shù)創(chuàng)新方面,南京的未來一定會(huì)更美好。我非常開心看到這些,我很喜歡。
本文鏈接:http://www.enbeike.cn/news-4-4724-0.html能提供情緒價(jià)值還能做家務(wù) 這樣的機(jī)器人有望量產(chǎn)
聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕