麻省理工公布新成果 可讓機(jī)械手操縱超過2000個(gè)不同物體任意玩轉(zhuǎn)
麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(MIT CSAIL)公布了一項(xiàng)新成果 —— 一個(gè)能夠靈活控制機(jī)械手的程序框架。
在很長一段時(shí)間里,機(jī)械手的操縱物體能力還不如剛滿一歲的嬰兒靈活。即使現(xiàn)在機(jī)械手可以做的不僅僅是撿起和放下物體,但在發(fā)力和復(fù)雜手部動(dòng)作方面,它還沒有完全模仿到位。
目前,在該領(lǐng)域已經(jīng)有多個(gè) AI 實(shí)驗(yàn)室致力于機(jī)械手訓(xùn)練,例如 OpenAI 的 Dactyl 機(jī)器手、DeepMind 的 RGB 堆疊技術(shù)(RGB-Stacking)等,都在一定程度上促進(jìn)了機(jī)器人行業(yè)的發(fā)展。
MIT CSAIL 研究人員提出的程序框架可以讓機(jī)械手操縱超過 2000 個(gè)不同物體的方向,利用簡單的“師生”訓(xùn)練方法,在模擬環(huán)境中訓(xùn)練”教師“網(wǎng)絡(luò),再應(yīng)用到現(xiàn)實(shí)世界的“學(xué)生”中,解決機(jī)械手技術(shù)的復(fù)雜問題。
該論文將在 2021 年機(jī)器人學(xué)習(xí)會(huì)議(Conference on Robot Learning,CORL)上發(fā)表。
一、從魔方到 2000 多種不同物體,任意玩轉(zhuǎn)
OpenAI2019 年 10 月 15 日在官網(wǎng)博客發(fā)布了 Dactyl 機(jī)械手的視頻,視頻內(nèi)容是 Dactyl 機(jī)械手在約 4 分鐘的時(shí)間里成功還原了一個(gè)三階魔方,這是在機(jī)械手控制領(lǐng)域,從定向任務(wù)編程邁向更通用 AI 技術(shù)的重要一步。
2021 年 10 月 12 日 DeepMind 發(fā)布 RGB 堆疊技術(shù)(RGB-Stacking)對(duì)機(jī)械手進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練,這是一個(gè)基于視覺的學(xué)習(xí)系統(tǒng),評(píng)估多個(gè)研究對(duì)象的行為和動(dòng)作來提高機(jī)械手能力。
MIT CSAIL 的科學(xué)家們也一直致力于讓機(jī)器提高模仿人類的能力,他們創(chuàng)建了一個(gè)更大的程序框架:無論機(jī)械手朝上還是朝下,都可以重置 2000 多個(gè)物體的方向。從杯子到金槍魚罐頭、奶酪盒子等,甚至可以延伸到生活中不常見的物體,這個(gè)程序框架都可以幫助機(jī)械手以特定的方式,在合適的位置快速拾取和放置物體。
此前機(jī)械手通常只能完成單一任務(wù)或者只能在垂直位置上移動(dòng),而現(xiàn)在機(jī)械手可以具備靈巧的“手部動(dòng)作”,有助于滿足物流和制造行業(yè)一些常見的需求。例如將物品裝入插槽中進(jìn)行裝配,或靈活操縱距離更遠(yuǎn)的工具。MIT CSAIL 的團(tuán)隊(duì)使用了具有 24 個(gè)自由度的擬人機(jī)械手,證明了該程序框架可以在未來轉(zhuǎn)移到真正的機(jī)器人系統(tǒng)上。
二、從零重力到正常條件,機(jī)械手性能提高
MIT CSAIL 博士生、Improbable AI Lab 研究小組首席研究員陳濤(Tao Chen)說:“在工業(yè)中,由于控制簡單,最常用的是平行爪夾持器,如下圖所示。但實(shí)際上它無法處理我們?cè)谌粘I钪锌吹降脑S多工具。即使用該夾持器控制鉗子也很困難,因?yàn)樗荒莒`活地只移動(dòng)其中一個(gè)手柄。我們的程序框架將允許多指機(jī)械手靈巧地操縱此類工具,這為機(jī)械手應(yīng)用開辟了一個(gè)新領(lǐng)域。”
機(jī)械手操縱物體時(shí)需要控制大量電機(jī),并且手指與物體之間的接觸狀態(tài)也在頻繁變化,因此,機(jī)械手重置物體方向一直是一個(gè)具有挑戰(zhàn)性的技術(shù)難題。該程序框架需要通過 2000 多個(gè)對(duì)象進(jìn)行學(xué)習(xí)。
當(dāng)機(jī)械手朝下時(shí),問題就變得更加棘手。機(jī)械手不僅需要操縱物體,還需要克服重力使其不會(huì)掉落。
該團(tuán)隊(duì)發(fā)現(xiàn)一種簡單的方法可以解決復(fù)雜的問題。他們使用了深度學(xué)習(xí)的無模型強(qiáng)化學(xué)習(xí)算法,意味著該程序框架必須從與環(huán)境的交互中找出價(jià)值函數(shù),以及所謂的“師生”訓(xùn)練方法。
為此,研究人員利用物體和機(jī)械手的信息對(duì)“教師”網(wǎng)絡(luò)進(jìn)行訓(xùn)練,這些信息無法在現(xiàn)實(shí)世界中獲得,只能在模擬環(huán)境中獲得,例如指尖的位置或物體移動(dòng)速度。
為了確保機(jī)械手可以在模擬環(huán)境之外工作,“教師”網(wǎng)絡(luò)學(xué)習(xí)到的內(nèi)容將被提煉為現(xiàn)實(shí)世界中可以獲取的觀察結(jié)果,并提供給“學(xué)生”網(wǎng)絡(luò),例如攝像機(jī)捕獲的深度圖像、物體姿態(tài)和機(jī)械手的關(guān)節(jié)位置。
他們還使用了“重力課程”的學(xué)習(xí)方法,機(jī)械手首先在零重力環(huán)境中學(xué)習(xí)技能,然后慢慢地讓控制器適應(yīng)正常的重力條件,以這種形式訓(xùn)練機(jī)械手確實(shí)提高了其整體性能。
看似不是正常的學(xué)習(xí)過程,但被稱為機(jī)械手“大腦”的單個(gè)控制器可以通過這種訓(xùn)練方法重新放置大量物體,即使這些物體它以前從未見過并且不知道形狀。
三、機(jī)械手成功率受物體形狀制約
麻省理工學(xué)院教授、該研究論文作者 Pulkit Agrawal 說:“我們最初認(rèn)為,在機(jī)械手操縱物體時(shí)推斷形狀的視覺感知算法將是主要挑戰(zhàn)。相反,我們的結(jié)果表明,機(jī)械手可以學(xué)習(xí)與形狀無關(guān)的強(qiáng)大控制策略。這表明視覺感知對(duì)于操縱的重要性可能遠(yuǎn)不如我們習(xí)慣的思維方式重要,而更簡單的感知處理策略可能就足夠了。”
例如蘋果、網(wǎng)球、彈珠等小的球形物體在用機(jī)械手重新放置時(shí),其成功率接近 100%。而對(duì)于勺子、螺絲刀和剪刀等更復(fù)雜的物體放置的成功率較低,只有約 30%。
由于其成功率因?qū)ο笮螤疃兴睿搱F(tuán)隊(duì)指出,在未來基于物體形狀訓(xùn)練模型可以進(jìn)一步提高機(jī)械手性能。
結(jié)語:簡單方法解決機(jī)械手復(fù)雜難題
此次麻省理工學(xué)院研究小組推出的程序框架,可以幫助機(jī)械手重新定位不同物體,操縱機(jī)械手多指機(jī)械手使用多種復(fù)雜工具,并滿足生產(chǎn)過程中的多種需求,開辟機(jī)械手應(yīng)用的新領(lǐng)域。
該研究小組表示,由于高維驅(qū)動(dòng)空間和手指與物體之間接觸狀態(tài)的頻繁變化,手持物體重新放置方向一直是機(jī)器人技術(shù)中的一個(gè)具有挑戰(zhàn)性的問題。用簡單的“師生”方法訓(xùn)練機(jī)械手,巧妙的解決了這一復(fù)雜問題。
推薦
-
整體需求不振DDR4持續(xù)跌價(jià) 目前仍未有止跌趨勢
眾所周知,DRAM 作為存儲(chǔ)器中的重要組成部分,在半導(dǎo)體產(chǎn)業(yè)鏈當(dāng)中也是具有舉足輕重的地位,不過,DRAM...
來源:愛集微 -
雷諾首席執(zhí)行官 計(jì)劃為電動(dòng)汽車業(yè)務(wù)設(shè)立一個(gè)單獨(dú)部門
雷諾首席執(zhí)行官 Luca de Meo 本周二表示,公司計(jì)劃為電動(dòng)汽車業(yè)務(wù)設(shè)立一個(gè)單獨(dú)的部門,最終該部門可...
來源:愛集微 -
通用汽車制定全球連續(xù)性計(jì)劃 以減輕汽車行業(yè)面臨的不確定性
通用汽車公司本周一表示,已與其合作伙伴和供應(yīng)商制定了一項(xiàng)全球連續(xù)性計(jì)劃,以減輕中國疫情爆發(fā)后汽車...
來源:愛集微 -
歐盟抱團(tuán)突圍振興半導(dǎo)體 各國都在尋求領(lǐng)導(dǎo)地位
歐盟委員會(huì)公布了投入超過430億歐元的《歐洲芯片法案》(A Chips Act for Europe)。4月初,西班牙宣...
來源:人民郵電報(bào) -
元宇宙興起 Web3.0再次成為各大廠商關(guān)注焦點(diǎn)
近日,隨著元宇宙的興起,Web3 0又再次成為各大廠商關(guān)注的焦點(diǎn)。中國證監(jiān)會(huì)科技監(jiān)管局局長姚前發(fā)表文章...
來源:科技日?qǐng)?bào) -
北京市組織召開廣告牌匾規(guī)范治理工作推進(jìn)會(huì)
信息導(dǎo)覽、手機(jī)充電、5G微基站……曾一度被人們遺忘的街頭公用電話亭將被賦予更多便民服務(wù)功能,這是記...
來源:科技日?qǐng)?bào) -
年度全國十大考古新發(fā)現(xiàn)終評(píng)會(huì) 以網(wǎng)絡(luò)會(huì)議形式在京舉行
近日,由中國文物報(bào)社、中國考古學(xué)會(huì)主辦的2021年度全國十大考古新發(fā)現(xiàn)終評(píng)會(huì)以網(wǎng)絡(luò)會(huì)議形式在京舉行。...
來源:科技日?qǐng)?bào) -
銳捷網(wǎng)絡(luò)舉辦發(fā)布會(huì) 正式發(fā)布U空間解決方案
前段時(shí)間,疫情下的深圳貢獻(xiàn)了一個(gè)名場面:需遠(yuǎn)程辦公的打工人扛著主機(jī)回家,生動(dòng)詮釋了人在主機(jī)在的打...
來源:人民郵電報(bào) -
科學(xué)家收集123984張核磁共振腦掃描圖 繪制全生命周期人腦發(fā)育圖
英國《自然》網(wǎng)站6日公開的一篇論文,描述了覆蓋人類整個(gè)生命周期的大腦發(fā)育標(biāo)準(zhǔn)參考圖。這些參考圖根據(jù)...
來源:科技日?qǐng)?bào) -
直播更多》
-
特斯拉公司CEO埃隆馬斯克 向Twitter發(fā)出收購要約
和外界預(yù)期的一樣,特斯拉公司 CEO 埃...
-
特斯拉公司CEO埃隆馬斯克 向Twitter發(fā)出收購要約
和外界預(yù)期的一樣,特斯拉公司 CEO 埃...
-
筆記本電腦代工廠廣達(dá)發(fā)布公告 配合防疫政策暫時(shí)停工
筆記本電腦代工廠廣達(dá)今(13)日發(fā)布公告...
-
英特爾公司宣布斥資30億美元 擴(kuò)建美國奧勒岡州D1X工廠
英特爾公司宣布斥資 30 億美元,擴(kuò)建...
-
莆田電信積極組織開展安全運(yùn)營專項(xiàng)工作 強(qiáng)化員工安全意識(shí)
為全面落實(shí)穩(wěn)字當(dāng)頭、穩(wěn)中求進(jìn)的云網(wǎng)安...
-
精準(zhǔn)落實(shí)優(yōu)惠稅率 河北高企稅費(fèi)減免超百億元
近日,記者從河北省稅務(wù)局獲悉,2021年...
資訊更多》
-
合作伙伴解約高管...
-
全球PC出貨量降至8...
-
半導(dǎo)體行業(yè)正在努...
-
國網(wǎng)新源山東沂蒙...
-
與發(fā)達(dá)地區(qū)同頻共...
-
廣州聯(lián)通深入推進(jìn)...
焦點(diǎn)
- 奇瑞新能源一季度達(dá)成50013輛銷量 實(shí)現(xiàn)255.4%同比增長
- 昆山重新調(diào)整劃定5個(gè)靜態(tài)管理區(qū) 延長靜默期7天
- 受蘋果用戶隱私政策調(diào)整影響 科技巨頭2022年?duì)I收將減少近160億美元
- 加快湖北數(shù)字化轉(zhuǎn)型 5G信息技術(shù)重塑制造業(yè)發(fā)展形態(tài)
- 斯坦福大學(xué)團(tuán)隊(duì)發(fā)表論文 展示大腦運(yùn)動(dòng)皮層神經(jīng)網(wǎng)絡(luò)如何實(shí)現(xiàn)新記憶索引
- 廣東首座華南唯一 廣州匯云數(shù)據(jù)中心入選2021年國家新型數(shù)據(jù)中心名單
- 慢性疾病嚴(yán)重威脅我國居民健康 低齡化趨勢明顯
- 消除線路施工安全隱患 智慧光網(wǎng)云守護(hù)系統(tǒng)成為工地“火眼金睛”
- IMT-2020推進(jìn)組蜂窩車聯(lián)工作組第二十次全體會(huì)議 近日在線上舉行
- 氣候變暖將珊瑚推向耐熱極限 人工智能助力尋找耐熱珊瑚