又大又粗又猛免费视频久久_国产理论在线播放_久久男人av资源网站免费软件_99国产精品无码

<menu id="rnfsa"></menu>

<samp id="rnfsa"><i id="rnfsa"><nobr id="rnfsa"></nobr></i></samp><strike id="rnfsa"><i id="rnfsa"></i></strike>

<menu id="rnfsa"></menu>

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

科研百科 2024年4月15日下午2:16 46

克雷西發(fā)自凹非寺

量子位 | 公眾號 QbitAI

斯坦福的ALOHA家務(wù)機器人團隊，發(fā)布了最新研究成果——

項目名為Yell At Your Robot（簡稱YAY），有了它，機器人的“翻車”動作，只要喊句話就能糾正了！

而且機器人可以隨著人類的喊話動態(tài)提升動作水平、即時調(diào)整策略，并根據(jù)反饋持續(xù)自我改進(jìn)。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

比如在這個場景中，機器人沒能完成系統(tǒng)設(shè)定的“把海綿放入袋子”的任務(wù)。

這時研究者直接朝它喊話，“用海綿把袋子撐得再開一些”，之后就一下子成功了。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

而且，這些糾正的指令還會被系統(tǒng)記錄下來，成為訓(xùn)練數(shù)據(jù)，用于進(jìn)一步提高機器人的后續(xù)表現(xiàn)。

有網(wǎng)友看了說，既然已經(jīng)能朝著機器人喊話了，那汽車是不是也快點安排上，還在線點名特斯拉和其自動駕駛軟件總監(jiān)Ashok Elluswamy。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

成果發(fā)布后，前谷歌機器人高級研究員Eric Jang，前DeepMind研究員、斯坦福客座教授Karol Hausman等一眾大佬也紛紛表示了肯定和贊許。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

那么，用喊話調(diào)整的機器人，都能實現(xiàn)什么樣的動作呢？

喊話就能發(fā)號施令

利用YAY技術(shù)調(diào)教后，機器人以更高的成功率挑戰(zhàn)了物品裝袋、水果混合和洗盤子這三項復(fù)雜任務(wù)。

這三種任務(wù)的特點是都需要兩只手分別完成不同的動作，其中一只手要穩(wěn)定地拿住容器并根據(jù)需要調(diào)整姿態(tài)，另一只手則需要準(zhǔn)確定位目標(biāo)位置并完成指令，而且過程中還涉及海綿這種軟性物體，拿捏的力度也是一門學(xué)問。

以打包裝袋這個任務(wù)為例，機器人在全自主執(zhí)行的過程中會遇到各種各樣的困難，但通過喊話就能見招拆招。

只見機器人在將裝袋的過程中不小心把海綿掉落了下來，然后便無法再次撿起。

這時，開發(fā)者直接朝它喊話，口令就是簡單的“往我這邊挪一挪，然后往左”。

當(dāng)按照指令做出動作后，第一次還是沒成功，但機器人記住了“往左”這個指令，再次左移之后便成功把海綿撿起來了。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

但緊接著就出現(xiàn)了新的困難——袋子的口被卡住了。

這時只要告訴它再把袋子打開一點點，機器人就“心領(lǐng)神會”，調(diào)整出了一系列后續(xù)動作，并最終成功完成任務(wù)。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

而且不只是能糾正錯誤，任務(wù)的細(xì)節(jié)也能通過喊話實時調(diào)整，比如在裝糖的任務(wù)中，開發(fā)者覺得機器人拿的糖有點多了，只要喊出“少一點”，機器人就會將一部分糖果倒回盒子。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

進(jìn)一步地，人類發(fā)出的這些指令還會被系統(tǒng)記錄并用作微調(diào)，以提高機器人的后續(xù)表現(xiàn)。

比如在刷盤子這項任務(wù)中，經(jīng)過微調(diào)之后的機器人清潔力度更強，范圍也變大了。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

統(tǒng)計數(shù)據(jù)表明，機器人在經(jīng)歷這種微調(diào)之后，平均任務(wù)成功率提高了20%，如果繼續(xù)加入喊話指令還能繼續(xù)提高。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

而且這樣的指令-微調(diào)過程可以迭代進(jìn)行，每迭代一次機器人的表現(xiàn)都能有所提升。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

那么，YAY具體是如何實現(xiàn)的呢？

人類教誨“銘記在心”

架構(gòu)上，整個YAY系統(tǒng)主要由高級策略和低級策略這兩個部分組成。

其中高級策略負(fù)責(zé)生成指導(dǎo)低級策略的語言指令，低級策略則用于執(zhí)行具體動作。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

具體來說，高級策略將攝像頭捕捉到的視覺信息編碼，與相關(guān)知識結(jié)合，然后由Transformer生成包含當(dāng)前動作描述、未來動作預(yù)測等內(nèi)容的指令。

而低級策略接收到語言指令后，會解析這些指令中的關(guān)鍵詞，并映射到機器人關(guān)節(jié)的目標(biāo)位置或運動軌跡。

同時，YAY系統(tǒng)引入了實時的語言糾正機制，人類的口頭命令優(yōu)先級最高——經(jīng)識別后，直接傳遞給低級策略用于執(zhí)行。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

且在這個過程中命令會被系統(tǒng)記錄并用于微調(diào)高級策略——通過學(xué)習(xí)人類提供的糾正性反饋，逐漸減少對即時口頭糾正的依賴，從而提高長期任務(wù)的自主成功率。

在完成基礎(chǔ)訓(xùn)練并已經(jīng)在真實環(huán)境中部署后，系統(tǒng)仍然可以繼續(xù)收集指令信息，不斷地從反饋中學(xué)習(xí)并進(jìn)行自我改進(jìn)。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

作者簡介

本項目的第一作者是斯坦福大學(xué)的學(xué)生研究員Lucy X. Shi，2019年畢業(yè)于人大附中后進(jìn)入南加州大學(xué)就讀計算機科學(xué)專業(yè)。

其間，Lucy曾到英偉達(dá)實習(xí)研究多模態(tài)大模型，并曾與知名AI學(xué)者Jim Fan博士合作。

她的論文曾連續(xù)兩年被機器人頂會CoRL收錄，還入選過NeurIPS，本人還被DeepMind邀請發(fā)表過演講。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

Lucy的導(dǎo)師Chelsea Finn是斯坦福計算機科學(xué)和電氣工程系助理教授，谷歌學(xué)術(shù)論文引用數(shù)超4.7萬，此前還在Google Brain工作過一段時間。

包括本項目在內(nèi)，在ALOHA團隊發(fā)表的一系列論文當(dāng)中，F(xiàn)inn總是作為通訊作者出現(xiàn)。

此外，ALOHA團隊的Tony Z. Zhao、Sergey Levine等研究人員，也是本文的共同作者。

斯坦福團隊新作：喊話就能指導(dǎo)機器人，任務(wù)成功率暴增（斯坦福機器人介紹）

論文地址：
https://arxiv.org/abs/2403.12910

— 完 —

量子位 QbitAI · 頭條號簽約

關(guān)注我們，第一時間獲知前沿科技動態(tài)

上一個：用于 AI 和 ML 的 7 個 Python 庫（python ai模塊）

下一個：湖北改革完善科研經(jīng)費管理（湖北改革完善科研經(jīng)費管理制度）

聯(lián)系我們

聯(lián)系我們

在線咨詢

返回頂部

<dfn id="xgado"><rt id="xgado"><em id="xgado"></em></rt></dfn>

<samp id="xgado"><i id="xgado"><nobr id="xgado"></nobr></i></samp>