科技前沿：算法讓機器狗在一小時內(nèi)學會走路

導(dǎo)讀智能機器人像新生動物一樣，一個四足機器人在第一次嘗試行走時會絆倒。但是，雖然小馬駒或長頸鹿需要更長的時間才能掌握行走，但機器人只需一個小時就能學會流暢地向前移動。計算機程序充當動物脊髓的人工演示，并學習在短時間內(nèi)優(yōu)化機器人的運動。人工神經(jīng)網(wǎng)絡(luò)在開始時尚未進行理想調(diào)整，但可以快速自我調(diào)整。

智能機器人像新生動物一樣，一個四足機器人在第一次嘗試行走時會絆倒。但是，雖然小馬駒或長頸鹿需要更長的時間才能掌握行走，但機器人只需一個小時就能學會流暢地向前移動。計算機程序充當動物脊髓的人工演示，并學習在短時間內(nèi)優(yōu)化機器人的運動。人工神經(jīng)網(wǎng)絡(luò)在開始時尚未進行理想調(diào)整，但可以快速自我調(diào)整。

新生長頸鹿或小馬駒必須學會用腿走路，以盡可能快地避開捕食者。動物天生具有位于脊髓的肌肉協(xié)調(diào)網(wǎng)絡(luò)。然而，學習腿部肌肉和肌腱的精確協(xié)調(diào)需要一些時間。最初，幼年動物嚴重依賴硬連線脊髓反射。接下來，必須練習更先進和精確的肌肉控制，直到神經(jīng)系統(tǒng)最終很好地適應(yīng)幼年動物的腿部肌肉和肌腱。

斯圖加特馬克斯·普朗克智能系統(tǒng)研究所（MPI-IS）的研究人員進行了一項研究，以了解動物是如何學會走路和從絆倒中學習的。他們制造了一個四條腿、狗大小的機器人，幫助他們了解細節(jié)。

MPI-IS動力運動研究小組的前博士生菲利克斯·魯佩特（Felix Ruppert）說：“作為工程師和機器人專家，我們通過制造一種具有與動物一樣的反射功能并能從錯誤中學習的機器人來尋找答案。但是如果它經(jīng)常絆倒，它會給我們一個衡量機器人行走能力的標準。”

Felix Ruppert是《在閉環(huán)中央模式生成器中學習機器人動力學的塑料匹配》一書的第一作者，該書于2022年7月18日發(fā)表在《自然機器智能》雜志上。

學習算法優(yōu)化虛擬脊髓

在一個小時內(nèi)學會走路后，魯佩特的機器人很好地利用了其復(fù)雜的腿部力學。貝葉斯優(yōu)化算法指導(dǎo)學習：測量的腳部傳感器信息與作為程序在機器人計算機中運行的模擬虛擬脊髓的目標數(shù)據(jù)相匹配。機器人通過不斷比較發(fā)送的和預(yù)期的傳感器信息、運行反射回路和調(diào)整其電機控制模式來學習行走。

該學習算法適應(yīng)中央模式生成器（CPG）的控制參數(shù)。在人類和動物中，這些中央模式發(fā)生器是脊髓中的神經(jīng)元網(wǎng)絡(luò)，在沒有大腦輸入的情況下產(chǎn)生周期性肌肉收縮。中央模式生成器網(wǎng)絡(luò)有助于生成有節(jié)奏的任務(wù)，如行走、眨眼或消化。此外，反射是由連接腿部傳感器和脊髓的硬編碼神經(jīng)通路觸發(fā)的非自愿運動控制動作。

只要小動物在一個完全平坦的表面上行走，中央肌電圖就足以控制來自脊髓的運動信號。然而，地面上的一個小腫塊改變了行走。反射開始并調(diào)整動作模式，以防止動物摔倒。運動信號中的這些瞬時變化是可逆的，或“彈性的”，并且在干擾后，運動模式恢復(fù)到其原始配置。

但是，如果動物在許多運動周期中沒有停止跌跌撞撞——盡管有積極的反射——那么必須重新學習運動模式并使其“可塑”，即不可逆。在新生動物中，CpG最初調(diào)整得不夠好，動物在平坦或不平坦的地形上蹣跚而行。但是，這種動物很快學會了它的中央處理器和反射如何控制腿部肌肉和肌腱。

拉布拉多大小的名為“莫蒂”的機器狗也是如此。更重要的是，機器人在大約一個小時內(nèi)比動物更快地優(yōu)化其運動模式。莫蒂的中央處理器是在一個小而輕的計算機上模擬的，該計算機控制著機器人腿的運動。這個虛擬脊髓被放置在四足機器人的背部，頭部所在的位置。在機器人順利行走所需的一小時內(nèi)，來自機器人腳的傳感器數(shù)據(jù)會不斷與機器人的中央處理器預(yù)測的預(yù)期著陸進行比較。如果機器人絆倒，學習算法會改變腿來回擺動的距離、擺動的速度以及腿在地面上的長度。調(diào)整后的運動也會影響機器人如何更好地利用其柔順的腿部力學。在學習過程中，中央處理器發(fā)送適應(yīng)的電機信號，使機器人從此減少絆倒并優(yōu)化其行走。在這個框架中，虛擬脊髓沒有關(guān)于機器人腿部設(shè)計、電機和彈簧的明確知識。由于對機器的物理一無所知，它缺少一個機器人“模型”。

Ruppert解釋說：“我們的機器人實際上是‘天生’的，對腿的解剖結(jié)構(gòu)或工作方式一無所知。CPG類似于自然界提供的內(nèi)置自動行走智能，我們已經(jīng)將其傳輸?shù)綑C器人。計算機產(chǎn)生控制腿部電機的信號，機器人最初行走和絆倒。數(shù)據(jù)從傳感器返回虛擬脊髓，在那里比較傳感器和CPG數(shù)據(jù)。如果傳感器數(shù)據(jù)與預(yù)期數(shù)據(jù)不匹配，學習alg算法改變行走行為，直到機器人行走良好，沒有絆倒。在保持反射活躍和監(jiān)測機器人步履蹣跚的同時，更改中央處理器輸出是學習過程的核心部分。”

節(jié)能機器人狗控制

莫蒂的電腦在行走過程中只消耗5瓦的電力。知名制造商生產(chǎn)的工業(yè)四足機器人已經(jīng)學會了在復(fù)雜控制器的幫助下運行，因此耗電量要大得多。他們的控制器用機器人的精確質(zhì)量和身體幾何形狀的知識編碼——使用機器人模型。它們通常需要幾十瓦，甚至幾百瓦的功率。這兩種機器人都能動態(tài)高效地運行，但在斯圖加特模型中，計算能耗要低得多。它還提供了對動物解剖學的重要見解。

亞歷山大·巴德里·斯普羅維茨（AlexanderBadri Spr witz）說：“我們不容易研究活動物的脊髓。但我們可以在機器人中模擬一個。”他與魯佩特（Ruppert）共同撰寫了這本出版物，并領(lǐng)導(dǎo)著動態(tài)運動研究小組。“我們知道許多動物中都存在這些CpG。我們知道反射是嵌入的；但我們?nèi)绾螌烧呓Y(jié)合起來，使動物通過反射和CpG學習動作？這是機器人學和生物學交叉點的基礎(chǔ)研究。機器人模型為我們回答了生物學本身無法回答的問題。”

以上就是小編的分享，希望可以幫助到大家。

為你推薦

資訊專欄

熱門視頻

相關(guān)推薦

科技

美食

生活

娛樂

健康

母嬰

教育

體育

更多

汽車

游戲

旅游

時尚

財經(jīng)

寵物

視頻號

抖音

快手

微博

首頁

電子數(shù)碼

互聯(lián)網(wǎng)

APP應(yīng)用

智能硬件

軟件測評

手機系統(tǒng)

5G/6G

科技百科

人工智能

科技前沿：算法讓機器狗在一小時內(nèi)學會走路