傳動網 > 新聞頻道 > 行業資訊 > 資訊詳情

OpenAI大模型上身機器人,原速演示炸場!

時間:2024-03-20

來源:網易科技

導語:簡單動作如抓起塑料袋(抓哪里都可以),機器人基于已學習的視覺-動作執行策略,可以做出一些“下意識”的快速反應行動。

  OpenAI大模型加持的機器人,深夜來襲!

  名曰Figure 01,它能聽會說,動作靈活。

  能和人類描述眼前看到的一切:

  我在桌子上看到了一個紅色的蘋果,瀝水架上面還有幾個盤子和一個杯子;然后你站在附近,手放在桌子上。

  聽到人類說“想吃東西”,就馬上遞過去蘋果。

  而且對于自己做的事有清楚認知,給蘋果是因為這是桌上唯一能吃的東西。

  還順便把東西整理,能同時搞定兩種任務。

  最關鍵的是,這些展示都沒有加速,機器人本來的動作就這么迅速。

  接下來,我們繼續來看下Figure 01的細節。

  OpenAI視覺語言大模型加持

  根據創始人的介紹,Figure 01通過端到端神經網絡,可以和人類自如對話。

  基于OpenAI提供的視覺理解和語言理解能力,它能完成快速、簡單、靈巧的動作。

  模型只說是一個視覺語言大模型,是否為GPT-4V不得而知。

  它還能規劃動作、有短期記憶能力、用語言解釋它的推理過程。

  如對話里說“你能把它們放在那里嗎?”

  “它們”、“那里”這種模糊表述的理解,就體現了機器人的短期記憶能力。

  它使用了OpenAI訓練的視覺語言模型,機器人攝像頭會以10Hz拍下畫面,然后神經網絡將以200Hz輸出24自由度動作(手腕+手指關節角度)。

  具體分工上,機器人的策略也很像人類。

  復雜動作交給AI大模型,預訓練模型會對圖像和文本進行常識推理,給出動作計劃;

  簡單動作如抓起塑料袋(抓哪里都可以),機器人基于已學習的視覺-動作執行策略,可以做出一些“下意識”的快速反應行動。

  同時全身控制器會負責保持機身平衡、運動穩定。

  除了最先進的AI模型,Figure 01背后公司——Figure的創始人兼CEO還在推文中提到,Figure方面整合了機器人的所有關鍵組成。

  包括電機、中間件操作系統、傳感器、機械結構等,均由Figure工程師設計。

  據了解,這家機器人初創公司在2周前才正式宣布和OpenAI的合作,但才13天后就帶來如此重磅成果。不少人都開始期待后續合作了。

  由此,具身智能領域又有一顆新星走到了聚光燈下。

  “將人形機器人帶進生活”

  說到Figure,這家公司創立于2022年,正如前文所言,再次引爆外界關注,就在十幾天前——

  官宣在新一輪融資中籌集6.75億美元,估值沖到26億美元,投資方幾乎要集齊半個硅谷,包括微軟、OpenAI、英偉達和亞馬遜創始人貝佐斯等等。

  更重要的是,OpenAI同時公開了與Figure更進一步合作的計劃:將多模態大模型的能力擴展到機器人的感知、推理和交互上,“開發能夠取代人類進行體力勞動的人形機器人”。

  用現在最熱的科技詞匯來說,就是要一起搞具身智能。


中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.siyutn.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統
  • 工業電源
  • 電力電子
  • 工業互聯
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯接
  • 工業機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0