首页 报纸 正文

米東時間の水曜日、シリコンバレーの半分が投資している「ロボット界OpenAI」、スターベンチャー企業Figureは、自身初のOpenAIビッグモデルを搭載したロボットdemoを発表した。たった1つの動画で、世界の科学技術界を驚かせた。
さらに驚くべきことに、FigureがAI人型ロボット分野でOpenAIと提携したと発表してから13日しか経っていない。
Figureは3月初め、アマゾンの創業者ベソス、英偉達、OpenAI、マイクロソフトなどの大手企業から約6億7500万ドルの資金を調達し、同社の推定26億ドルに達したと発表した。
初のOpenAIロボットがやってきた!
Figureが発表した動画によると、ロボットFigure 01は人間の命令や質問を聞き取ることができ、動作が滑らかで論理的に人間にリンゴを渡し、ゴミを枠に片付け、コップや皿をアスファルトの上に置くことができる。
最も重要なのは、Figure 01の多くの行動と回答は、質問者のいくつかの開放的な質問と要求に基づいて、論理的な思考に基づいて得られたものである。これは、会話ができ、思考ができ、学習ができ、一般的なロボットよりも「人間っぽい」ことを意味する。
ビデオの冒頭で強調したように、このロボットの行為はすべて音声に基づく論理推論であり、エンドツーエンドニューラルネットワークを使用し、ビデオの全行程は1倍速で、加速されていない。
次に、本編が始まると、質問者はFigure 01に複数の質問や要望をビデオで出し始め、難易度はますます高くなってきました。
最初に「Figure 01、今何が見えますか?」と聞かれたFigure 01は、「テーブルの真ん中に赤いリンゴがあり、水切りかごとコップと皿があり、テーブルのそばに立って手をテーブルの上に置いているのを見た」と正確な答えを出した。
質問者さんは続けて、「何か食べられるものはありますか?」と質問しました。Figure 01は、赤いリンゴを滑らかに質問者さんに渡しました。
次に、質問者さんは机の上に黒いビニール袋の塊をいくつか入れ、「さっき何をしたのか説明しながら、ゴミを片付けてもらえますか」と、より難しい要求をしました。
Figure 01は、スムーズにビニール袋をかごに丸めながら、「テーブルの上で唯一食べられるものだから、りんごをあげたばかりだ」と答え、完璧な反応を続けた。
続いて質問者さんは、「あなたが今目の前にいるシーンを見て、あなたの目の前の皿はどこに行けばいいと思いますか」と、より開放的な質問をしました。
Figure 01は人間の常識に基づいて「皿とコップは水切りかごの中に入れるべきかもしれない」と答え、質問者の次の言葉で「じゃあ、そこに置いてもいいですか?」と要求した後、正確にコップと皿を水切りかごに入れた。
注目すべきは、質問者が「じゃあ、そっちに置いて行ってもいいですか(Can you put them there)?」と提案したことだ。「コップ」「皿」や「水切りかご」などのキーワードは正確には提案されておらず、代わりの名前だけを使っていることは、Figure 01が文考と記憶に結びつく能力を持っていることを示している。
質問者は最後にFigure 01に「自分はどうやって作ったと思う?」と自分の表現を評価してもらった。Figure 01は「私はよくやったと思う。リンゴは新しい主人を見つけ、ゴミは捨てられ、食器も置くべき場所に置いた」と答えた。
OpenAIが提供する超強力な脳
動画はわずか2分だが、Figure 01というロボットはすでに完全に人間と流暢に会話し、人間の自然言語の指令や意図を理解して動作し、原因を説明することができる。自分の行動を主観的に評価することもできます。
その背後にあるのが、OpenAIが提供する「脳」だ。
Figureは3月1日、OpenAIと協力して次世代人型ロボットのAIモデルを開発すると発表したばかりだ。FigureはOpenAIの最新GPTモデルに基づいてAIモデルを開発し、Figureが収集したロボット動作データを専門に訓練し、その人形ロボットが人と話したり、物を見たり、複雑なタスクを実行したりできるようにする。
わずか13日後、人工知能を備えたこの人型ロボットが大至急登場し、科学技術圏を驚かせた--AIモデルの成長速度は本当に衝撃的だった。
動画配信後、Figure 01を作成した高級AIエンジニア(動画にも登場する質問者)のコリー・リンチ(Corey Lynch)氏はFigure 01の表現についてより多くの説明をした。
「私たちのロボットはその視覚体験を記述し、将来の行動を計画し、その記憶を反省し、その推理を口頭で説明することができます」とXに書いている。
リンチ氏によると、彼らはロボットのカメラから画像を入力し、マイクでキャプチャされた音声テキストをOpenAIトレーニングの大型マルチモードモデルに転写した。
リンチ氏は、Figure 01の行為はすべて学習によって習得されたものであり、決して遠隔制御ではないと強調した。
公式サイトによると、Figure 01ロボットは身長5フィート6インチ(約1.67メートル)、体重60キロ、積載量20キロ、航続時間5時間、前進速度1.2メートル/秒。
OpenAIの技術サポートの下、Figure 01はわずか13日でこのような驚くべき学習と思考能力を達成することができます。将来的には、より「賢い」ロボットが私たちが思っているよりも早く来ることを期待させられる。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

魏洋1 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    2