DRONE
  • DRONE
  • MOBILITY
  • SPACE
  • ROBOTICS
  • 特集
  • コラム
  • ニュース
  • ABOUT US
Reading: マイクロソフト、ChatGPTをドローンやロボティクス制御に拡張。言語によって直感的に制御可能に
Share
DRONE
  • DRONE
  • MOBILITY
  • SPACE
  • ROBOTICS
  • 特集
  • コラム
  • ニュース
  • ABOUT US
検索
  • DRONE
  • MOBILITY
  • SPACE
  • ROBOTICS
  • 特集
  • コラム
  • ニュース
  • ABOUT US
Follow US
© 2013-2022 DRONE. All Rights Reserved.
ニュース

マイクロソフト、ChatGPTをドローンやロボティクス制御に拡張。言語によって直感的に制御可能に

マイクロソフトの自律システム・ロボティクスグループは、ChatGPTの機能をロボティクスに拡張し、複数のプラットフォームを言語によって直感的に制御できたと発表

2023年3月28日
230328_ChatGPT_top
SHARE

言語が最も直感的な意思表示方法であるにもかかわらず、ロボットを制御するために手書きのコードに大きく依存している。マイクロソフトの自律システム・ロボティクスグループのチームは、OpenAIの新しいAI言語モデル「ChatGPT」を使って、この現実を変え、人間とロボットの自然な対話を可能にする方法を探ってきたという。

- Advertisement -
Contents
ロボット工学の今日的課題、そしてChatGPTの可能性ChatGPTを使ったロボティクス:設計の原則では、ChatGPTで何ができるのか?ゼロショットタスク計画ループ上のユーザー:複雑なタスクのために会話が必要な場合知覚と行動のループ:世界を感じてから行動するロボットLLM+Robotics研究のための共同オープンソースツール「PromptCraft」ロボット工学を研究室から世界へ

ChatGPTは、膨大なテキストと人間との対話のコーパスで訓練された言語モデルで、さまざまなプロンプトや質問に対して、首尾一貫した文法的に正しい応答を生成可能だ。この研究の目標は、ChatGPTがテキストを越えて思考し、物理的な世界について推論して、ロボットのタスクに役立てることができるかどうかを確認することだという。

複雑なプログラミング言語やロボットシステムの詳細を学ぶ必要がなく、人々がより簡単にロボットと対話できるようにしたいとしている。ここで重要なのは、物理法則や動作環境のコンテキスト、ロボットの物理的な動作がどのように世界の状態を変化させるかを考慮して問題を解く方法をChatGPTに教えることなのだという。

ChatGPTはそれ自体で多くのことができることが判明しているが、まだいくらか助けを必要としている。同チームのテクニカルペーパーでは、言語モデルをロボット工学の課題解決に導くために使用できる一連の設計原則を説明。これには、特別なプロンプトの構造、高レベルのAPI、テキストによる人間のフィードバックなどが含まるが、これらに限定されるものではないという。同チームの研究は、ロボットシステムの開発方法におけるシフトの始まりに過ぎないと考えており、他の研究者がこのエキサイティングな分野に飛び込むきっかけになるよう願っているという。

- Advertisement -

同チームの方法とアイデアに関する技術的な詳細は以下の通り。

ロボット工学の今日的課題、そしてChatGPTの可能性

現在のロボティクス・パイプラインは、エンジニアやテクニカルユーザーがタスクの要件をシステムのコードに変換するところから始まる。エンジニアは、ロボットの動作を修正するために新しいコードや仕様を書く必要があり、ループの中にいることになります。このプロセスは、時間がかかり(ユーザーは低レベルのコードを書く必要がある)、コストがかかり(ロボット工学の深い知識を持つ熟練したユーザーが必要)、非効率的(物事を正しく動作させるために複数のやり取りが必要)である。

230328_ChatGPT_01

ChatGPTを使ったロボティクス:設計の原則

LLMのプロンプティングは、非常に経験的な科学である。同チームは試行錯誤の末、ロボットタスクのプロンプトを書くための方法論と設計原則のセットを構築した。

230328_ChatGPT_02

まず、高レベルのロボットAPIまたは関数ライブラリのセットを定義する。このライブラリは特定のロボットに特化したもので、ロボットの制御スタックや知覚ライブラリから得られる既存の低レベル実装にマッピングする必要があるという。ChatGPTがその動作を推論できるように、高レベルのAPIに説明的な名前を使用することが非常に重要だという。

次に、ChatGPTのプロンプトを作成し、タスクのゴールを説明すると同時に、高レベルライブラリのどの関数が利用可能かを明示。プロンプトには、タスクの制約に関する情報、またはChatGPTがどのように回答を形成するか(特定のコーディング言語、補助的な構文解析要素の使用)も含めることができる。

- Advertisement -

ユーザーは、ChatGPTのコード出力を評価するために、直接検査するか、シミュレータを使用して、ループに留まる。必要に応じて、ユーザは自然言語を使って、答えの品質と安全性についてChatGPTにフィードバックを提供する。ユーザーが納得のいく解答が得られたら、最終的なコードをロボットに展開できる。

では、ChatGPTで何ができるのか?

マイクロソフトのチームが持つコードリポジトリからいくつかの例を紹介する。

ゼロショットタスク計画

ChatGPTに本物のドローンを制御する機能を持たせたところ、技術者でないユーザーとロボットの間の言語ベースのインターフェースとして非常に直感的であることがわかった。ChatGPTは、ユーザーからの指示があいまいな場合に説明を求めたり、棚を目視するためのジグザグパターンなど、複雑なコード構造をドローンに記述したりした。さらに、自撮りの方法まで考えてくれたという。

また、Microsoft AirSimシミュレーターを使った工業検査シナリオのシミュレーションでもChatGPTを使用。このモデルは、ユーザーのハイレベルな意図と幾何学的な手がかりを効果的に解析し、ドローンを正確に制御できたという。

ループ上のユーザー:複雑なタスクのために会話が必要な場合

次に、ロボットアームによる操作シナリオでChatGPTを使用した。会話によるフィードバックで、もともと提供されているAPIをChatGPTが自らコーディングした、より複雑な高レベルの関数に合成する方法をモデルに教えた。カリキュラムに基づいた戦略により、モデルはこれらの学習したスキルを論理的に連鎖させ、ブロックを積み上げるなどの操作を行うことができるようになった。

また、「マイクロソフトのロゴを積み木で作る」という課題では、文字と物理の領域を橋渡しする事例を示した。このモデルは、内部知識ベースからロゴを呼び出すことができただけでなく、ロゴを(SVGコードとして)「描く」ことができ、さらに、上記の学習スキルを使って、既存のロボットアクションがその物理的形状を構成できることを理解できたとしている。

230328_ChatGPT_03

次に、ChatGPTに、ドローンが障害物にぶつからないようにしながら、空間上のゴールに到達するためのアルゴリズムを書くように命じた。このドローンには前方に距離センサーがあることをモデルに伝えると、ChatGPTはすぐにアルゴリズムの主要な構成要素のほとんどをコーディングした。このタスクでは人間との会話が必要だったが、ChatGPTが言語フィードバックだけで局所的にコードを改善する能力を発揮した。

知覚と行動のループ:世界を感じてから行動するロボット

何かをする(アクション)前に世界を感じる(パーセプション)能力は、あらゆるロボティクスシステムにとって基本的なものだ。そこで、ChatGPTにこの概念を理解させ、ユーザが指定した物体を見つけるまで環境を探索させることにした。そして、物体検出や物体距離などのAPIにアクセスさせ、生成されたコードが知覚と行動のループをうまく実装していることを確認した。

実験的な特徴として、ChatGPTがセンサーのフィードバックに基づいてロボットが進むべき場所をリアルタイムで決定できるかどうかを評価するために、追加の実験を行ったという(ChatGPTがこれらの決定を行うコードループを生成するのとは対照的)。興味深いことに、各ステップでのカメラ画像のテキスト記述をチャットにフィードできることを検証し、モデルは、ロボットが特定のオブジェクトに到達するまで、どのように制御するかを把握できたとしている。

LLM+Robotics研究のための共同オープンソースツール「PromptCraft」

マイクロソフトによると、ロボットタスクのためのChatGPTのようなLLMの成功には、優れたプロンプト工学が不可欠だ。残念ながら、プロンプトは経験科学であり、この分野の研究者や愛好家の助けとなる良い例(と悪い例)を持つ包括的でアクセス可能なリソースが不足しているのが現状だという。このギャップに対処するために、同チームは、誰もが異なるロボティクスカテゴリのプロンプト戦略の例を共有することができる共同オープンソースプラットフォームであるPromptCraftを紹介している。同研究で使用したプロンプトと会話はすべて公開するとしている。

プロンプトのデザインだけでなく、ChatGPTで生成したアルゴリズムをユーザーがテストできるように、複数のロボットシミュレータやインターフェイスも用意する方針。その手始めとして、ChatGPTを統合したAirSim環境も公開しており、誰でもこれらのアイデアを始めることができるようになっている。新しいシミュレータやインターフェースの提供も歓迎するとしている。

230328_ChatGPT_04

ロボット工学を研究室から世界へ

同チームは、ロボット工学をより多くの人々の手に届けることを目的として、これらの技術をリリースすることに興奮しているという。言語ベースのロボット制御が、ロボット工学を科学研究所から日常のユーザーの手に届けるための基礎になると信じているとしている。

とはいえ、ChatGPTの出力は、注意深く分析することなくロボットに直接導入することを意図していないことを強調。実生活に導入する前に、シミュレーションの力を借りてこれらのアルゴリズムを評価し、常に必要な安全策を講じることを推奨している。同チームの研究は、ロボット工学の領域で動作する大規模な言語モデルの交差点で可能なことのほんの一部にすぎないとして、今後の研究の多くを刺激することを期待しているとした。

▶︎Microsoft

DJI Matrice 4Tが広大な遊水地上空で活躍。DJI Dock 2も投入、ドローンによる「ヨシ焼き」残火確認 現場レポート
2025年3月21日
大林組とKDDIスマートドローン、ドローンポート「DJI Dock 2」を活用し能登半島で道路工事の作業効率化を推進
2024年11月20日
ドローン操縦スキル上達のために。DPA回転翼3級から国家資格がベスト![後編]
2024年9月30日
ドローン操縦スキル上達のために。DPA回転翼3級から国家資格がベスト![前編]
2024年9月30日
TAGGED: ChatGPT, Microsoft, ドローン, ロボット, ロボティクス
Kawase 2023年3月28日
Share this Article
Facebook Twitter Copy Link Print
Share
Previous Article 230328_FlightPILOT_top Flight PILOTとD.U-NET、ギガプライズが業務提携。ドローンを活用した高所メンテナンスサービス拡大へ
Next Article ACSL、ドローン「SOTEN」の活用に関する企画を募集。採択者にはSOTENを特別価格で販売
- Advertisement -

最新ニュース

250612_JD_Soradynamics_top
Soradynamics、産業用ドローン「Hayate 2」と「隼」を展示。安全に運用できる高機能性[JapanDrone2025]
特集 2025年6月12日
2540612_JD_riegl_top
RIEGLの新LiDAR「VUX-100-25」、FOV160°で133万点/秒取得能力を搭載。マルチコプターでの高効率測量を実現[JapanDrone2025]
特集 2025年6月12日
250612_JD_roboz_top
ROBOZ「Litebee Stars」が実現する小規模屋内ドローンショー。教育コンテンツとしても注目[JapanDrone2025]
特集 2025年6月12日
「DRONE SHOW JAPAN PRESENTS STARMIRAGE IN OSAKA TEMMABASHI」延べ5万5千人が天満橋エリアに来場
「DRONE SHOW JAPAN PRESENTS STARMIRAGE IN OSAKA TEMMABASHI」、延べ5万5千人が天満橋エリアに来場
ニュース 2025年6月12日
【水中ドローン体験会】カナダ製水中ドローン『DeepTrekker』自動航行機能を東京で体験し検討できる
水中ドローン体験会:カナダ製水中ドローン「DeepTrekker」自動航行機能を東京で体験し検討できる
ニュース 2025年6月11日
- Advertisement -

関連記事

250612_JD_Soradynamics_top
特集

Soradynamics、産業用ドローン「Hayate 2」と「隼」を展示。安全に運用できる高機能性[JapanDrone2025]

2025年6月12日
2540612_JD_riegl_top
特集

RIEGLの新LiDAR「VUX-100-25」、FOV160°で133万点/秒取得能力を搭載。マルチコプターでの高効率測量を実現[JapanDrone2025]

2025年6月12日
「DRONE SHOW JAPAN PRESENTS STARMIRAGE IN OSAKA TEMMABASHI」延べ5万5千人が天満橋エリアに来場
ニュース

「DRONE SHOW JAPAN PRESENTS STARMIRAGE IN OSAKA TEMMABASHI」、延べ5万5千人が天満橋エリアに来場

2025年6月12日
【水中ドローン体験会】カナダ製水中ドローン『DeepTrekker』自動航行機能を東京で体験し検討できる
ニュース

水中ドローン体験会:カナダ製水中ドローン「DeepTrekker」自動航行機能を東京で体験し検討できる

2025年6月11日
Previous Next

DRONEとは

DRONE(https://www.drone.jp/、以下本サイト)は、ドローンやマルチコプターについての本格的な解説やおすすめ、最新情報を発信する日本初のメディアとして、「Explore the Future」をタグラインに2015年スタートしました。

2022年、時代とテクノロジーの急速な進化を押さえ、ドローンを起点に、「空飛ぶクルマ」、「自動運転」、「AI」、「ロボティクス」、「電気自動車(EV)」、「宇宙関連」など、時代を変えていく国内外のテクノロジーについて、幅広くみなさまにお伝えします。

メディアパートナー

ページ一覧

  • Home
  • DRONE
  • MOBILITY
  • SPACE
  • ROBOTICS
  • 特集
  • コラム
  • ニュース
  • ABOUT US
  • プライバシーポリシー

アーカイブ

姉妹サイト

PRONEWS(プロニュース)は、デジタル映像制作専門情報Webメディア

DRONE
Follow US

© 2013-2023 DRONE. All Rights Reserved.

Welcome Back!

Sign in to your account

Lost your password?