訓練で人間のように学習させた自律システムは、未知の環境にも対応できるようになる可能性を秘めている


自動運転の自動車やドローンなどの自律システムを、戦場のような敵対的かつ目まぐるしく変化する環境下で効果的に使用できる技術を切り開く


車の自動運転などの自律システムは、通常は倉庫内や市街地などの高忠実度のシミュレーション環境で訓練されます。そして、自律システムが現実世界で正しい判断を下せるようにするための訓練用データを生成するには、このような訓練の環境を可能な限り現実に近いものにしなければならず、それには多大なコストと労力が費やされます。しかし、この高忠実度のアプローチでは、初めて遭遇する状況やこれまでに経験したことがない事態に対して、自律システムが脆弱であることに変わりはありません。これが、シミュレーションから現実へ(sim-to-real)のギャップとよく言われている難題です。

米国防高等研究計画局(DARPA)は急速かつ不可避の変化が伴うダイナミックな環境下でも、確実にかつ迅速に作動する自律システムへの技術移行を実施することでこの課題に対応しようとしており、Alvaro Velasquez氏の指揮のもと、「Transfer from Imprecise and Abstract Models to Autonomous Technologies:TIAMAT(意訳:不正確かつ抽象的なモデルから自律技術への移転)」という研究プログラムを立ち上げました。

TIAMATは、特に防衛用途に耐えうるような、柔軟な自律性の実現に向けて開発を進めています。防衛分野での自律システムは、倉庫で働くロボットや自動運転の車のように制御された環境での運用を期待されるわけではありません。防衛分野で使用できるような自律システムとは、事前に観察されていなかったような動的特性を持つ新型の車両に遭遇したり、爆弾で被害を受けた建物や瓦礫が散乱した道路を通行したり、様々な明るさの照明や気象条件に対応するなど、予測できない出来事や観察データのばらつきに対応できなければなりません。さらに、自律走行の車両や航空機は、システムの機能を妨害しようとする敵軍の潜在的な攻撃にも耐えられなければなりません。

SRIは、人間の学習からインスピレーションを得た、新しい学習ベースのパラダイムである「FLASH」を開発しています。このFLASHは、データを大量に必要とする現在主流の学習手法に代わって、新しい環境に簡単に転送できる抽象化を作成する能力を持つ新しい学習ベースのパラダイムです。このようにして、FLASHは防衛分野で必要とされる柔軟性とレジリエンスを提供します。

SRIのNeuro-symbolic Computing and Intelligence(NuSCI)リサーチグループのテクニカルディレクターであり、FLASHの主任研究者であるSusmit Jhaは、「FLASHを使って、非構造的で斬新であり、かつシステムを欺こうとするアクティブな敵が存在するような、ダイナミックな経験のない環境で運用できるように、自律システムを訓練することを目指しています」と述べています。

sim-to-real(シミュレーションから現実へ)のギャップを埋める

FLASH(Functionality-based Logic-driven Anchors with Semantic Hierarchy)が採用している新しい方法論は、ここ数十年の主流である機械学習の手法とは一線を画しています。従来の方法は、膨大な量のデータを使ってアルゴリズムを学習して、可能な限り現実的な環境を描写することを目指しています。

たとえば、椅子を認識するときに、従来の方法では何千もの椅子の画像をモデルに提示して、「椅子」とは通常、水平の平面に4本の脚がついており、一方の側に縦の平面がついているように見える物体であると記憶させます。

ですが、どれほど大量の訓練セットを用意しても、現実世界にある椅子の全種類を網羅することはできないでしょう。そしてこのモデルを現実世界で使ってみると、リクライニングチェアのような脚のない椅子や3本脚の椅子、背もたれが非常に細長い椅子などは誤認識する可能性があります。このような現実世界の多様性を理解するときに、柔軟性が欠如しているということが、「sim-to-realのギャップ」の一例としてあげられます。

「最低限の再訓練しか必要としない、多様かつ新しい環境でも作動する自律システムを作ることができるはずです」―Susmit Jha

SRIの研究者たちは、FLASHに、椅子とはどのようなものかということをセマンティックス(意味論)の観点から抽象的に評価させることで、このギャップを埋めようとしています。これによりFLASHは、物理的に定義した外観にこだわるのではなく、「椅子」というものの意味や目的を集約させるのです。セマンティックスの観点から見ると、椅子というものは座るためのものであり、それは石を積み重ねたものもあるし、木の板に脚が4本ついているようなものもあります。

「つまり、『椅子』は、大規模データセットの中でラベル付けした物体としてだけではなく、その使用可能性、ならびに相手方との相互関係によって本来の意味を定義されるのです。視覚的に類似していることはもはや唯一の手がかりではなく、意味的に抽象化して機能性をとらえるという学習に重点を置いています」とJhaは述べています。

Jhaによると、形状の厳密な定義に当てはまるかということではなく、その物体の機能がどのようなものであるかを理解できるモデルを開発すれば、最低限の再訓練にて多様な新しい環境でも作動する自律システムを作ることは可能だろうとのことです。

「システムが全く新しい環境、例えば爆撃を受けた建物がある市街戦の地区に入る場合、シェルターやドア、道路といった概念は、システムがこれまで訓練してきたモノとは異なるでしょう。しかし、このシステムが人間のように抽象化して一般化できれば、問題なく効果的に作動します。加えて、FLASHを搭載した自律システムは、現実世界に対して柔軟かつ意味的の観点からとらえる概念を有していることから、敵による妨害に対しても脆弱性が低く、レジリエンスがより高くなると考えられています」とJhaは述べています。

ビッグデータから効率的な抽象化へ

これまで機械学習が採用してきた「ビッグデータ」戦略は、データセットの範囲と規模を継続的に拡大しつつ、性能を向上させることで大きな成功を収めてきました。

しかし、これまで以上に大規模な訓練セッションを実施するのに必要となるエネルギー量とコストは莫大なものとなっており、テクノロジー関連企業が新たな原子力発電所への投資を推進するほど需要が高まっています。抽象化を用いることで、「規模拡大の法則を破ることができるのではないか」とJhaは期待を寄せており、「私たちのモデルは、従来と比べてはるかに少ないデータ量でも、新しい環境や敵対的な環境であってもうまく対応できると示すことができます」と述べています。

そして、Jhaはこのように続けました。「私たちはFLASHに大きな期待を寄せています。より大きな、そしてさらに大きなデータを、というアプローチには限界があると思われます。抽象化を使って学習すれば、新しい環境に迅速に対応できるという、人間が持つ素晴らしい能力が活用できるようになるでしょう」

SRIとの提携について詳細をご覧になりたい方は、こちらまでお問い合わせください

配布声明A:公的なリリースが承認されています。配布に制限はありません。
(Distribution Statement A: approved for public release, distribution is unlimited.)


Read more from SRI