SRIの75年間のイノベーション：コミュニケーション、コネクティビティ、デジタルアシスタント

人間とデジタル技術のつながりをよりクリアなものへ

SRIの英語ブログでは、2021年11月の75周年を迎える日まで、SRIが設立された1946年から現在に至るまでの数々の画期的なイノベーションに関するブログを毎週リリースしています。こちらの「75年間のイノベーション」シリーズでは、その中からいくつかを日本語にてご紹介しています。

「オーグメンテーション(拡張: Augmentation)が新たなレベルにステップアップするには、コンピューターは人の会話を理解するようにならなければなりません。既に特定の分野ではいくつかのシステムによって可能となっていますが、これらはまだ人間とコンピューターが相互にかかわりあう基本的なメカニズムのきっかけに過ぎません。」 – William Mark, President, Information and Computing Sciences, SRI International

人間は社会的な生き物です。コミュニケーションをとり、お互いとつながることを好みます。そして、近年のデジタルコミュニケーションにおける発展は、20世紀半ばのSF作家が夢見たような「コミュニケーション」や「つながり（コネクション）」の形態を実現しています。SRIインターナショナルはまさにその夢を実現できるよう、コミュニケーションとコネクティビティには特に注目しています。ここでは、AI対応のデジタルアシスタントと関連するコネクティビティやコミュニケーションの分野に取り組むチームの、過去から現在、そして未来についてご紹介します。

過去を基盤とした未来の発展

現在、私たちが当たり前のように利用しているコネクティビティは、SRIの優秀なスタッフの貢献によるものといっても過言ではありません。1960年代に開発されたARPANETは、地域を超えてコンピューティングとコミュニケーションシステムを接続することを想定しており、やがてこのビジョンはSRIが重要な役割を果たしたコンソーシアムによって現実となりました。ARPANETは初期のインターネットであったとともに、繋がる世界の始まりでもあり、コミュニケーションやコネクティビティ、そしてデジタルアシスタントの分野におけるそれ以降の基礎となるものでした。

・デジタルアシスタント（Siri）

SRIは、AIシステムの中でも最も有名な１つである「Siri」を生み出しました。2010年からAppleのiPhoneに搭載されているSiriは、発話と自然言語理解力の発展を基礎に開発されています。

・ CALO — 人工知能と機械学習

Siriが登場する以前には、CALO（Cognitive Assistant that Learns and Organizes、学習・整理する認知アシスタント）というプロジェクトがありました。人工知能の長年の目標は、ユーザーが何を必要としているかを学習し、ユーザーのパートナーとしてタスクをこなすデジタルアシスタントとなることです。SRIは2003年に、米国防総省高等研究計画局（DARPA）の「学習するパーソナルアシスタント（Personal Assistant that Learns：PAL）」プログラムの一環としてCALOの開発に着手しました。これまでのデジタルアシスタントとは異なり、CALOは「自然な状態で学習する」というコンセプトに基づいており、どのように行動するかのモデルをしっかりプログラムするのではなく、機械学習を用いて学びます。

・ OAA （Open Agent Architecture、オープンエージェントアーキテクチャ）

デジタルアシスタントやAIエージェントには、その運用をサポートするように設計された専用フレームワークが必要です。SRIは1990年代にソフトウェアエージェントに向けたコンピュータプログラミングの方法論として、OAA®（Open Agent Architecture、オープンエージェントアーキテクチャ）を開発しました。コンピューティングの世界では分散化と接続性がますます進んでおり、OAAはソフトウェアのエージェントがオーディオやビデオ、そしてマルチメディアなどの様々なデータフォーマットを利用できるようにしました。

未来に向けて

SRIの研究者は今後も、人工知能と人間を中心に据えたコンピューター・インタラクションの境界を広げるとともに、新しい技術的アプローチを開拓し、新たなスピンオフ企業の設立を続けていきます。

・デジタルスペシャリスト

Siriなどの広く普及したデジタルアシスタントは、ユーザーのインターネットの検索や、簡単なコマンドの実行を自然に実施する方法を提供するジェネラリストです。このようなアシスタントは特定の分野に関する深い知識を備えているわけではないため、ユーザーが複雑な作業をする際にはサポートできません。SRIの研究者たちは、「デジタルスペシャリスト」のための技術、つまり特定の分野に関する豊富な知識を備えてユーザーの実際のタスクを効率的に処理できるデジタルアシスタントの実現に取り組んできました。例をあげると、SRI Ventureのスピンアウト企業であるKasistoは、金融業界向けのバーチャルアシスタントのAIプラットフォームを提供しています。このバーチャルアシスタントは、銀行業務に関連する豊富な知識を具現化し、様々な銀行業務を人間の介さずに、完全にオンライン上での実施を可能とします。

・ AIとの会話

会話は人間にとって、人との交流や共同作業を行うために重要なメカニズムです。現在のデジタルアシスタントは単発的な会話には便利ですが、実際のおしゃべりには対応できません。SRIの研究者は会話に関する知能（インテリジェンス）の研究を通して、人間の会話のメカニズムを大量にデジタルアシスタントに実装し、人間と会話できる能力を取得することを目指しています。私たちにとっては当たり前である「話す」という能力は、実はとても複雑なのです。人間の会話は、音声や視覚的な合図を互いに送り合いながら、誰が話しを続けるのか、いつ返事をするのか、いつさえぎるのかなどを協調しながら決めています。それだけでなく、同時に様々な関連話題の内容をも保持しながら行っているのです。研究者たちは、「自然な会話」の仕組みを理解して、デジタルアシスタントが真の会話のパートナーとなるための機能を拡張しようとしています。

・深く考えるAI（Introspective AI）と説明能力（explainability）

深く考えるAI（Introspective AI）はSRIが現在研究している中でもとても注力している分野で、また非常に重要とされている新しい分野です。この研究が目指しているのは、AIシステムが自らの限界を理解し、わかったことを人間のオペレーターに説明できるメカニズムの実現です。これは、最新世代の大規模なデータ駆動型AIシステムにとっては特に難しいことなのです。なぜならこのような最新のAIシステムは、学習したデータに基づいてかなり複雑な現実世界のモデルを構築しているからです。しかし、１つのミスが重大な影響を及ぼす可能性のある分野を安全に展開するためには、この複雑なモデル内で具体化された概念を理解して、自らその限界を認識することは欠かすことができません。今後の展開に不可欠な「説明能力（Explainability）」とは、AIによる意思決定の根拠を人間が理解できるように説明することです。そしてこの根拠は、意思決定の検証やシステムに何らかのバイアスがかかっていないことを確認するために使用されます。

SRIの研究者たちは、包括的な学際的アプローチが説明能力を実現するために必要であると考えています。SRIはある記事の中で、「信頼できるコンピューターシステムを作るには、システム設計から知識表現に至るまでコンピューターサイエンスの様々な分野での進歩が必要です。システムの内部で何が発生しても、どこまでコンピューターを信用していいのかを理解するには、時間と経験が必要です」と述べています。

・ディープフェイクの検出

AIには負の側面もあります。AIが悪用される可能性のある分野の1つに、「ディープフェイク」があげられます。ディープフェイクの動画ではAIが偽装の一端を担い、被写体がほどんど何でも発言できるようにしてしまいます。AI技術の進歩によって、本物とほぼ見分けがつかないようなディープフェイクの動画作成が可能になりましたが、幸いなことに、AIの技術はディープフェイクの検出にも活用できます。SRIは画像と付随する音声との間のわずかな不一致を識別することでディープフェイクを検出する最先端技術に取り組んでいます。

・深層学習（Deep learning）とDASL

深層学習はデータの中に隠された知見を解き明かす力を秘めています。しかし、深層学習システムには大量の学習データが必要であり、十分なデータがあったとしても、モデルの学習には時間とコストがかかることが多く見受けられます。必要なデータ量を削減する方法の一つとして、人間の専門家の知識を取り入れることがあげられます。SRIはディープアダプティブセマンティックロジック（DASL：Deep Adaptive Semantic Logic）と呼ばれる、「データからの学習と人間の専門知識の組み合わせ」を支援するフレームワークを開発しています。DASLのベースは、人間の知識をまさに機械に埋め込むハイブリッドなAIモデルです。これまでのSRIの研究では、この手法によって精度を犠牲にすることなく、必要なデータ量を桁違いの量までに削減できることが証明されました。さらに、「学習」を人間が期待する解決策に向けて誘導する方法を提供し、説明能力を支援しています。この応用例としては、医療診断や集積回路テスト、分子設計などがあげられます。

SRIインターナショナルは、コミュニケーション、コネクティビティ、デジタルアシスタントの各分野で世界最高水準の技術を今後も提供していきます。

参考資料：

Digital Assistants (Siri) 日本語ブログ：Siriの誕生秘話 – 如何にしてコンピューターに声をもたらしたのか

CALO 日本語ブログ：Cognitive Assistant that Learns and Organizes – 学習・整理する認知アシスタント

OAA（英語ブログ）: https://medium.com/dish/75-years-of-innovation-open-agent-architecture-software-oaa-112c14ce2730

ARPANET 日本語ブログ：現代のインターネットを誕生させたコラボレーションプロジェクト

Deep Knowledge and the Rise of Virtual Specialists: https://www.sri.com/blog-archive/deep-knowledge-and-the-rise-of-virtual-specialists/

DASL: http://dasl.sri.com/dasl-machine-learning-small-data?hs_preview=yjfLmzsZ-48284860015

Deep Fakes: https://www.sri.com/case-studies/spotting-audio-visual-inconsistencies/