機械学習と人間の専門知識を組み合わせるDASLは、さまざまな応用分野で知見を提供できる
SRIの研究者たちは、各分野の専門家たちにより多くの答えと情報を提供していますが、学習に必要なデータセットに膨大なデータ量を必要としないシステムを構築するという、新たなアプローチでAIの世界に取り組んでいます。この取り組みに特化したプロジェクトが、次世代AIの一種であるDASL(Deep Adaptive Semantic Logic、「ダズル」)です。
この新しいアプローチによって、化学者は世界中の同じ分野の専門家たちが集めた知識を使って新薬を探索できるようになります。医師にとっては、大陸の反対側など全く違う場所でで他の医師がより多くの経験を重ねているかもしれない、珍しい種類の癌について理解を深められるかもかもしれません。特定の地域で一定の技術を使って研究している気候科学者たちは、お互いの研究やその成果から恩恵を受けられます。
事実として、大きな問題を解決するにあたり、この例はほとんどすべての産業に応用できます。DASLの基礎となっているのは、学習と論理的思考を組みわせたAIモデルです。
DASLの鍵は、機械学習と論理ベースの自動推論というAIのモダリティを、人間の知識と組み合わせたことにあります。このハイブリッドのアプローチの実用化にあたっては、人間の専門知識を基にして構成したルールを特定のアプリケーションに組み込みます。機械学習が増強されていることから、DASLはすべての可能性をしらみつぶしに計算する必要がないため、時間とリソースを無駄にすることがありません。これは、何兆ものAIモデルのパラメータを訓練するため、データセットは限りなく大きく、そしてそのデータセットで膨大な計算を実行するという、AIの世界では現在主流である大きければ大きいほうが良いという考え方とは正反対です。
「よりハードではなく、よりスマートに」を信条とするDASL
SRIのAIセンターで、Advanced AnalyticsグループのAssociate Technical DirectorであるJohn Byrnesは次のように述べています。「DASLは、大規模なインフラ、電力消費、時間を必要とすることなく、強力なAIを構築するのに役立ちます。つまり、DASLは少量のデータしか利用できない場合や、入手可能なデータの多くがノイズである場合でも、そのアプリケーションに特化してカスタマイズしたビジネスソリューションを構築することができるということです。しかも、作業を実施するために必要なリソースもこれまでより少なくて済みます。
SRIは何年も前からDASLの開発を続けており、予知保全、創薬、災害救援、国家安全保障、医療診断、サプライチェーン管理、保険などの分野で早くから応用しています。各企業の要件を満たしたルールに則ったモデルを構築するという、それぞれにカスタマイズしたアプローチは、汎用的なビッグデータというAIの傾向に逆行するものです。
DASLは現在、SRIからスピンアウトした2つのスタートアップ企業である、ヘルスケア診断を手掛けるDecodedHealthと、創薬ならびに先端材料研究に取り組むSynfiniで活用されています。
「DASLは、未来のAIに対して、複雑な課題に対処するにあたり、膨大なデータを必要としないという、従来とは異なるビジョンを示しています。これまでとは違い、特定のアプリケーションの『言語を話せる』カスタムメイドの小規模データAIを利用してソリューションを生成することができるのです」とByrnesは述べています。
DASLが活躍する
人間の専門知識を取り入れたDASLの実用的な例として、Byrnesは創薬をあげました。ある製薬会社の化学者が、少数に絞り込んだ見込みがあると思われる最初の段階の化合物をもとに、がんに効く新しい化合物を探しているとしましょう。似たような化合物を進化させたものを1つずつ合成するのは労力とコストがかかりますが、化学者たちはAIを利用して目的とする化合物をバーチャルに合成することができるのです。
これまで、創薬に使用する従来型の機械学習モデルでは、高度な計算能力で何百万もの構成を試行錯誤して追求し、より詳細な研究に進む価値があると思われる「一握りの化合物」に到達するまで、何週間もかける必要がありました。
DASLを使えば、化学の「言語」ともいえる基本的なルールと、応用、つまり関連する人間の知識(例えば、ある一連のカテゴリーに所属する分子構造の一部は、毒性レベルの関係で使えないだろうということ等)を組み合わせて、モデルを構築することができます。DASLはこのような医薬品化学の専門知識を、初期の化合物の小規模データセットと組み合わせて、実践的な新しい化合物を推奨できるのです。
「この例では、化学者は専門的な知識を備えていますが、問題の全体を解決するには不十分であり、また、重要なデータも手の内にあるものの、これも問題の全体を解決するには不十分であると思われます。このような例は、DASLを使用してデータと人間の知識を統一した枠組みの中で活用することによって、対処することが可能です」とByrnesは述べています。
重要なのは、DASLを使用して生成したソリューションは、最初のモデル作成の一度きりで終わりとしまうのではなく、むしろDASLのデータに基づいて、クライアント側が新たなパラメータを入力してさらにDASLを活用することができるということです。薬剤化合物の例でクライアントが望むのは、先に特定した有望な部分構造の組み合わせを保持したり、変化させたり、最適化させたりしたモデルではないかと思われます。
DASLの仕組み
DASLの核心は、人間の専門知識のガイダンスを受けながら自己学習する一連のニューラルネットワークです。このガイダンスによって、DASLは機械学習から多くの推測を排除することが可能になります。現在の総当たり的なアプローチでは、汎用的かつ大規模なデータセットと、ユーザーが要求する答えとの間のギャップを埋めるのは、データと矛盾しない任意の推測です。小規模なデータセットでは外れの推測も当たりである(一致する)と出てしまうかもしれませんが、DASLにはモデルに組み込んでいる専門家の知識があるため、外れのものが採用されることはありません。
Byrnesは過去の記録と現在の気象データに基づいて降雨量を予測する気象モデルの例を、簡略化して説明してくれました。時間雨量と1日の雨量が別々のモデルによって予測されるのは合理的ですが、この2つのモデルには一貫性がなければなりません。片方のモデルが午前中に1インチ、午後に1インチ、夜に1インチの雨が降ると予測した場合、もう片方のモデルがその日の降雨量を0インチと予測してはいけません。
「DASLは間違った推測を排除するわけではないのですが、人間がモデルに手を加えて矛盾するものをフィルタリングすることで、間違った推測の多くを避けることができます」とByrnesは述べています。
透明性が高く、かつ説明可能なAI
DASLを使用した建設的なイテレーション(反復)は、透明性を提供するとともに、人間が提供したルールに基づいた推論の説明を自然言語で行うことができます。DASLが誤った推論によって何かを間違えた場合、ユーザーはその推論を見て修正することができ、これによってより正確な知見を得られるようモデルを強化することができるとByrnesは説明しています。
ByrnesはSRIの同僚たちとともに、特定の課題を解決するにあたり、その課題のクライアント側の専門家と協力してカスタム化したDASLの使用例(ユースケース)の開発を続けています。つまりは、DASLは消費リソースの少ないAIで具体的かつ複雑な課題に取り組むという道を切り開いており、個別にカスタマイズされた持続可能なAIという段階を築いているのです。
「次世代のAIを開発するにあたっては、大きく考えることも必要ですが、小さく考えることも必要です」とByrnesは述べています。