SRIの研究者たちは、臨床医がうつ病やPTSD、その他のメンタルヘルス課題の注意深いモニタリングに役立つツールを開発
人の話し方は、その精神面や感情面の健康について多くを明らかにすることができます。うつ病や心的外傷後ストレス、自死の兆候は、その人の使う言葉や話すトーン、自らの考えを表現する方法、あるいは首や喉の筋肉にストレスがかかっているときに発する声の響きに現れることがあるのです。
SRIの研究者たちは、音声を分析して精神状態を評価する一助となるようなAIツールを開発しています。このツールは、臨床医の診断に情報を付加してくれるとともに、軍に配属されている場合など、通常は接触することが困難な人々のスクリーニングを容易にしてくれる可能性もあります。
「音声は非侵襲的な情報収集の手段であり、質の高い機器を必要とするものでもありません。電話でも可能なのです。これは、高頻度で長期的に、かつ低コストで情報を提供できるモニタリングツールになる可能性を秘めています」とSRIのSpeech Technology and Research Laboratory(音声技術研究ラボ)のディレクターであるDimitra Vergyriは述べています。
心理学者は、うつ病の人は静かで単調な声で話し、よく間をとる傾向があると指摘しています。そして、不安を抱えている人は、緊張が声のトーンや呼吸のペースに影響するとのことです。
感情のトーンを識別する
研究者たちは、心的外傷後ストレス障害(PTSD: Post-Traumatic Stress Disorder)や外傷性脳損傷(TBI: Traumatic Brain Injury)などの患者の音声マーカーを特定することに取り組んでいます。これらのマーカーの多くには重複が見られますが、Vergyriのチームは機械学習のテクニックを用いて複数話者の音声サンプルから複数のパターンを特定し、どの特徴が特定の状態と相関しているかを割り出しています。
このツールは臨床医が使うことを想定しています、とVergyriは述べています。Vergyriのチームが掲げる目標は、専門家が活用できるような定量化した指標をAIを使って提供するツールを開発することです。よって、このツールは単にスコアを提示するだけではなく、透明性があり、説明可能である必要があります。
「このツールのスコアがある疾患のリスクが高いことを示す場合、臨床医はどの指標によってそうなるのかを知りたいと思います。私たちは、専門家の診断や治療に役立つ、確固たる情報を提供しようとしているのです」とVergyriは述べています。
抑揚と変化を見抜くツール
研究者たちはまた、このツールは、専門家ではない人でも対象者の精神状態が変化したことに気づけるような、高頻度かつ長期的なモニタリングを提供できるのではないかと考えています。例えば、うつ病で薬を服用している人に対して、音声分析を定期的に行うことにより、その人の状態に関する継続的なデータを得ることができます。通常であれば、このような患者はたまにしか医師と話ができないかもしれませんが、このツールは、例えば薬が効かなくなったときや、何か変化があったときなどに、専門家ではない人が医療関係者の助けを求める時期を見極めるのに役立つ可能性があります。
「このツールは、愛する人が日常生活を上手く送れているという自信を、患者をケアする人に与えることもできます。毎日、あるいは毎週、医師と話をするのはほぼ不可能でしょう。特に、距離が遠く離れていたり、海外にいたりする場合は尚更です。このツールは、人々が必要なサポートを受けられるよう、一貫したモニタリングを提供できます」とVergyriは述べています。
研究チームは音声録音(音声記録)を用いて、チームのアルゴリズムが様々な精神状態の特徴を客観的に識別できることを実証し、PTSDの患者とそうでない患者をうまく選別できたという論文を発表しました。このチームは、音声と動画の解析を組み合わせたより包括的なシステムを構築すべく、他のグループと共同研究を続けています。
「音声はパズルの1ピースに過ぎません。私たちは、この技術を改善し、このようなツールが人々を助けられるようになることを目指し続けます」とVergyriは述べています。