画像データの保存と共有を容易にするSRIの技術


より優れた圧縮とデータ保存を実現するため、詳細な航空地図と3Dデータを組み合わせてセンシング技術とイメージング技術が進歩


3次元のイメージングは、例えば風景のマッピングや患者の詳細な解剖学的構造の視覚化、そして自動運転自動車の周辺環境の分析に利用されているものでさえ、ますます強力なツールとなっています。3Dセンサーとイメージング技術の進歩により、研究者はこれまで以上に詳細な3Dデータを収集できるようになっています。

しかし、これを活用するには、膨大な量のデータを処理して保存し、共有する必要があります。SRIのCenter for Vision Technologies(CVT)の研究者たちは、3Dデータを効果的に圧縮して最も重要な情報を保持したままデータファイルのサイズを縮小する技術を開発・改良してきました。

CVTのテクニカルマネージャーであるBogdan Mateiは、「より場所を取らないように元の形(ジオメトリ)の正確な点から、少し誤差のある点に移動させたいのですが、この変化を写真家が高品質のRAWファイルを圧縮したJPEGファイルに移行するように、一般的には知覚されないようなものにしたいのです。」と述べています。

Mateiと同僚たちは、LIDARから得られるデータに着目しています。LIDARとは、何百万もの点から構成される3Dマップを作成する時に、距離のある物体にレーザーを高速で照射して測定する3Dスキャンの技術です。このデータを圧縮するために、彼らは点をグループ化する方法を探求しているのです。

風景のなかでも、ある物体は別の物体よりも少ない点で表現できることがあります。例えば、人工的な構造物の側面は滑らかであり、構造は均一であることが多いです。研究者たちが開発した圧縮手法のひとつはこれを利用するもので、たとえば建物の平らな上面に関するすべてのデータを、あたかも画像内の1つの大きな画素(ピクセル)のとしてリンクさせるのです。

「重要な点は、その場面のセマンティックス(意味論)を使うということです。地面とは何でしょう?建物とは?車とは?建物や地面にはデータの冗長性が比較的あるため、例えば木などのようなものよりも圧縮することができます。」とMateiは述べています。

また、Mateiによると、マッピングデータは上から見たものを使っていることから、垂直方向の情報の多くは空白になってしまっているとのことです。研究者たちが多くのデータを3次元ではなく2次元で保存すれば、さらにサイズを小さくすることができます。この方法を使えば、LAZとして知られる標準的な圧縮方法よりも3倍から7倍もLIDARデータを圧縮できることがわかりました。

研究者たちが取り組んでいる2つ目の方法では、データ損失は許容できるレベル、かつ、LAZの30倍もデータを圧縮することができます。この方法は、ニューラルネットワークの助けを借りています。ニューラルネットワークとは、相互につながった一連のアルゴリズムであり、これでデータを処理・分析します。ここで研究者たちは点のデータを認識して圧縮するよう、ネットワークを訓練しました。

「面の上にある点を明示的にリストアップするのではなく、その方程式を見つけるのです。ですが、これは単純な方程式ではなく、ディープ・ニューラル・ネットワークで導き出す複雑な関数なのです。」とMateiは述べています。

この関数を使えば、個々の点を保存するよりも少ないスペースで済みます。研究者たちはさらに、汎用ネットワークを前もって訓練しておき、特定のデータセット用に各パラメーターを調整することでこれが可能であること、また、より効果的になることもあるということを見出しました。

「大きなネットワークは、形の普遍的な辞書のようなものですから、特定のデータセットに適応させ、分類に応じて異なる圧縮を実施することができます。たとえば、植生の場合、用途によってはそれほど精度を必要としません。だから、かなり圧縮できるのです。」とMateiは述べています。

研究者たちは、この二つの圧縮方法を改善して、上空からのマッピングや自動運転自動車の訓練、その他人工知能に使用するかたちに関するデータの収集と保存を容易にすることを目指しています。

「これらの点には色や他の属性もあるため、非常に複雑になる可能性があることから、我々が実施してきたことを改良して圧縮率をさらに向上させたいと思っています。」とMateiは述べています


Read more from SRI