![]() |
Figure 2.1 |
例として、Figure 2.1(a), 2.1(b)の単純な物体のモデルを挙げる。この時、 物体の各面が feature であり、feature は9ページの真ん中の表のように属 性と値の組みで表される。そして、頂点に着目した LFSs は下のように定義さ れる。
各 LFS は、各頂点毎に、その頂点を含む面(feature)をセンサから見た時に 時計回りになるように並べたものである。
物体を見た時、オクルージョン(隠蔽)によって面全体が見えない場合がある が、少なくともある頂点が見える場合には、それに隣接する feature を対応 する LFS と同じ順に観察することができる。
入力画像の中の LFS と、ある物体のモデルの LFS との対応が見つかった場合、 それから物体の姿勢を推定することは単純な方法によって可能である([40]参 照)。ここでは、姿勢の計算や LFS の検証については扱わず、入力画像の中 の頂点を中心とした feature 集合から対応するモデルの LFS を正しく特定す る手法について述べる。
対応するモデルの LFS を特定する方法として、画像中の検出された頂点周り の feature 集合をモデルの全ての feature と比較する方法がある。また属性'' 隣接(adj) features'' で表される拘束条件をも考慮しなければいけない。 (ただし、オクルージョンがあるため、実際に観測される''隣接 features'' は、モデルの''隣接 features'' のサブセットである)この方法は有効である が、計算コストが非常に高い。
より効率的な方法として、feature の属性の数だけ次元を持つ多次元空間に全 ての モデルの LFSs を格納し、それらが全て(なるべく)分離されるように パーティショニング(領域分割)する方法がある。理想的な状況では、分割さ れた1つの領域に1つの LFS しか含まないため、観測された属性値をキーと したハッシュテーブルを構築することで、直接 LFS を特定することができる。 これが、この章での多次元属性ハッシュテーブルによる物体認識の基本アイディ アである。
この方法を実装するためには、どのような属性を使用するかという問題と、良 いハッシュテーブルを構築するために多次元属性空間をどうパーティショニン グするかという問題(1つの領域には1つの LFS しか含まれないようにする) の2つを解かなければならない。
この章では、物体をシステムのセンサに提示することで、インタラクティブに ハッシュテーブルを生成する MULTI-HASH システムについて報告する。 MULTI-HASH は、異なる feature 集合を最も良く分離する属性を選んでいくこ とで、多次元ハッシュテーブルの中の領域を画像中の feature 集合に割り付 ける。モデル学習時に人間の行うことは、物体をセンサの前に提示し、画像中 の feature 集合がモデルのどの feature 集合に対応するかを指示するだけで ある。MULTI-HASH は、ハッシュテーブル構築の際にどの属性を使うか・その 際にテーブル内の各領域の境界をどこにとるかを自動的に選択する。決定木と 不確かさ(uncertainty)モデルより、効率よく良くハッシュテーブルを構築す ることができる。