LFS とは

例として、Figure 2.1(a), 2.1(b)の単純な物体のモデルを挙げる。この時、物体の各面が feature であり、feature は９ページの真ん中の表のように属性と値の組みで表される。そして、頂点に着目した LFSs は下のように定義される。

$\begin{displaymath}LFS_{1} \Rightarrow \{頂点 a: 面 1, 面 10, 面 2\}\end{displaymath}$

各 LFS は、各頂点毎に、その頂点を含む面（feature）をセンサから見た時に時計回りになるように並べたものである。

物体を見た時、オクルージョン（隠蔽）によって面全体が見えない場合があるが、少なくともある頂点が見える場合には、それに隣接する feature を対応する LFS と同じ順に観察することができる。

入力画像の中の LFS と、ある物体のモデルの LFS との対応が見つかった場合、それから物体の姿勢を推定することは単純な方法によって可能である（[40]参照）。ここでは、姿勢の計算や LFS の検証については扱わず、入力画像の中の頂点を中心とした feature 集合から対応するモデルの LFS を正しく特定する手法について述べる。

対応するモデルの LFS を特定する方法として、画像中の検出された頂点周りの feature 集合をモデルの全ての feature と比較する方法がある。また属性'' 隣接(adj) features'' で表される拘束条件をも考慮しなければいけない。（ただし、オクルージョンがあるため、実際に観測される''隣接 features'' は、モデルの''隣接 features'' のサブセットである）この方法は有効であるが、計算コストが非常に高い。

より効率的な方法として、feature の属性の数だけ次元を持つ多次元空間に全てのモデルの LFSs を格納し、それらが全て（なるべく）分離されるようにパーティショニング（領域分割）する方法がある。理想的な状況では、分割された１つの領域に１つの LFS しか含まないため、観測された属性値をキーとしたハッシュテーブルを構築することで、直接 LFS を特定することができる。これが、この章での多次元属性ハッシュテーブルによる物体認識の基本アイディアである。

この方法を実装するためには、どのような属性を使用するかという問題と、良いハッシュテーブルを構築するために多次元属性空間をどうパーティショニングするかという問題（１つの領域には１つの LFS しか含まれないようにする）の２つを解かなければならない。

この章では、物体をシステムのセンサに提示することで、インタラクティブにハッシュテーブルを生成する MULTI-HASH システムについて報告する。 MULTI-HASH は、異なる feature 集合を最も良く分離する属性を選んでいくことで、多次元ハッシュテーブルの中の領域を画像中の feature 集合に割り付ける。モデル学習時に人間の行うことは、物体をセンサの前に提示し、画像中の feature 集合がモデルのどの feature 集合に対応するかを指示するだけである。MULTI-HASH は、ハッシュテーブル構築の際にどの属性を使うか・その際にテーブル内の各領域の境界をどこにとるかを自動的に選択する。決定木と不確かさ(uncertainty)モデルより、効率よく良くハッシュテーブルを構築することができる。

OGAWARA Koichi 平成12年9月20日