next up previous
: 実験方法 : 実験結果 : 認識目標

ビジュアル的手順のライブラリー

この実験で用いられているビジュアル的な手順のライブラリーは表3.2に示す. これは,点や線のような2次元を表す抽出とグループ化のための多くの手順を含んでいる. 線は,Boldtらのエッジ結合アルゴリズム [7] を用いて表され, 領域は,Beveridgeらのアルゴリズム [5] で表される. 予期された色とテクスチャとマッチする領域は,様々な決定ツリー [8, 14] によってセグメンテーションされた領域から 選択される. 他のTPのグループは与えられた領域を区分するように線をひくが, 近くの領域は,領域を結合するTPによってグループ化される. 平行,コリニア,または,直行した近くの線はReynoldsとBeveridge [28] によって定義された関係によると,グループ化される. 画像の点は,線の三面に結合した部分を見つけることで,抽出される.

また,手順のライブラリーは3次元を表すものの生成と消費をするルーチンを含んでいる. 平らな面の仮定は位置も場所も決定するが, 位置付けを行う仮定は,場所ではなく,元々の空間における位置を決定する. もっと重要なことを言えば,変換仮定は,回転行列と変換ベクトルとして表される,ある座標系から他の座標系への座標変換を示している. 変換仮定が,対象モデルの座標系からカメラ座標系に変換することで与えられるモデル化された対象の形を決定し, この決定により,目標レベルの仮定となる.

3次元的仮定は,多くのビジュアル的手順によって生成される.CollinsとWeiss [13] は,普通の点で交差している線の集合の 束にセグメンテーションするグループ化された効果的なTPを示している.

対象とカメラの距離は,対象のサイズが分かったとき見積もることができる. マーカスエンジニアリングの場合,建物のサイズは,青写真から得た. 2つのTPをスケーリングするパラメータ化は,VPのライブラリーで用いられ,明らかな窓の幅などはそれによって見積もられる. もちろん,対象モデルの2つのいかなる点もTPをスケーリングする実行時間のパラメータとして提供されているので, TPをスケーリングする,他の多くのパラメータ化はライブラリーに含まれている.

表3.2で示されているビジュアル的な手順のライブラリーはこの実験の目的には十分だが,文献に書かれている幾つかの コンピュータービジョンのアルゴリズムを含んでいる. 多くのビジュアル的な手順のソースコードがCでのみ利用されているので, 残念ながら,現在,SLSのLispによる実行はできない. 我々のグループでは,現在,C++でSLSをもう一度実行しようとしている.



SATO Yoshihiro 平成12年10月3日