next up previous
: GRUFF認識システムの進展 : 6.機能に基づく認識における機械学習のアプリケーション : イントロダクション

カテゴライズのための機能ベースの推論

機能ベースのモデルは、種々のパラメータ化された幾何・構造モデルとは、明示的に幾何や構造プランを特定しないという点で違う(図6.1)。

\begin{figure}
\begin{center}
\epsfile{file=fig6-1.EPS,width=79mm}
\end{center}\end{figure}

その代わり、物体カテゴリーは、物体カテゴリーの例として機能のために必要な知識に関して定義される。このように、強調するべきは、特定の形状を一般化するためのパラメータ化ではなく、その代わりに、形状や形態・要求される機能の定義の構築に使われるべき因果関係などについての、知識のプリミティブ集合の識別にある。

形態と機能の概念は、直感的に魅力的であり、AIやコンピュータビジョンの多くの研究者たちによって論じられてきた。実際、物体機能についての表現と推論のトピックにおいて2つのAAAIワークショップがあり、物体認識の機能性の役割についてひとつのIEEEのワークショップがある。

AIコミュニティーにおける研究は、一般的に、観察された入力を完全なシンボリックな記述(例えば、意味のネットワーク)とすることに問題をおいた[32]。この研究は実質的に、より高いレベルの問題を見ることを好んでおり、全くコンピュータビジョン側の問題を回避している。例えば、ウィンストン他によるよく知られた研究では、パーツと物体の機能特性の間の類推による推論を探求する[31,30]。この研究の物体の入力表現は、物体があらかじめ機能特性でラベル付けされたパーツとパーツに分割された、意味のネットワークである。すなわち、想定された入力は本質的に、機能ベースの物体認識システムにより出力として生成されるであろうものである。もっと最近のウィンストンとラオによる成果[33]は、反例が与えられた後に、現在のシンボリックな記述を「回復する」ことを検討している。より最近では、ホッジズ[14,15]は、ナイーブメカニズムのための機能性存在論(FONM)を、物体機能性についての推論のための精巧で洗練されたシステムで記述した。

コンピュータビジョンコミュニティーにおける研究の一つの主要部は、一つの物体の完全な3次元形状記述(例えば、境界線表示)の問題のための入力であると考えられる。この研究は、形状についての推論を通じて物体の機能指向のシンボリックな記述を表現し認識することに集中した。しかしながら、入力に完全な形状モデルを想定することによって、少なくてもある程度、この研究は実際のビジョンの問題をパスする。ディマンゾ他[10]は、カテゴリー「椅子」の機能ベースの物体認識のアプローチを概説している。スターク他[26,27,28]は、超縦座標(superordinate)カテゴリー「家具」と「皿」の中で種々のカテゴリーで物体を認識するためのシステムの成功を示した。キセ、他[17]はいくつかのハンドツールカテゴリーで形状の認識について同様のシステムを示した。

コンピュータビジョンコミュニティにおける二つめの研究の主要部では、実画像を入力に使うことにあるが、一般に物体は定型または正しい方向で見られると仮定される[5,6,9]。この研究は、実画像を扱うが、すべての機能性に重要な物体形状の要素が一つの視点で明らかになると仮定し、ある程度実際の問題を避けている。ブレイディー他[5,9]は、輝度画像の典型的な2D輪郭検出に基づいて、ハンマーのようなハンドツール物体のための機能ベースの認識の型を記述した。クーパ他[7]は、カラー画像で構造理解のために「原因の推論」を使い、システムの開発に成功した。彼らのシステムの代表例は「バスター」システムであり、それは、スタックの安定性を維持して、それぞれのブロックの演じる役割に関して、ブロックのスタックな記述を組み立てるものである。ディキンソン他[11]は、ビエダーマンの「構成部品による認識」システムと質的形状記述のための「棒、平面、小片」アプローチの、機能性に基づく拡張と融合のアプローチを示した。ボンゴイとバジュスキー[3]は、「洞察できる操作」という環境で、エージェントと物体の間のインタラクションにおいて機能性についての推論の役割を議論した。スターク他[25]は、実距離画像から抽出された部分的な形状モデルに基づく機能性についての推論を、GRUFFシステムの説明に記述した。このシステムは、200以上のレンジイメージの組を使い評価された。



SATO Yoshihiro 平成12年10月26日