絵画的要因による立体視

絵画的要因による3次元形状の復元
3次元形状の復元のための新しいアプローチ
 Pizulo, et al.()は、3次元形状の復元のための新たなアプローチを提案した。それは、真実性(veridicality)、複雑性(complexity)、相称性(symmetry)そして容積性(volume)に基づく復元理論である。このモデルでは、2次元形状から3次元形状が、「奥行(depth)」、「面(surface)」そして「学習(learning)」の情報が用いられないで復元される。
  従来、外界にある実物対象は、対象の重さ、反射率、剛体性、硬さ、テクスチャなど物理的特性から生じる感覚データに基づいて知覚されていると考えられてきた。この伝統的な考え方は実物からの重要な抽象的特性である「形状」を軽視した。実物形状から抽象した形状と実物そのものとの識別は古代ギリシャの哲学者プラトンによっていて、プラトンは容積のある形状の「相称性」は3次元形状を規定する重要な特性であると考えていた。この考え方からは、後に、プラトンの立体 (Platonic solid) が定式化された。これは、現在では正多面体 (regular polyhedron)のことで、数学的にはすべての面が同一の正多角形で構成され、かつすべての頂点において接する面の数が等しい凸多面体をいい、正4面体、正6面体、正8面体、正12面体、正20面体の5種類のみがある。プラトンの弟子アリストテレスは、プラトンが実物から抽象した形状と実物そのものを区別したことにもとづき、人間の認識過程では、その当初には、何も存在せず、白紙であると主張した。これは、経験論哲学に継承され、ロックらによって体系化された。一方、人間の意識にあるのは実物から抽象した形状のみであるとする観念論はアイルランドの哲学者バークレイによって継承され、「存在することとは知覚されることである」と定義された。この経験論と観念論の論争は、知覚研究者にも影響するところが大きかった。
 Pizlo, et al.(22)は、3次元形状の知覚は、これまで、対象の「奥行」と「面」から構成されると考えられてきた点に問題があると考えた。なぜなら、「奥行」と「面」は、「相称性」と「容積」という3次元形状に必須の特性をもたないからであるという。2次元の網膜像から形状知覚を考える場合には、2次元形状に含まれる「奥行」と「面」は形状について明確な情報をもつ。しかし、2次元の網膜像には「容積」という情報は含まれていないし、ほとんど「相称性」ももたない。ゲシタルト心理学説が提唱される以前では、形状知覚を研究するためには、2次元網膜像に含まれるあらゆる手がかりを分析することが重要であるとされていた。しかし、ゲシタルト学派は、3次元形状の研究で重要なのは2次元網膜像にある要素を分析することではなく、形状全体を可能な限り単純化して知覚しようとする力(「簡潔性の原理」)の働きを明らかにすることであると主張した。
 Marr(1982)は、図16に示したような不透明な立方体を例に挙げ、もし「面」のみに注目すれば、6面ある立方体面の半分である3面(50%)しか知覚できないと考えた。しかし、頂点に注目すれば8頂点中7頂点(70%)を、エッジに注目すれば12エッジ中9エッジ(87%)を知覚できる。すなわち、3次元の不透明立方体は、「面」のみではなく頂点とエッジを利用した方が復元程度を高くできる。Gibson(1950) は、対象の知覚においては「面」が重要であることを指摘し「面」をブロックとして3次元形状を復元できるとしたが、これは適切ではないと考えられる。3次元形状の復元には、相称性、容積性そして輪郭が必須の要件であるとPizloらは主張する。
 そこで、Pizlo, et al.は、3次元形状のコンピュータによる復元モデルには次の4つの拘束条件が必要と考えた。(1)3次元のための相称性の最大化、(2)輪郭による平面化の最大化、(3)3次元のための簡潔性の最大化、(4)表面の面積の最小化。これらの4つの拘束条件から、3次元形状の容積(3次元のための簡潔性の最大化に依拠)、面(表面の面積の最小化に依拠)、輪郭(3次元のための相称性の最大化、輪郭による平面化の最大化に依拠)の復元が可能となる。容積、面そして輪郭は、トポロジーにおける組合せマップ(combinatorial map)の基礎となる。組合せマップには、どのような容積(3次元対象)が3次元空間を満たすか、どのような2次元「面」がこれらの容積と関連するか、どのような1次元「輪郭」がこれらの「面」に関連するか、が記述される。例えば、立方体が何もない空間に置かれている場合、組合せマップには、(1)単一の容積をもつ対象とこれが置かれた背景空間、(2)立方体を構成する面を6個の側面に分解、(3)各面を構成する輪郭の4個のエッジへの分解、(4)3個のエッジから構成される8個の頂点、が表現される。これらには、さらに、「面」の平面性、輪郭の直線性、アングル(angle)の角度、線分の長さそして線分の断端の位置がそれぞれ等しいこと、が付加される。このように3次元対象の幾何学的特性が組合せマップに記述され、しかもその対象もしくは組合せマップ、あるいはその両方が「相称性」をもつ場合にのみ、その3次元対象は「形(shape)をもつ」といえる。もし3次元対象がこのように記述できなければ、それは「形をもたない(amorphous)」といってよい。図17の多面体(b)の頂点のみをプロット(a)しても多面体を知覚できないし、その頂点に小さなエッジを付加しても多面体を正確には知覚できない。3次元形状は多面体を構成するエッジから輪郭を形成し、これらによって「面」が囲まれていると、知覚者が解釈しない限り知覚されない。
 Biederman(1987)は、人間や動物の身体がジオン(geon)と名づけた単純な容積の対象から復元可能なことを示した。ジオンとは、並進的相称性(translational symmetry)という幾何学的特性を持つもので、図18に示したようにさまざまに一般化された紡錘状の物体を生成できる。これらの物体は、底面の形状を上方向に伸張した「軸(axis)」に沿って並進させて生成される。「軸」は直線もしくは曲線をとり、並進では底面の形状の大きさを一定にも、あるいは変化させることも可能である。このようにして生成されたものは、組合せマップ上で動物の手、脚、胴体、首そして頭を表現する際に利用できる。
 相称性をもつ形状の復元は、図19にあるように、正射影像である2次元網膜像から3次元に関して相称性をもつ1対の点を生成することで行われる。図のx軸は2次元網膜像内の各点を示し(ここでは2次元網膜像のx軸のみ表示)、y軸(Z) 2次元網膜像の各点の奥行を示す。図(a)(b)内の対角線は、2次元網膜像のxとy軸との間で45°の角度をとる「相称面(symmetry plane)」を示す「相称線(symmetry line)」である。図(a)には、与えられた任意の2次元形状のすべての各点の相称性をもつ1対の点で描かれた「相称性図形(symmetry shape)」が表されている。相称性をもつ1対の点は、「相称面」の角度を変えると無限に生成可能である。しかし、簡潔性の拘束条件を設定すると、相称面がx軸と45°の角度をとるとき、もっとも簡潔となる(a)。ここでは「相称面」に関して「z =x」が成立している(y軸は表示されていない)。この場合、「相称面」は角ZOX2等分し、y軸に対して平行となる(換言すれば、相称面はXOY面に関して45°をとる)。もし、「相称面」がy軸に関して平行でなければ、この条件が満足されるまで座標軸を回転させる必要がある。1対の各点の奥行は、1対の一方の点のZ座標を片方の点のX座標と等しくとることで求められる。図bには、このようにして設定された対となる2点(黒点)は相称線を挟んで鏡映的相称をなす。「相称線」が45°以外の場合にも、図cに示したように対となる奥行点を計算することは可能である。ここに示された相称線角度(α)50.19°、45.00°、38.66°、アスペクト比(縦横比、ar)は1.21.00.8である。図cの3条件の「相称図形」をそえぞれ単独に表示したものが図dである。相称線角度(α)が変わると、対となる点の奥行値が変化する。アスペクト比と相称面の角度を操作すると相称をなす1対の点の奥行が変わるが、実際の3次元形状と復元された形状間の誤差は極めて小さい。もし、両眼視差あるいは運動視差による第2の網膜像を追加すると、この誤差をさらに縮小することが可能となる。
 Pizlo, et al.は、3次元形状の相称性原理および4つの拘束条件にもとづく3次元形状の復元モデルを提示し、幾何学的形状、自動車、動物や人間など複雑な対象を復元できることをシミュレーション実験で実証した。このコンピュータ・モデルは、3次元形状のすべての個々の点、線からは形状の復元が不可能なことを示し、ゲシュタルト心理学派のいう「全体は部分の総和を超えたものである」を実証している。

3次元形状の復元における内在的拘束モデル(Intrinsic Constraint Model)
 3次元形状の復元には逆光学問題(網膜像から3次元形状を一義的には規定できない)が存在する。これを解決するためには、拘束条件、たとえば運動からの3次元形状の復元で提案された「剛体性」(剛体上の4点が3視点について対応付けられればその構造と運動がただ一つ決定)を仮定する必要がある(Bülthoff & Yuille 1990)。言い換えれば、視覚システムは対象が剛体性をもつことを推測しなければならない。
 3次元形状は網膜像と何らかの拘束条件から復元されるとする考え方(ユークリッドモデル Euclidean  model)に対して、外界にある対象のいくつかの奥行手がかり特性は網膜像と脳内の視覚システムにも同型で存在するので、これらの特性、すなわち両眼視差、運動要因、テクスチャ勾配、輝度勾配のみに基づいて3次元形状は復元できるとする考え方がある(Lappin and Craft 2000)。たとえば、両眼視差は、第1に対象間の相対的視差を観察者中心視点で導出できるとともに、第2に対象面の3次元特性を導出できる。つまり、これらの奥行手がかり特性は直接、対象のアフィン構造を規定していると考えることができる(ローカル・アフィンモデル、(Koenderink 1990 Todd & Bressan 1990)。
 ユークリッドモデルとローカル・アフィンモデルはどちらも、これまでの研究結果を説明できない。ユークリッドモデルは、対象の3次元特性の知覚判断が不正確であること、また被験者間に知覚判断のばらつきが大きいことを説明できない(Di Luca,et al. 2004Domini & Caudek2003a, 2003bFantoni, 2008Fantoni, et al. 2010)。一方、ローカル・アフィンモデルは、対象を運動させた条件での3次元面の特性の知覚精度は静止した条件のそれより極度に高くなることを予測するが、しかし対象の3次元形状の計量的知覚判断の結果を説明できない(van Boxtel, et al.2003; Cornilleau-Pérès et al., 2002 Dijkstra,et al., 1995 Lappin & Craft, 2000)
 Di Luca et al.(4)は、上記2つのモデルの欠陥を改めた新しい一般的モデルである内在的拘束モデル(Intrinsic Constraint model)を提案した。いま、図20に示したように、視線(z)上に単一あるいは複数の奥行手がかりでレンダリングされたパラボラ形状の刺激対象が提示されている事態を想定する。ここでは、図形の伸張度(定数Celongation 床面の白線で表示)を変化させると、刺激面の湾曲度である曲率(curvature)、床面と刺激面の傾斜角度(slant)、刺激面の先端からの奥行(deoth)がそれぞれ左端から右端の図で大きくなる。この事態では、シーンの3次元座標軸(x,y,z)は次のように記述される。
--------------(1)
ここで、定数Cは視線軸(z)に対する伸張(elongation)を示す。
床面と刺激面の正接角度(tangent)である傾斜角マップ(slant mapS (x,y))は、次のよ
うに表される。

図20の放物面の場合には傾斜角マップは、次のようになる。

刺激面の湾曲度である曲率マップC (x,y)は、次のようになる。

20の放物線面の場合、曲率マップはC (x,y) = C となる。
20に例示された放物面図形の場合、ユークリッド幾何学では奥行マップ、傾斜マップ、曲率マップが左端から右端の4種の図形で同等である。これらのマップは定数Cを変えることで一義的に記述できる。一方、アフィン幾何学では、未知の尺度定数(k)によって奥行マップ、傾斜マップ、曲率マップは、それぞれ

で表示される。
 Domini et al.(2006)は、網膜像にある刺激特性を信号と見なすと、奥行、傾斜、曲率などのある位置(x,y)での測定された3次元特性特性Sp (x,y)は次のような関数で記述できるという。
-----------------(2)
ここでKsp3次元シーンによって変わる定数、εspSp(x,y)の測定されたノイズ(平均0で標準偏差σspのガウス関数であると仮定)を表す。
 いま、20に示したような放物面形状の3次元面の測定を考えてみよう。放物面はその面に対する垂直軸を中心として回転させながら提示するので、相対的な運動フィールドが生起している。この相対的運動フィールド(relative velocity field)Vzは、角速度ω、絶対奥行距離Zf、で近似的に記述される。
---------------------------()
ここで、εvzは付加的ガウス関数のノイズを示す。この()式から、相対的運動フィールドは奥行マップに比例して変化することがわかる。運動フィールドの速度勾配をオプティクフローのdef要素(defcomponent)で規定すると、それはスラントマップに次式のように比例する。
-------------()
εvcdef測定に影響する付加的ガウス関数のノイズを表す。
運動フィールドの2次微分値Vc(x,y)は曲率マップと近似的に比例する。---------------------------(5)
結局、網膜像からの信号Sの数学的記述は、ある3次元アフィン特性の測定値Sp(x,y)となる。言い換えれば、各3次元特性の測定値(曲率)は物理的な曲率に比例し、これは網膜像内の信号から抽出される。そして、これらの測定値はそれらの特性の確率変数の最適な重み付け加算で記述できる。例えば、刺激がテクスチャで構成され、しかもその面を左右に運動させて観察する場合(運動フィールド)の測定値rc(x,y)は、運動速度からの曲率の確率変数Vc(x,y)とテクスチャからの曲率の確率変数tc(x,y)を最適に重み付けしての加算で得られる。 -------------(6)
ここで重み付けは次式となる(S = v,t)
------------------------------------------------(7)
上記のような手がかりの組合せは、3次元面の曲率の評価c(x,y)の信号対ノイズ比(SNR、信号の分散を雑音の分散で割った値)を最大にするという意味で最適となる。 (6)式による最適手がかり組合せの信号対ノイズ比Pc(x,y)は次式で規定される。

---------------------------------(8)
2種類の奥行手がかりの組合せによる評価の信号対ノイズ比Pc(x,y)は次のようになる。------------------------(9)
他種類の奥行手がかりSiの組合せによる評価の信号対ノイズ比Pc(x,y)は次のようになる。----------------------------(10)手がかりが1種類の場合には次のようになる。

(10)は内在性拘束モデル(Intrinsic Constraint Model)を表すことになる。
 そこで、Di Luca()は、内在性拘束モデルをユークリッドモデルと対比させながら実験的に検証した。ユークリッドモデルによれば、奥行、スラント、面の曲率の知覚測定値は相互に一致すると予測する。一方、内在性拘束モデルは、奥行、スラント、面の曲率を局所的なアフィンマップに基づいてそれぞれを評価する(345)。そして、それらの評価値の信号対ノイズ比は奥行、スラント、面の曲率の知覚値を規定する。内在性拘束モデルによる知覚プロセスが奥行手がかり単独(運動要因)の場合(図21)と3種類(運動要因、陰影、テクスチャ)の場合(図22)に分けて示した。図21は、パラボラ形状の3次元曲面が垂直軸を中心に左右に振動する場合で、視覚システムはゼロ次元(Vz)、1次元(Vs)、2次元(Vc)、の3次元特性を運動フィールドから抽出する。そしてそれらはそれぞれ奥行(Z)、スラント(S)、曲率(C)に比例する。これらの評価値の信号対ノイズ比(PzPsPc)は、内在性拘束モデルによると、知覚された局所的特性(Z’S’C’)の予測値となる。図22は、運動要因、陰影、そしてテクスチャによってパラボラ形状の3次元曲面が構成された場合で、視覚システムは局所的な奥行(Z)、スラント(S)、曲率(C)に比例させて3次元曲面を評価する。評価値(VzVsVc)は、運動速度要因によって、評価値(SzSsSt)は陰影要因によって、そして評価値(c)はテクスチャ要因によって、それぞれ評価される。次に、視覚システムは、これらの3種類の評価値を統合する。内在性拘束モデルでは、この統合は復元された局所的アフィンマップによって決まる信号対ノイズ比を最大にすることで得られる。言い換えれば、Z’S’C’の大きさは、奥行マップ、スラントマップ、そして曲率マップから決められる信号対ノイズ比によって規定されることになる。
 実験では、標準刺激と比較刺激を継時的に提示し、標準刺激に対し比較刺激は、3次元曲面、奥行、スラントのいずれかに対して等しいか、あるいは異なるかの判断を求めた。標準刺激はテクスチャのみでレンダリングして設定、比較刺激は運動要因あるいは陰影でレンダリングして設定した。奥行手がかり要因が1種類の場合には、標準刺激は常に3次元度を一定、比較刺激の3次元度を変化させ、また奥行手がかりが複数個の場合には標準刺激の1種類あるいは2種類の手がかりでレンダリングして設定、比較刺激は3種類の手がかりでレンダリングして設定した。実験1と2のデザインは表1に示した。
  実験の結果に基づいて、内在性拘束モデルを検証するため信号対ノイズ比は、主観的等価値(PSE)と弁別閾値間(JND)の比(PSE/JND)を求めることで得られた。その結果、運動要因に基づくSNR比の逆数(1/SNR)と陰影に基づくそれとは対応せず、したがって奥行、スラント、3次元曲率の評価値は相互に一致しなかった。この結果は内在性拘束モデルを支持している。

3次元の凹状パターンの基本となる知覚的な構成部分と面
 Hoffmann & Richards(1984)は、対象の3次元形状をどのように知覚するかを分析するとき、対象を構成する屈曲数の最少規則(minima of curvature)を明らかにする必要があると考えた。すなわち、対象は屈曲した輪郭から構成されたもっとも大きな凹状の断面からなる境界を有する部分に分割できるという。類似している凹と凸状の3次元パターンは、最少規則が相違することになる。図23の例で考えてみよう。図の上段には2次元十字形に表れる屈曲数の最少規則(minima of curvature)が示されている。これらの最少規則は3次元凹状パターンを形成する諸側面と一致するが、3次元凸状パターンの最少規則とは補完的関係にあるものの、一致しない。図の中段には、3次元パターンとして等価な凹あるいは凸状のパターンの最少の屈曲数(最少規則)を示し、凹状のそれは凸状の3次元パターンの2倍となる。下段は最少規則にもとづく3次元凹と凸状パターンを構成する部分の構造である(テクスチャを違えて表示)。これらの例に示されたように、最少規則は3次元凸状パターンとその2次元パターンにともに適用できるが、3次元凹状パターンとその2次元パターンには当てはまらない。したがって、3次元凹状パターンは、それを構成する部分輪郭面が3次元凸状パターンよりは多いので、その構造を知覚的に分析した後でないと見えてこないと考えられる。  そこで、Cate & Behrmann(2)は、3次元凹と凸状パターンを構成する部分輪郭面にマーキングすることで被験者の注意を振り向け、それによる知覚成立の影響をしらべた。図24の 上段には、2次元十字形をベースとした凹あるいは凸状3次元パターンの知覚的構造をしらべるための基本構成面に関わる4種類の手がかりの組み合わせを示している。Shaftは3次元パターンを構成する面の横あるいは縦軸を、Tipsは面の先端を表す(ドットと斜線で表示したものは、実験では異なる色で表示、)。4種類の手がかりの組み合わせは、「隣接するTip-Shaft」、「2つの隣接するShafts」、「2つの反対位置にあるShafts」、「2つの反対位置にあるTips」である。下段は、4種類の実験パターン(無図形、凹状、凸状、平面の各パターン)である。結果の予測として、3次元凸状パターンでは、ある輪郭面への注視は他の空間的に離れた輪郭面への注視を促進し、その結果として、まとまりある3次元構造がすべての手がかりの組み合わせで示される。これに対して、3次元凹状パターンでは、3次元凸状パターンにあるような対象指向的注視効果が存在しないので、注視した輪郭面は空間的に離れている同一の面と知覚するよりは、3次元凹パターンを構成する別の輪郭面と知覚してしまうと考えられる。
 実験では、3種類の刺激パターン(3次元凹状、3次元凸状、2次元フラット、無図形)に4種類の手がかりを同色(congruent条件)あるいは異なる色(incongruent条件)で組み合わせて提示し、刺激パターンが正確に知覚できるまでの反応時間を測定した。得られた反応時間から「congruent得点」が計算された(「congruent条件」-「incongruent条件」)。その結果、3次元凹状の「congruent得点」は3次元凸状のそれより有意に小さく、とくに、「2つの反対位置にあるTips」事態ではマイナス値になった。これは、3次元凹状を知覚する場合、手がかりが互いに離れていると、注意が凹形状全体に広がらないことから3次元凹状の知覚が妨げられたことを示し、先の予測を支持している。

絵画的要因の3次元視効果

リバースペクティブ(逆遠近、reverspective)における両眼視差、運動視差とパースペクティブ
 リバースペクティブとは、Parick Hughesの創作によるアート作品をいう。図25に示されたように、そのアートは3次元的に視え、しかもその作品で凸に視る部分が観察者の移動にしたがって追従するような錯覚が生じる。この作品は、ちょうど屏風を幾重にも折り曲げたような物理的立体構造から構成されている。そして、屏風状の凹凸部分に遠近法と陰影を用いて横並びの建物群などを描画するが、このとき、凹の部分には遠近法や陰影を近くに視えるように、一方、凸の部分には遠くに視えるように、すなわち逆遠近法で描画する。このように描くと、物理的にはもっとも凸の部分が描画ではもっとも凹むように、逆に物理的にはもっとも凹の部分が描画ではもっともとびでるように仕掛けられている。知覚上では、したがって、遠近感に関してあいまいな事態となるので、視覚システムはこの曖昧さを解決しなければならない。このような物理的奥行と描画的奥行がコンフリクトであるものを観察した場合、建物の角は、本来、凹んでいることはあり得ないので、建物自体があたかも回転し、建物の側面を見せている、と視覚システムは知覚的に解釈すると説明されている。
 これに対して、Rogers & Gyani(24)は、この知覚的コンフリクトを理論的に解析した。それによると、まず、日常世界のシーンが線遠近法によるたくさんの輻輳する線分で描画されたいる場合、両眼視差手がかりが存在しても、線遠近法的要因は奥行き手がかりとして有効に機能することが知られている。次に、観察者が移動すると、それに伴なって運動視差によるシーンの変形(transformation)が生じるので、この変形という手がかりでこの種の錯覚が説明できると考えられる。つまり、観察者がリバースパースペクティブに視ているものは、視覚システムがパースペクティブと運動視差の変形にもとづいて作り出すもので、そこで作り出されるものは日常生活でもっとも起こりそうなシーンとなる。つまり、ここでは、この種の知覚的コンフリクトを解決するために、過去経験などの高次処理過程は働いていないとされている。これを実証するために、逆遠近法による描画の程度を7段階に変化させた刺激を作成(図26)し、被験者に刺激に対して接近あるいは後退させて、被験者の移動につれて刺激が動いて知覚されるかされないかの境目となる奥行距離を単眼視条件と両眼視条件で測定した。
 その結果、逆遠近法による描画の程度が粗くなるほど、被験者の移動に伴う刺激の随伴運動の生起のための奥行距離は長くなること、またすべての刺激で両眼視条件でのそれは長くなることが示された。このことは、上述の理論的な解析を裏付けている。

知覚的消去・出現現象における単眼的奥行手がかりの効果
 知覚的消去・出現現象とは、ドットで構成された背景刺激を回転など運動させて持続観察させると、静止ターゲット刺激が消失と出現を繰り返すことをいう(Bonneh,et al.2001)図27の場合、円形に配したドットを中心点で時計回転させると、左端上端の静止ターゲット刺激が消失と出現を繰り返して知覚される。静止ターゲット刺激に両眼視差を付けた場合、それが非交差視差では交差視差より知覚的消失・出現が明瞭に生起する(Graf et al.2002,Hsu et al.2006, Lages et al. 2009)。これまでの研究から、相対的位置による奥行手がかり要因、明るさコントラスト、テクスチャなどの要因が、この現象に関係していることが明らかにされている(Bressan et al. 2003; Vecera et al. 2002, Palmer & Ghose 2008,Ramachandran 1988a 1988b, Todd & Mingolla 1983, O’Shea et al. 1994)
 Hsu et al.()は、単眼的奥行手がかりが知覚的消去・出現現象に与える効果を実験的に検討した。単眼的奥行手がかりとして、重なり要因(interposition)、ターゲット刺激の凹凸形状要因、water color illusion(形状を表す輪郭線が2重の場合、外側の輪郭線の輝度が内側のそれより明るい場合には背景面より背後に、その逆の場合には手前に知覚される現象 Pinna et al.2001,2003)が取り上げられた。実験では、図27のような刺激パターンが設定され、(A)から(F)までのターゲット刺激は次のような単眼的奥行手がかりが付与されている。(A)花模様のターゲット刺激の中心が凹、(B)花模様のターゲット刺激の中心が凸、(C) 三角形状のターゲット刺激の輪郭線は二重線で外側が橙色、内側が青色、(D)三角形状のターゲット刺激の輪郭線は二重線で外側が青色、内側が橙色、(E)ターゲット刺激の輪郭が凹、(F)ターゲット刺激の輪郭が凸。これらの手がかり要因による凹凸感は、背景刺激との関係で規定され、凹の感覚は背景刺激より後方に、凸感覚はそれより手前になり、背景刺激とターゲット刺激の間に重なり感が生じる。実験では背景となるドットパターンを時計回転させる運動事態とドットパターンが静止した事態とで、ターゲット刺激が知覚的に消失しそして出現するまでの時間を測定した。
  その結果、すべての単眼的奥行手がかりで知覚的消失と出現が生起したが、奥行手がかりが凹感覚を生起させている場合の方が凸感覚よりも、知覚的消失と出現が長く生起した。これは、背景とターゲット刺激間に生じた知覚的奥行によって誘導されたと考えられる。

初期視覚情報処理過程での観察者の立脚地面の肌理勾配が大きさ評価に与える効果
 観察者が立脚する地面が発する肌理勾配は3次元空間における対象までの絶対奥行距離知覚の重要な奥行手がかりとなる。対象の大きさも、網膜像の大きさを3次元空間内の奥行距離尺度にもとづく評価によって知覚される。視覚検出課題での対象の大きさ評価は刺激提示後100 msec程度でなされるので、視覚情報の初期過程で処理されている。(Champion & Warren 2008)。そこで、肌理勾配の奥行手がかりが対象についてのこの種の大きさ評価に関係するかが、Champion & Warren(3)によって実験的に検討された。実験事態は、図28に示したように、肌理勾配のある水平な床面をもつ空間、肌理勾配のない垂直な面をもつ空間、そして肌理のない空間が構成され、そのなかに12個の円筒形(シリンダー)を面に対する立脚角度(シーン角度)を8段階(-135°、-90°、-45°、0°、45°、90°、135°、180°)に変えて提示した。検出対象(ターゲット)は12個のシリンダーのなかに1個の大きさの異なるものが配されているので、それをできる限り速く検出することである。
 検出までの反応時間を測定した結果、ターゲットが検出されるまでの反応時間に影響したものは、ターゲットを含む12個の対象の床面に対する立脚角度(シーン角度)の要因であり、これに追加して、肌理勾配のある水平な床面をもつ空間内にターゲットが手前に位置して知覚される(3次元空間内の下方に配置)か、あるいは遠くに位置して知覚される(3次元空間内の上方に配置)かの遠近の要因であった。これらのことから、対象の大きさ検出の初期視覚情報処理過程では遠近要因が影響していることを示唆する。

絵画における水平面の高さ要因および水平線までの刺激対象の奥行位置要因の奥行手がかり効果
 Gardner et al.(7)は、絵画における水平面の高さ要因および刺激対象の水平線までの奥行位置要因が対象の絶対的奥行距離知覚におよぼす奥行手がかり効果について実験的に検討した。実験事態は、天井面、床面、側面から構成され、水平線の高さを変えることで奥行感の異なる4つのシーンが作成された(図29A)。絶対的奥行距離評価のために、ターゲット(球体)を床面に置いたシーン系列(図B)とターゲットを天井面に置いたシーン系列(図C) とが用意され、それぞれでターゲットの奥行位置が変えられた。また、天井面のみのシーン、あるいは床面のみのシーンも用意された。実験では、各系列内のシーンをペアでディスプレーに提示して、どちらのターゲットが遠くに位置して視えるかを被験者に判断させた。
 実験の結果、水平面の高さと刺激対象の奥行位置の両要因を独立に変化させた事態では、ターゲットの絶対的奥行距離は水平線までの奥行位置要因のみによって規定され、水平面の高さ要因は奥行手がかり効果をもたないこと、また天井面のみのシーンあるいは床面のみのシーンでは、床面が奥行に関して明瞭に提示されている場合(水平線がある場合)には対象の奥行位置の手がかりが有効であるが、床面が奥行に関してあいまいな場合(水平線が無い場合)には、被験者によっては水平面の高さ要因を手がかりとして用いていた。

7月齢乳児の絵画的要因の発達―水平線に対する相対的高さとテクスチャ要因―
 7月齢乳児の絵画的要因、とくに水平線に対する相対的高さとテクスチャ要因(圧縮勾配、パースペクティブ勾配、明るさの勾配)の発達がHemker & Kavsek(10)によってしらべられた。乳児はディスプレーに提示された2個のおもちゃを観察し、どちらに手延ばしするかが試された。2個のおもちゃは水平線に対する相対的高さとテクスチャ要因(線遠近的要因は削除)とで奥行位置が規定された。
 実験の結果、乳児は単眼観察条件で、視かけ上、近いおもちゃに手を伸ばすが、両眼観察ではそうではないことを示した。これは両眼視差ではなく絵画的要因が有効であることを示す。また、水平線に対する相対的高さとテクスチャ要因がそれぞれ反対の奥行を指示する条件では、水平線に対する相対的高さの要因が視かけの奥行を決めるのに優勢であることを示した。

平面画像の認知過程
錯視的輪郭とオクルージョンの両方を検出できる統合モデル
  Kalar, et al.(12)は、錯視的輪郭(主観的輪郭を含む)とオクルージョンの両方を検出できるコンピュータモデルを開発した。このモデルでは、錯視的輪郭とオクルージョンは同一のしくみによっていると仮定する(identity hypothsis)。これを仮定した理由は、2つの図形の重なりの領域には、オクルードされた図形の輪郭がオクルードした図形の背後に創発され(非感性的補完、amodal completion)、同様に主観的輪郭の場合にも図形間に仮想的輪郭が創発される(感性的補完、modal completion)と考えるからである。このモデルでは、まず、2つの図形間のエッジの関連づけ(relatability)が計算される。図30に示すように、x軸上にある図形(灰色表示)のエッジ(0,0)と点(x,y)の間で輪郭線の補完の関連づけの可能性があるもの(すべての方向)は右上部の灰色領域で示されている。矢印をもつ線分は、点(x,y)での輪郭線補完の可能性のあるパス(path)である。この可能性のある範囲(角度)を数式であらわすと、次のようになる。
x ≥ 0, y ≥ 0の場合、

x ≥ 0, y ≤ 0 の場合、

  次に、輪郭線の補間の過程がくる。図31Aに示すようなオクルージョンをもつパターンの場合を例にとると、まず、方位をもつ輪郭線のマップ(Cマップ、60°づつ6方向の結果の加算値)が作成される(図B)。これに基づいて、キーポイントマップ(key point map)が作成される(図C、矢印はキーポイントの方向と強度を示す)。キーポイントとは輪郭線の断端(エッジ)を30°ずつ12方位ですべて探索した結果を任意の閾値で限定して得た位置で輪郭線の交差領域のLあるいはT字型のジャンクションに対応する。これらのキーポイントでの出力値をグルーピングして得られた反応領域が、水平と垂直方向の輪郭線の交差領域に出現する錯視的輪郭となる。ここでは、複数のキーポイントをグルーピングすることによって錯視的輪郭を得ることができる。このグルーピングは直交オペレータと並列オペレータで計算され求められる。直交グルーピングでは検出した線分のエッジに直交する方向に、並列グルーピングでは検出したエッジの線分に並列方向に、それぞれ錯視的輪郭が形成される。
 このモデルを2本線分が交差したオクルージョン図形、カニザタイプの主観的輪郭図形、その変形主観的輪郭図形でシミュレーション実験した結果、オクルージョン領域を示す錯視的輪郭、あるいは主観的輪郭を検出できることが実証された。このモデルの限界として、たとえばエーレンシュタイン錯視図形では、十字図形の空白交差領域に、あるいは擬似的なオクルージョン図形(垂線の中央に三角形の頂点が水平に接するように描かれたパターン)などに、錯視的輪郭が検出されてしまうことであった。このモデルは、錯視的輪郭とオクルージョンは同一のしくみによっていると仮定する(identity hypothsis)ことで構成されているが、この仮説は知覚的、生態光学的、そして神経生理学的観点からも有効であると考えられる。