3.絵画的要因の立体視

3.1 テクスチャからの3次元形状の復元でのフェーズの効果

  テクスチャから3次元形状を復元するコンピュータモデルの手法は、テクスチャの検出方法によって2通りに大別される。ひとつは、はじめにテクスチャパターンのフーリエ解析を実施し、次いで形状面の有り様をパターン要素のアンプリチュードスペクトラム(amplitude spectrum)特性から計算して描画するか、あるいは隣接領域のアンプリチュードスペクトラム間の組織的変化から計算して描画する。この手法では、アンプリチュードスペクトラムを用いるが、フェーズスペクトラム(phase spectrum)による潜在的情報は利用されない。もうひとつの方法は、はじめにテクスチャのエッジを抽出し、次いで形状面の有り様をそのエッジにもとづきエッジの方向の分布を計算して描画するか、あるいは隣接する領域間のエッジの方向の分布を計算して描画する。この方法では、エッジがフェーズスペクトラムで記述されたイメージ構造から抽出され点に特徴があり、この点で前者の手法と異なる。
  そこで、人間の視覚システムでは、3次元形状を知覚する場合にアンプリチュードスペクトラムとフェーズスペクトラムのどちらの情報を用いているのかがThaler et al.(26)によってしらべられた。実験では、22-Aに示したようなテクスチャ面をもつシリンダーが提示され、その形状の湾曲の程度が各シリンダーの凹凸(図の上部にある湾曲線で表示)を調整することによって求められた。シリンダーの深さ(直径)は28cmから81cmまで変えられ、また湾曲面の視えている中心も左・中央・右にシフトされた。シリンダーのテクスチャは、図22-Bに示したように、ドット、線分、敷石の3種類をパターン要素とし、非スクランブル条件とスクランブル条件とを設定した。スクランブル条件でのテクスチャパターンは、元のテクスチャパターンのアンプリチュードスペクトラム(図のBの下段に表示)とゼロから2πの間での一様な分布から抽出したひとつのランダムフェーズスペクトラムとを結合させて生成されている。フェーズスクランブリングは、元のテクスチャで生成し、そのあとでパースペクティブを考慮してシリンダーに貼り付けられた。
  実験の結果、スクランブル条件と非スクランブル条件とも、視えのシリンダーの深さは、表現した深さに応じてリニアに変化すること、またいずれの条件も視えの深さは過小評価されること、さらにその過小評価の程度はスクランブル条件で大きいことが示された。そこで、23に示したように、5種類の新たなテクスチャパターン(輪郭円、面状四角形、輪郭四角形、斜線、線分格子)を追加して、同様なシリンダーの深さの視え方を測定した。その結果、シリンダーのテクスチャで表現した深さに対する視えの深さの正確さは、テクスチャ要素が線図形の場合(線分、線分格子)でもっとも悪く、テクスチャ要素が輪郭図形(輪郭円、輪郭四角形)でもっとも良く、パターン要素の重なりが無い場合(ドット、敷石フ)がそれらの中間であった。この結果から、フェーズスクランブリングの効果はテクスチャ要素が輪郭図形の場合最も高いことが示されている。
  これらの実験結果を踏まえて、テクスチャからの3次元形状復元のためのコンピュータモデルが提唱された。そのアルゴリズムは、はじめにテクスチャ要素の輪郭を検出し、次いでその要素の密度比を求めるというものである(24)。密度比(Density contrast)は、Dmin (シリンダーの観察者側に最も近い位置の値)とDmax (シリンダーの観察者側から最も遠い位置の値)から次式で求める。

Density contrast = (Dmin Dmax) (Dmin Dmax)

 このモデルに基づいて人間を被験者として実施したテクスチャパターンを用いた3次元形状復元のシミュレーション結果を人間から得られた実験結果と比較したところ、このモデルは人間を対象とした結果と良くマッチすることが示されている。

3.2 テクスチャからの3次元形状の復元のニューラルモデル

  視覚野のV1V2そしてV4の働きから2次元イメージを3次元形状に復元するためのニューラルモデルが、Grossberg et al.(10)によって提起された。これを達成するために、まずイメージ内の2次元のテクスチャ要素からなるパターンを滑らかな3次元形状の面上のパターンに変換、次いで3次元形状の空間内に散在するテクスチャの各要素を統計的な特性値に基づいて知覚的3次元形状に復元する必要がある。このモデル(LIGHTness-and-SHApe-From-Texture, LIGHTSHAFT MODEL)のフローチャートが25に示されている。このモデルでは、外側膝状体(LGN)、単純型細胞(simple cells)、複雑型細胞(complex cells)、空間選択細胞(spatial competition)、方向選択細胞(orientation competition)、双極型グルーピング細胞(bipolar grouping cells)、フィーリングイン細胞(filling-in cells)、そして3次元面表現細胞(3D surface representation cells)の働きが想定されている。このモデルによって作成されたシステムによるシミュレーション実験が試みられた(26)。3次元形状復元に使用された画像は、円筒形状、奥行傾斜面、そして球(ゴルフボール)で、それらの表面には遠近性をもつテクスチャが張られている(シミュレーションの結果による画像の遠近度は青色と黄色でそれぞれ表示)。シミュレーション結果である奥行スケールのマップ(scale to depth map)2段目以降に、“triangular map matrix”、“conservation synaptic sites”、“diagonal matrix”の各手法にわけて示されている。
  この“LIGHTSHAFT ”モデルは、3次元形状復元に関係する神経生理的処理過程を踏まえたコンピュータモデルであり、シミュレーション実験の結果、テクスチャからの3次元形状復元に限定した場合、その復元に成功している。

3.3 絵画的奥行の曖昧性

  2次元画像の奥行視量にはそれぞれの研究ごとに程度の違いがある。その原因としては、研究ごとに刺激パターンが違っているから、異なる測定方法を用いているから、そして被験者には反応の個人差があるからと考えられてきた。これらの原因は一部には意味があるものの、多くは妥当でないと思われる。というのも、絵画的手がかりを十分に利用し2次元画像の立体視能力を得るまでには発達的に時間がかかるので、その能力の程度には相当の幅があると考えられる。そこで、2次元画像の立体視での曖昧性の原因をしらべるために、Battu,et al(3)は次のような実験を試みた。2次元画像は、27に示したように、自転車のサドルを後方から写真に撮った画像で、それらは水平面からの角度が30度/20度にあるもの、および正面からと左/右に30度回転させた角度からそれぞれ撮影したもの、計6種類である。視えの絵画的奥行は、図27にあるような方法で測定された。図(a)horizontal cross-section task(CH)を、(b)parallel cross-section task(CP)をそれぞれ示し、両方法とも黒色ドットをマウスで矢印方向に移動させ、視えの奥行が白色ドットとの間の間隔量で表現される。
  実験の結果、測定された視えの奥行量の等高線マップを2次元画像に対応させて作成してみると、被験者間で大きく異なっていること、さらにCHでの測定値とCPでの測定値の相関をとってみると、ある被験者には相関係数が1に近いような対応がみられるが、別の被験者には対応がまったく見られないこと、しかし、対応が見られない被験者の測定値をアフィン変換(Koenderink,et al.2001)し、CPでの測定値との対応を見ると係数が1に近い相関を示すことが示された。ある位置(xi,yi)CHCP法による測定値を(z i,z’ i)で表すとき、アフィン変換は次の式で行われる。

 Zi’=a+bxi+cyi+dzi

(ここで、x:CHの値、y:CPの値、Z’:アフィン変換値)

これらの結果は、2次元画像の各位置の視えの奥行はその物理的奥行と一義的には対応しないことを示した。2次元画像での視えの奥行知覚は、被験者間の分析からユークリッド的特性をもつよりアフィン特性をもっている。結局、2次元画像の立体視は、ひとつの奥行次元で規定されるような空間では無いと考えられている。

3.4 テクスチャ面における明るさコントラストによる立体視

 明るさコントラストには、ひとつの対象内の要素と背景間の明るさの比(テクスチャコントラスト)およびテクスチャと背景の明るさを含めたひとつの対象全体と背景の明るさ比(エリアコントラスト)とが考えられる。これを数式で示すと次のようになる。

テクスチャコントラストは、

(Lhigh - Llow) /  (Lhigh + Llow)

エリアコントラストは、

(Lmean – Lbackground) / (Lmean + Lbackground)

となる。28に示したように、テクスチャコントラストが高く、かつエリアコントラストが高いのは左下のパターンであり、その逆が右上のパターンである。テクスチャコントラストが低く、かつエリアコントラストも低いのは左上のパターンである。左下のパターンは、両方のコントラストが中位である。これらを観察すると、異なった対象間でもっとも明るさコントラストが高く、かつ対象内のテクスチャと背景面のコントラストが高いパターン(左下)がもっとも手前に、その逆のコントラスト特性を持つパターン(右上)がもっとも遠くに感じられる。
  Ichihara et al.(14)による実験では、標準となる刺激に対する実験対象の視えの相対的奥行を6段階で求めた。その結果、視えの奥行はテクスチャコントラストが高くなるに伴い直線的に大きくなること、またテクスチャコントラストの相対的奥行効果はエリアコントラストが低くなると強くなることが示された。
  これらの結果から、視えの相対的奥行にはテクスチャコントラストとエリアコントラストが相互に影響していると考えられる。

3.5 「凹面の顔(hollow-face)」の錯視

  「凹面の顔(hollow-face)」の錯視とは、実際は凹面の顔(顔のマスクを背面から見た状態)が、凸面に知覚されることをいう。これを研究したGregory (1970)は、人間の顔は凸状であるという知識が、視覚情報処理の最終過程で作用して実際は凹の形状を凸状に知覚させると考えた。
  この「凹面の顔(hollow-face)」の錯視の説明には、上記のGregoryに代表される「トップダウン仮説」、逆にこのような錯視が感覚情報とくにあいまいな両眼視差にもとづく誤った立体視に帰因するとする「ボトムアップ仮説」、およびこれら知識と感覚情報の両方に帰因すると考える説に大別される。そこで、どの仮説が妥当であるかが、Hill & Johnston(12)によって実験的に吟味された。実験1では、対象の熟知度要因が錯視に影響するかが、29-Aにあるような3種類の対象(テディベア、パイナップル、宝石)で、凹凸反転が生起する閾値を対象までの観察距離を変化させ測定することでしらべられた。これまでの研究によれば、対象の熟知度は凹凸反転に限定的にしか影響しない(Klopfer 1991, Papathomas & Bono 2004, Hill & Bruce 1994)。実験の結果、熟知度が高くかつ正立条件(テディベア)で「凹面を凸面に見る錯視」が観察距離の短い位置で生起すること、倒立条件では観察距離を遠くしないとこの錯視は生起しないことが示され、顔対象以外でも熟知度の高い対象でかつ正立位置にある場合に「凹面を凸面に見る錯視」がもっとも強く起きることが明らかにされた。
  実験2では、熟知的な方向と熟知的な照明方向の要因が、図29-Bに示された対象の提示方向を正立(0度)から90度間隔で270度まで時計回りに変化させ、実験1と同様な手法でしらべられた。この場合の照明方向は対象の回転に関わらず常に右からとした。これまでの研究では、正立方向が倒立方向より「凹面の顔(hollow-face)」の錯視は強く生起すること、また照明方向の違いよりは対象の提示方向の違いの方が強い影響をもつことが報告されている(Gregory 1973, Hill & Bruce 1993, Wolf & Wolf 1990)。実験の結果、正立位置条件(0度)でもっとも強い「凹面を凸面に見る錯視」が生起すること、提示位置が90度~270度に傾くにつれて錯視が起きにくくなることが示され、「凹面を凸面に見る錯視」には対象の熟知的な方向と熟知的な陰影パターンが影響することが明らかにされた。
  実験3では、観察者に対して照明光源が明確であるかどうかが「凹面の顔(hollow-face)」の錯視にどのように影響するかしらべられた。これまでの研究では光源が観察者に見えている条件の方が強い錯視効果を持つとしている(Wade 1983)。実験では光源が観察者に見えている条件と隠された条件で、実験2と同様な手法で試みた。その結果、観察者に対して光源が見えているか否かは、錯視の生起に影響しないことが明らかにされた。
  実験4では、人工的に作成した顔マスクの背面(凸面)のステレオグラム(29-C)で凹凸の見え方を判断させた。ステレオグラムの顔にはパースペクティブを付けたもの(Cの左列)と付けないもの(Cの右列)、およびグレイスケールのもの((Cの上行)とカラースケールのもの(Cの下行、図では白黒で表現してある)とがそれぞれ作成された。カラースケール条件では、顔の重要な要素である唇は赤く色づけされた。実験では、ステレオグラムにパーリンノイズ(Perlin noise、コンピュータグラフィックスのリアリティを増すために使われるテクスチャ作成技法でCGIで自然な外観を物に与えるためによく使われる)を0%から10%間隔で100%までかけ、各条件での凹凸印象が6段階評価で求められた。ステレオグラムの視差には凹面の他に凸面も加えられた。その結果、表面に色彩を付けたステレオグラムでは、強い「凹面の顔(hollow-face)」の錯視が生起すること、この色彩の効果は両眼視差あるいは顔のテクスチャ要因を上回るものであること、そしてパースペクティブ要因は錯視の生起に影響力をもたないことが示された。
  実験5では、実験4で使用したグレイスケールのステレオグラムの陰影を逆転したネガ版を作成して実施された。これまでの研究(Jonston et al. 1992)によれば、ポジの写真に比べてネガの写真での顔の認知は、陰影からの形状の復元が妨げられるので難しくなることが報告されている。図29-Dの右列にはネガ版が左列にはポジ版が、また上行には0%ノイズの画像が下行には60%ノイズの画像がそれぞれ示されている。実験は実験4と同じように、パーリンノイズを0%から100%まで変化させた際の「凹面の顔」の錯視の生起印象が6段階評価で、凸面出現視差条件も加えて求められた。実験の結果、ポジ版のステレオグラムはネガ版のそれに較べてノイズの多寡に関わらず「凹面の顔」の錯視が有意に起きること、しかしネガ版でもノイズが0%条件ではこの種の錯視が強く生起することが示され、このことからネガ版ステレオグラムでは顔の形状が知覚しにくく、しかも陰影からの形状復元が難しくなることが明らかにされた。ただ、ネガ版条件でもノイズが0%の場合には、「凹面の顔」の錯視が生起することから陰影要因は必須条件ではないと考えられる。
  実験6では、顔のレリーフの深さによって「凹面の顔」の錯視の程度が変わるかが試された。図29-Eに示したように、レリーフの深さは50%、100%、150%の3段階に操作(左から右)、またレリーフの深さを変えると陰影効果も変わるので、陰影効果をレリーフの深さに伴って変化させた条件(上行)と一定に保った条件(下行)も設定した。実験は実験4と同じように、パーリンノイズを0%から100%まで変化させた際の「凹面の顔」の錯視の生起を6段階評価で求めた。その結果、ノイズレベルが低い場合にはレリーフの深さは「凹面の顔」の錯視に影響を与えないが、ノイズレベルが高い場合にはレリーフの深さが小さい(50%)と錯視が生起しやすいこと、またレリーフの深さに伴って陰影効果を変化させた条件と一定に保った条件間には、「凹面の顔」の錯視生起に差は生じなかった。これらのことから、レリーフの深さは「凹面の顔」の錯視生起のための主要な要因ではないと考えられる。
  これらの結果から「凹面の顔(hollow-face)」の錯視は、熟知度、正立提示条件、陰影効果、および面の着色の要因によって促進されることが明らかであり、したがってこの種の錯視は「トップダウン説」と「ボトムアップ説」の両仮説を支持している。結局、対象があいまいな解釈が可能な条件を持つ場合に凸面を知覚するという一種の知覚的選好がはたらいて「凹面の顔(hollow-face)」の錯視は生起するものと考えられる。

3.6 先天性白内障による乳児期の視覚経験の剥奪と視覚的認知能力の阻害

  基本的な視覚機能の発達は生後1ヶ月の間に急速に進むが、両眼に強度の白内障をもって生まれてくると、視覚経験の剥奪のためにその発達が阻害される。発達阻害を受ける機能は、視力(Maurer & Lewis 2001)、時間的・空間的明るさコントラスト閾(Ellemberg et al.1999)、両眼立体視力(Maurer & Lewis 1993)、視野狭窄(Bowering,et al.1997)である。さらに、認知的なレベルでの視覚能力、たとえ大局的な運動(Constantinescu et al. 2005Ellemberg et al. 2002)、顔などの大局的な形状(Jeffery et al. 2002,Geldart et al. 2002, Le Grand et al. 2001,2004)の認知にも影響が及んでいる。
  そこで、生得的な白内障のために初期視覚経験が剥奪され、手術によって正常な視機能を回復した者を対象に主観的輪郭図形に対する認知反応をみることによって高次視覚機能への影響が、Putzar et al.(23)によってしらべられた。実験に使用した主観的輪郭図形は、30に示したように、主観的輪郭図形がパターンの一部に含まれているもの(a)、その部分が強調してあるもの(b)、その部分が含まれていないもの(c)である。被験者は、強度な白内障をもち生後6月齢以内に外科的手術を受けた7名(13から48歳)、強度な白内障をもち生後6月齢以後に外科的手術を受けた7名(17から33歳)、片眼に視覚障害(視野欠損、乱視、色素欠乏、眼球萎縮、網膜剥離、発達性白内障など)もつ10名(22から50歳)、そして健常な14(13から50)である。実験では、主観的輪郭を認知するまでの認知時間および正解率がしらべられた。
  その結果、6月齢以後に白内障の手術を受けた条件群は、健常者群に比較して主観的輪郭の認知反応時間が長くなり、また誤認知が多くなることが確認された。
  この結果から、生後6月齢以内に正常な視覚経験をもたないと、視覚認知能力が永久に損なわれると考えられる。

3.7 バブーンの廊下錯視と絵画的要因(テクスチャ勾配とパースペクティブ)

  廊下錯視(corridor illusion)とは、廊下状に配置された2つの等大の対象の中で遠くに配置された対象の方が手前にあるものよりも大きく知覚される錯視をいう。人間の成人(Fineman 1981, Humphereys et al.1994)や乳児(Yonas et al.1987, Perara & Cox 2000)では、この錯視が強く生起することが確認されているが、サルでの研究は少ない。そこで、Barbet & Fagot(2)は、2頭のバブーン(Papio papio)を対象に廊下錯視が生起するかを確かめた。あらかじめ、バブーンには2個の大きさが等しい対象に対する際の弁別反応と大きさが異なる際の弁別反応とを条件付けた。条件付け訓練は、2つの大きさの異なる対象がディスプレー上に提示されたとき、ジョイスティクを操作しカーソルを1.8秒動かすこと、また2個の対象が等大の場合には、カーソルを動かすことを控えることであった。刺激には、31に示したようなパターンが用いられ、(A)にはパースペクティブ要因で、(B)ではテクスチャ勾配で、それぞれ背景が構成された。
  実験の結果、バブーンは、パースペクティブ要因とテクスチャ勾配要因をそれぞれ背景にもつパターンで、顕著に大きさ錯視を生起させていることを示した。
   この結果は、廊下錯視の生起メカニズムが人間とバブーンは同一であることを示唆する。