終わりに

2008年度に報告された主な3次元視研究をまとめると、次のようになる。

両眼立体視研究

視覚システムの神経生理構造を基盤とした形状特徴と両眼視差の検出モデルがHarvey(7)によって提唱された。このモデルでは特徴検出のための視覚のネットワークモデル、すなわち「網膜の光受容器」-「神経節細胞(ガングリオンセル)」-「外側膝状体」-「視覚第1次野」を前提として、特徴マッチングアルゴリズム(feature-matching algorithm)、あるいは入力マッチングアルゴリズム(input-matching algorithm)2通りのアルゴリズムが構想され、それらの妥当性がシミュレーション実験で検証された。特徴マッチングアルゴリズムでは、左右眼からの画像から検出されたそれぞれの特徴について、方向、信号強度、水平方向の隣接領域の類似度からその対応度が評価され、このプロセスを画像の解像度を低レベルから高レベルへと変えながら実施して水平視差を特定する。第2の方法である入力マッチングアルゴリズムでは、左右のステレオペアの各要素の対応をとり、対応があればその関係を強化し、無ければ弱化し、ひとつのイメージマップにその関係を数値化して表す。この後で前述したと同様な手法で特徴検出を行い、視差特性と特徴の方向特性を確定する。シミュレーション実験の結果、実画像ステレオグラムの場合には、特徴マッチングアルゴリズムの方が入力マッチングアルゴリズムより視差検出の精度が高いが、一方ランダムドットステレオグラムでは、逆に特徴マッチングアルゴリズムの方が高いことが示されている。
  両眼視差処理過程では、第一次処理過程が持続的な特性をもち第二次過程は時間の経過で変容するトランジェントな特性をもつことがHess & Wilcox(8)によって明らかにされた。両眼立体視処理過程には2つのモード、すなわち輝度に規定された特徴にもとづく両眼視差検出のモード、および明るさコントラストに規定された特徴にもとづく視差検出モードがある。前者(第一順序のステレオプシス、first-order stereopsis)では、特徴の空間周波数特性に依拠し小さな視差に感受性が高い。一方、後者(第二順序のステレオオプシス、second-order stereopsis)では空間周波数には依拠せず、とくに大きな視差に感受性が高い。第一次過程がサステインドな輻輳運動過程にのみ対応し、第二次過程がトランジェントな輻輳運動過程にのみ対応することを確かめるために、Hess & Wilcox(8)は空間周波数パターンでステレオグラムを作成し、左右ペア間で明るさ対応をもつコラレート条件と逆の明るさ対応をもつ非コラレート条件を設定して実験した。コラレート条件は第一次視差処理過程に対応し、非コラレート条件は第二次視差処理過程に対応する。その結果、コラレート条件および”In-phase Gabors”ではすべてにおいて、ステレオ閾値は刺激提示当初からある閾値をとり、提示時間の経過とともにゆるやかな減少を示したが、非コラレート条件および”Out-of-Gabors”ではすべてにおいて刺激当初に一定のステレオ閾値をとることはなく、刺激提示時間の経過に伴い急激に上昇した。これらのことから、両眼視差処理過程では、第一次処理過程が持続的な特性をもち、第二次過程は時間の経過で変容するトランジェントな特性をもつことが示されている。
  視野闘争の神経生理モデル(3D LAMINART model)がGrossberg et al.(6)によって、これまでの神経生理学的そして精神物理学的研究を踏まえて提唱された。刺激が入力されると、V2の2あるいは3層で隣接し共線的関係にあるペア・ニューロン内での比較的長期の興奮と短期の抑制の相互作用によって知覚グルーピング(perceptual grouping)が生成される。この際、単一のニューロンから外方向への作用は生起しない。次ぎに、隣接した位置にありしかも刺激方向が異なる双極ニューロンは自己の知覚グルーピングを優先支配させるために競合する。そして最後に、順応過程が続き、ここでは、時間経過に伴って最初に優先支配した知覚体制が妨げられて弱まり、別の知覚体制へと変わる。3D LAMINART modelは知覚のグルーピングと図―地分擬からひとつの知覚あるいは闘争的知覚が生起するしくみを説明できる。
  視野闘争が起きているとき、左右眼からの刺激が交合する領域でも抑制が起きているかはいまだ明らかにされていない。そこで、Takase et al.(19)は、視野闘争の左右眼からの刺激の交合領域でこの種の抑制が生起しているかを、両眼立体視すると縦方向優位と横方向優位の視野闘争が出現し左右眼刺激の交合する領域には部分的融合が生起する事態で、交合領域にプローブとして配置したパッチの明るさコントラストの閾値を測定することで確かめた。プローブとしたコントラスト閾値の上昇は、交合領域が左右共に優位である条件、あるいは交合領域が他のパターンから独立して知覚される条件では生起しないことから、視野闘争条件での眼球間の抑制は部分的な融合領域で起きていること、さらには視野闘争や両眼視融合は刺激条件に依存するのではなく、その知覚内容で決まることが明らかにされている。
  ヒステレシスは一旦融合状態が生起すると融合を担う抑制過程で脱抑制が生じて安定的な知覚に移行するために生起するとの仮説をBuckthought et al.(2)は、傾斜して知覚されるサイン波形格子パターンの方向視差を融合事態から視野闘争へと変化させる方法で検証した。その結果、両眼立体視融合と視野闘争間にヒステレシス効果があること、またこのヒステレシス効果がフレーム提示持続時間0.5秒で最大となり、2秒では消失することが示された。これらの結果を踏まえて、両眼視融合と視野闘争のモデルが提唱された。このモデルでは、縦縞パターンに同調する「左右の単眼ユニット(LVRV)」、「+20度(RD)から-20度(LD)方向に同調するユニット」が設定されている。もしRDLDしか刺激されなければ、抑制ニューロン(ILIR)が作動して視野闘争が起きる。一方、縦縞格子パターンが左右眼に提示されると、LVRVが刺激され両眼視融合が生起し、抑制ニューロンであるI1とI2が作動することによってILIRが抑制され視野闘争が起きない。このモデルでは、両眼視融合あるいは視野闘争のいずれが生起するかは、2組の抑制ニューロン「I1I2」、「ILIR」の働きで決められる。したがって、このモデルによると、知覚的ヒステレシスは、両眼視融合が生起しているとき視野闘争刺激が入力されてもその知覚状態を安定させるようにこの抑制ニューロンが働くことで、視野闘争を抑制し融合から闘争への知覚移行点を延ばすために生起すると説明される。
  両眼視差のある刺激(ステレオグラム)を注視すると、潜時の極めて短い輻輳運動が生起する。Rambold & Miles(16)は、初動の「水平視差に駆動された輻輳運動」および初動の「垂直視差に駆動された輻輳運動」を測定したところ、ドットステレオグラムの場合、「水平視差に駆動された輻輳運動」と「垂直視差に駆動された輻輳運動」はそれぞれ、ステレオグラムの視差方向(θ)に対応して、サインあるいはコサインを描いて変化することを見いだした。しかし、サイン波形格子パターンのステレオグラムでは、「水平視差に駆動された輻輳運動」は格子パターンが90度(θは0度)になったときに最大となり、それが65度までは減じることがなかった。一方、「垂直視差に駆動された輻輳運動」は、格子パターンが0度(θは90度)のときに最大となり、垂直方向に変わるにつれてリニアに減少した。このことから、「水平視差に駆動された輻輳運動」の方が「垂直視差に駆動された輻輳運動」より優位であると考えられる。
  加齢に伴って両眼立体視力は確実に減退するが、しかし両眼立体視能力自体は維持されている。そこで、加齢に伴う両眼立体視力の減退は、ステレオグラムの左右ペア間での対応の検出が悪くなることが原因か否かについて、Norman et al.(13)によって検討された。その結果、(1)両眼立体視力は若者群と高齢群間に差がないこと、(2) 左右のステレオペアを構成する要素である小線分の角度を左右ペア間で変えた条件でも、高齢群はもっとも対応が困難な条件でも正しく立体形状を見ているが、形状知覚の正確度は若者群に較べ、とくに視差が大きい条件(51.5分)で劣ること、(3)高齢群は多義性ステレオグラムでの立体視も可能なこと、が示された。このことから、高齢群と若者群との間には両眼立体視能力で加齢による減退は免れないものの、その能力は機能的には減退していないことが明らかにされている。


運動要因による3次元視
  運動視差が働いているとき、対象が観察者の注視点を基準として前あるいは後ろのいずれに定位されて知覚されるかは、網膜上の対象の運動方向によって一義的に決めることができない。最近、対象を追従する遅い眼球運動が運動視差の奥行視に大きな役割を果たしていることが報告された。つまり、網膜上の対象の運動方向によって対象が注視点のどちら側にあるかを示すことができないならば、網膜以外の手がかりによって対象の遠・近が決められるというわけである。 Nawrot et al.(12)は、内斜視者の場合、頭部運動がある方向では内斜視眼は健常眼と同等の眼球運動をするが、頭部が別方向に動いた場合には内斜視眼の運動は狭まることに注目し、内斜視者を被験者として運動視差による奥行視閾値を測定することで、網膜以外の要因の効果を明らかにしようと試みた。その結果、内斜視眼が正常な範囲内の運動を出現させることが可能な場合には運動視差による奥行閾値は正常眼のそれと同等であったが、そうでない場合には奥行閾値は有意に大きくなることが示された。このことから、眼球運動が正常でない場合には運動視差の出現も正常ではなくなることが示され、運動視差による奥行視には網膜以外の情報が重要な手がかりとして組み込まれていると考えられる。


奥行手がかりの統合のためのモデル
  奥行や立体を知るための手がかり要因は、通常、複数個存在し、それらを統合して3次元視が成立する。このとき、複数の要因がどのようにして統合されるかについて、手がかりの弱い統合モデル(weak fusion model)と手がかりの強い統合モデル(strong fusion model)、および「手がかりの弱い統合の修正モデル(modified weak fusion model)」ある。後者のモデルによれば、ある手がかりは別の手がかりを拘束するので、視えの奥行はより現実の値に近づくように改善される。たとえば、両眼視差手がかりに運動要因が追加されれば、視えの奥行は改善されることになる。しかし実験結果によれば、このような改善は起こらない。つまり、奥行手がかりが単独で、あるいはそれらが協調して機能しても、現実に近い奥行知覚は得られないと考えられる。そこで、Tassinari et al.(20)は、「手がかりの弱い統合の修正モデル」に代わる新しいモデル”Intrinsic constraint model”を提案した。「手がかりの弱い統合の修正モデル」では、各奥行手がかりが単独で機能し、しかもバイアスのない奥行評価ができることを仮定することによって統合される奥行評価(復元される3D形状)は統計的に最少の偏差をもつ最適なものになると考える。これに対して、提案した新しいモデルでは、各奥行手がかりが単独で機能することを仮定せずに、各奥行手がかりからの情報を統合することでもっとも妥当な奥行評価を計算することができると考える。ここでは、3D形状は、(1)多次元の入力空間は実対象のアフィン構造を規定する1次元の空間に変換、(2)このアフィン空間内で最適なユークリッド解を計算、という手順で求められる。たとえば、シリンダー形状を両眼で頭部を運動させながら観察する場合、ある両眼視差は多数の運動速度と関係するが、対象の剛体性を仮定すれば視差と運動速度要因とは線形の関係をとる。この考え方によれば、たとえ視差―運動速度情報を表すために2次元の空間が必要でもこれらの情報が1次元の下位空間(視差―速度空間内で両要因によって構成される1次元の線分、)に投射できれば、これらの情報だけで対象形状の奥行を再現するのに十分と言うことになる。この下位空間の1次元線分が“intirinsic constraint line”と呼ばれる。真円のシリンダーと比較して提示されたシリンダーが楕円形か否かを判断させる検証実験の結果、提唱したモデルの方がその理論値と良く一致することが示されている。


絵画的要因による3次元視
  視空間を網膜へと投影した際の視点移動に伴うパースペクティブ構造の幾何光学的解析に基づくと、観察者が視空間を表現した2次元画像を注視するとき、知覚現象としては画家が扱うようなアルベルティの窓(世界が写された透明なガラスのようなスクリーンで、視空間の一部を覗き見る窓)を通して世界を視ることになる。このアルベルティの窓の中心は両眼輻輳の中心点(すなわち観察者の注視点)となるので、輻輳の中心点(注視点)の移動は、パースペクティブ構造をもつ投影像の中心を変えることと等価である。すなわち、観察者は新たな輻輳の中心点から幾何光学的に変形して再構成された3次元のシーンを視ることになる。このような両眼の輻輳の中心点の変化がパースペクティブ構造を変形し、その結果、観察者のシーン知覚に影響するという仮説(遠近-変形仮説、perspective-transformation hypothesis)がTodorovicè(21)によって提唱された。一方これまでは、輻輳中心点補償仮説(vantage-point compensation hypothesis)が提起されていた。それによるとパースペティブにもとづく知覚は堅固であり、輻輳の中心点が移動しても、ちょうど「形の恒常性」において視点角度が変わっても形は変形しないように、シーンの中に視えるものに影響しないと考えられた。実験による検証の結果、知覚された方向角度は、観察位置に比例して反時計回りに変化することが示され、「遠近―変形仮説」が支持された。
  乳児(5から8月齢)を対象とし、絵画的要因である陰影と隣接面間の接合の手がかりを用いて2次元画像の3次元視が可能かをしらべた(Imura et al.(11))。隣接面間の接合要因とは、短冊を折り曲げた形状の折り目部分(Y字形線分)の陰影を操作するもので、陰影を折れ目線分の境界で変えるものと、それを越えて変えるものである。前者の場合には成人では3次元視が可能であり、後者では2次元(平面的)にしか視えない。実験は、「2次元図形-2次元図形」、「3次元図形-2次元図形」の組み合わせ刺激を連続して提示し、乳児がどちらの組み合わせ刺激を注視するかを観察した。その結果、7から8月歳児は、「2次元図形-2次元図形」条件より「3次元図形-2次元図形」を有意に長く注視すること、5から6月齢乳児ではこのような選好は生じないことが示された。このことから、陰影と隣接面接合要因が絵画的な3次元手がかりとして働く発達的臨界期は6月齢と7月齢の間にあると考えられる。


眼球調節と輻輳作用
  対象の明瞭度(ボケの程度)、両眼視差、対象の視角の3手がかり要因を加減した条件下で眼球調節作用と両眼輻輳作用とがどのように変化するかを、Horwood & Riddell(10)はしらべた。手がかり条件は3要因が機能する条件をベースに、それから1要因を減じた条件(3条件)、3つの手がかりがそれぞれ単独で機能している条件(3条件)、および刺激にDOS関数刺激を用いて刺激明瞭度を除去した条件の計8条件である。実験の結果、観察距離に伴う眼球調節と輻輳作用は、(1)両眼視差が存在する条件では、対象の明瞭度を操作した条件や対象の視角を一定にした条件でもすべて正確に変化すること、(2)両眼視差が単独で機能している場合にも正確度は変わらないこと、(3)対象の明瞭度要因や視角一定操作条件がそれぞれ単独で機能している場合には正確度は劣化することが明らかにされた。
  また、眼球調節と両眼輻輳は協調して作用することが知られている。単眼視の場合、両眼視差の手がかりが存在しなくても眼球調節は両眼輻輳と連動(調節的輻輳作用)し、その逆にボケが生じて調節作用にすぐには作動しなくても輻輳作用は調節作用と連動して変化(輻輳的調節作用)する(Maddox 1887)。もし出生後、このような調節と輻輳作用が正常に働かないと、その発達は阻害される。調節と輻輳作用が単独であるいは協調して正常に機能するのは発達的にいつ頃かをしらべるには、それぞれの作用が作動するまでの潜時を指標として推定することができる。Tondel et al.(22)は、6週齢から23週齢の乳児を対象に両眼輻輳条件(両眼視で奥行方向に移動する対象を観察)、単眼輻輳条件(片眼で奥行方向に移動する対象を観察)、両眼調節条件(ボックス状の装置のなかに対象となる刺激を提示、観察は両眼視で奥行位置固定の対象を注視、対象にはDOGによるパターンを提示、片眼の前にプリズムを設置し両眼視差を変えることで輻輳角を変化)、両眼輻輳条件、単眼輻輳条両眼調節条件および単眼調節条件をそれぞれ設定し、フォトレフレクターを用いて調節と輻輳作用を測定した。実験の結果、7から23週齢の乳児は自然な手がかり条件で両眼観察した場合、調節と輻輳の起動のための潜時は1秒以下であること、またボケ駆動の調節、両眼視差駆動の輻輳、そしてこれら協調しての反応潜時もすべて1秒以下であることから、眼球の焦点調節作用と両眼の対象に対する輻輳作用とは視覚経験を通して発達し精緻されていくと考えられる。


視空間認知に関する研究
  Rentschler et al.(17)は、3次元対象が構造的記述に参照されて視覚的認知が成立するのか、あるいは観察者中心記述にもとづくのかを実験的に検討した。実験は視覚的認知の判断をする前の経験効果を操作するために(プライミング)、視覚学習と手指操作による触力覚学習を導入した。実験手続きは、「前経験(プライミング)-概念学習-般化テスト(ジェネラリゼーション)」の順であった。実験の結果、受動的視覚条件での成績は概念学習および般化テストの両方において能動的触力覚条件より劣ることが示された。これは、受動的視覚条件では対象についての十分なイメージを形成するための入力情報が今回用いた対象には存在しないためと考えられる。そこで、対象を構成する小球の代わりにテクスチャをもつ立方体を用いて同様な追実験を試みたところ、受動的視覚条件での概念学習は改善することが示された。また、能動的触力覚条件での視覚認知の成績が高いのは、3次元配置に注意を集中させられるためと考えられる。これらの結果から、対象物の視覚認知では、対象のイメージデータと対象の構造的記述が相互に排除しあうものではなく、イメージデータから構造的記述へと移行して参照されるものと考えられている。
  顔認知のモデルシミュレーション研究によれば、顔の全体性にもとづく「ホーリスティックなモード(holistic mode)」は視点変化がない場合の顔認知に優れているが、視点変化した場合には個々の特徴をベースとした「コンポーネントモード(component based mode)」の方が優れている。コンポーネントベースのホーリスティックモデルによれば、正立顔の場合にはホーリスティックモードで処理され、視点変化の場合にはコンポーネントモードで処理されるので、視点変化による顔認知は倒立顔条件より正立顔条件で悪くなると予測される。また、別の計算論モデルであるHMAXによれば視点変化による顔認知の精度はその経験値で決められると考え、正立顔と倒立顔というモードを設定していない。Wright et al.(24)は、コンポーネントベースのホーリスティックモデル、HMAXモデル、そして独立過程モデル(顔の角度および正立・倒立顔とが独立に処理される)のいずれが妥当なモデルかを検証した。ホーリスティックモデルでは、顔認知の精度は同一面位置・正立顔条件(正面/横面から作成した顔)でもっとも高く、異なる面位置・倒立顔条件(倒立顔の正面から横面へと顔の作成角度を右/左30度を変えたものを提示)でもっとも低く、異なる面位置・正立顔条件(正立顔で正面から横面へと顔の作成角度を変えたものを提示)と同一面位置・倒立顔条件(倒立顔で正面/横面から作成したものを提示)では顔認知の精度はそれほど変わらないと予測される。HMAXモデルでは、同一正立顔と変形正立顔条件では経験値があまり変わらないので類似した精度となるが、同一倒立顔条件では悪くなり、変形倒立顔条件では大幅に悪くなると予測される。独立過程モデルでは、同一正立顔、変形正立顔、同一倒立顔、変形倒立顔条件の順に顔認知の精度は段階的に悪くなると予測される。実験結果、顔の変形度に伴う顔認知の精度は同一面位置・正立顔条件(正面/横面から作成した顔)でもっとも高く、次ぎに異なる面位置・正立顔条件、同一面位置・倒立顔条件、そして異なる面位置・倒立顔条件で段階的に低くなること、しかもその精度の劣化は独立過程モデルの予測したものとほぼ一致することが示された。このことから、正立顔の認知が特殊な顔認知モードで処理されていないこと、顔の正立と倒立、および顔の視点角度変化は顔認知システムで一種のノイズとみなせるので、ノイズ量に比例して顔認知精度は劣化すると考えられる。