Image manifolds


 Image manifolds というのは結構面白そう。


Unsupervised learning of image manifolds by semidefinite programming
Weinberger, K.Q. and Saul, L.K.
International Journal of Computer Vision, October, 2006, 70(1):77-90


 基本的には次元圧縮の文脈から出てきたらしい。でもPCAとかみたいに軸を選んで subspace を張りなおすのではなくて、高次元空間上のデータ点(たとえば2次元画像など)の集合が「」とか「」みたいにぐねぐねしている場合に、その近傍の関係は保持したまま引き伸ばして「」とすると。


 面白いのは、引き伸ばした空間上で interpolation なり extrapolation をすることで、わりと自然な新規の画像を作ることができること。たとえば正面を向いたときの目の写真、20度下を向いた目の写真、というようなデータの集合を引き伸ばし、その空間上の点をとることで40度下を向いた目の画像を生成できる等。


http://vision.ucsd.edu/~pdollar/research/NIPS06/fig3.png
(中心の9つは学習空間内のデータ。外側にあるのは extrapolate したもの。)
Non Isometric Manifolds Learning , Piotr Dollar @ UC San Diego より


 3次元的な移動・回転に対する不変性(invariance)はこういうやり方で説明できたりするのだろうか。上でやっていることはつまり2次元画像に投射された3次元的な移動・回転に関する inter/extrapolation なのだけど、その過程で外界で起きていることが3次元空間内での移動・回転であるという情報は全く用いていないというところが面白い。


 これを見て思い出すのは、J. J. Gibson さんの


「空間の概念をもたない限り、我々は周囲の世界を知覚できないであろうとする説は意味のないことである。


という言及。これを読んだときは、そんなこと言ったって3次元的な内部モデルがないと回転不変性なんて実現できないのでは、と思っていたけど、そうでもないのかもしれない。(飛躍しすぎ?)


 ネタとしてはもうちょっと昔からあるものらしい↓。


Nonlinear dimensionality reduction by locally linear embedding.
Roweis ST, Saul LK.
Science. 2000 Dec 22;290(5500):2323-6.


A global geometric framework for nonlinear dimensionality reduction.
Tenenbaum JB, de Silva V, Langford JC.
Science. 2000 Dec 22;290(5500):2319-23.