본문 바로가기

명사 美 비격식 (무리 중에서) 아주 뛰어난[눈에 띄는] 사람[것]

이론

비선형 차원축소, 직선거리를 버리고 Geodesic Distance를 사용하는 Isomap Isometric Mapping


Isomap Isometric Mapping 

비선형 차원 축소 알고리즘,

 

PCA는 직선구조를 잘 처리한다고 했다. 동시에 구부러진 구조를 잘 표현하지 못하는데.Swiss Roll  말려있는 종이  데이터라고 했을때 2차원의 종이라 3차원으로 말려있는 형태이지만 PCA는 말려있는 상태 그대로 압축해버리니 잘 처리하지못한다.

https://standout.tistory.com/1781

 

선형차원축소, PCA Principal Component Analysis: 가장 기본적인 차원축소

입력변수 개수를 차원, 차원의 저주를 보완하기위해 혹은 시각화하기위한 과정을 차원축소라고 한다 .https://standout.tistory.com/1779 입력변수의 개수 차원 Dimension, 차원의 저주 Curse of Dimensionality 와

standout.tistory.com

 

 

Isomap은 직선거리를 버리고 Geodesic Distance를 사용한다 .

종이를 평쳐 2차원으로 표현하는것으로 직선거리를 사용하지않는다는 핵심아이디어로 대신 곡면을 따라가는 거리를 사용한다.

이를 Geodesic Distance라하며 지구표면에서 서울 - 뉴욕까지의직선거리는 불가하지만 지표면 거리로는 가능하다는 이론을 상상해보길 바란다 .

 

 

아래는 먼저 n_neighbors = 5로 각점마다 가까운 5명의 이웃을 찾아 그래프를 생성하고

최단 경로를 계산해 저차원으로 배치하는 예시코드이다.

이는 PCA보다 우수하고 곡면구조 보존으로 Swiss Roll 데이터에 강한 고차원 - 2차원이 가능한 시각화기능을 가졌다. 다만 최단 경로계산이 필요해 대규모 데이터에 불리해 느릴 수 있고 이웃선택이 중요해 노이즈에 민감하다는 장단점이 있다. 

from sklearn.manifold import Isomap

isomap = Isomap(
n_components=2,
n_neighbors=5
)

X_isomap = isomap.fit_transform(X)