본문 바로가기

명사 美 비격식 (무리 중에서) 아주 뛰어난[눈에 띄는] 사람[것]

이론

선형차원축소, PCA Principal Component Analysis: 가장 기본적인 차원축소

 

입력변수 개수를 차원, 차원의 저주를 보완하기위해 혹은 시각화하기위한 과정을 차원축소라고 한다 .

https://standout.tistory.com/1779

 

입력변수의 개수 차원 Dimension, 차원의 저주 Curse of Dimensionality 와 차원축소 Dimensionality Reduction하

차원Dimension입력변수의 개수.사람 등록을 위해 키, 몸무게, 나이가 필요하다면 이 3개가 차원이 된다 .x=(170,65,20)즉 위 벡터는 3개의 요소를 가지므로 3차원 공간의 한 점이 된다. 차원의 저주Curse o

standout.tistory.com

 

 

차원축소의 방법에는 특성선택, 특성추출이있다. 

https://standout.tistory.com/1780

 

차원축소의 방법: 특성선택 & 특성추출(선형 & 비선형)

입력변수 개수를 차원, 차원의 저주를 보완하기위해 혹은 시각화하기위한 과정을 차원축소라고 한다 .차원축소에는 대표적으로 선형차원축소와 비선형 차원축소가있다. Autoencoder는 비선형 차

standout.tistory.com

 

 

특성추출에서의 선형차원축소 방법중 아래의 방법을 확인해보자 . 

 

 

PCA Principal Component Analysis

주성분 분석, 데이터 분산이 가장 큰 방향을 찾는다.

아주 기본적인 '차원축소 방법'이다 . 데이터를 확인해서 분류를 하거나, 군집화하지않는다. 단순히 큰 방향을 찾아 차원축소한다.

= PCA: 데이터가 넓게 퍼지는 방향, LDA 클래스가 잘 나뉘는 방향

 

선형차원축소, LDA Linear Discriminant Analysis

입력변수 개수를 차원, 차원의 저주를 보완하기위해 혹은 시각화하기위한 과정을 차원축소라고 한다 .https://standout.tistory.com/1779 입력변수의 개수 차원 Dimension, 차원의 저주 Curse of Dimensionality 와

standout.tistory.com

 

 

키와 몸무메가 비슷하게 증가한다면 두 변수대신 체격이라는 하나의 축으로 표현.

데이터를 가장 잘 설명하는 축을 찾는 방법.

 

 

아래코드는 여러개 특성데이터를 2개의 축(주성분)으로 압축하는 코드.

from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)

print(pca.explained_variance_ratio_)