주성분 분석1 [차원 축소] 주성분 분석(PCA)을 알아보자 정말 많이 쓰이는 머신러닝 기법이지만 이해하기 어려운 주성분 분석(PCA; principal component analysis)에 대해 설명해본다. 이 글은 고윳값 분해(eigen decomposition) 또는 특이값 분해(SVD; singular value decomposition)를 아는 사람에게 수준이 맞춰져 있음을 미리 밝힌다. 주성분 분석은 데이터의 주성분을 찾는 방법이다. 데이터의 주성분은 데이터들의 분산이 가장 큰 벡터다. 쉽게 말하자면, 기존 단위 벡터로는 설명이 잘 안 되니까 축을 틀어서 더 좋게 설명해보자는 것이고, 그 축을 분산이 가장 큰 벡터로 잡는 것이다. 이를 위해선 먼저 분산이 가장 큰 벡터를 찾아야 한다. 이를 위해 데이터들의 공분산 행렬을 구한다. 물론 여기서 데이터의 중.. 2022. 7. 28. 이전 1 다음 728x90