본문 바로가기

Machine Learning2

[차원 축소] t-분포 확률적 임베딩(t-SNE)을 알아보자 차원 축소의 한 기법으로 쓰이는 t-SNE에 대해서 알아보자. 아래의 내용은 내 졸업 논문의 내용을 일부 차용했으며, 세간에 알려진 t-SNE에 대한 일부 잘못된 정보를 바로 잡는 것도 목표로 삼는다. 선형적 차원 축소의 한계와 t-SNE의 목표 일단 아주 단순하게 차원 축소를 진행한다고 생각한다면, 사영(projection)이 떠오를 것이다. 다음으로는 주성분 분석(PCA)도 있을 것이다. 주성분 분석에 대해서는 아래의 글에 잘 설명해뒀으니 시간이 있다면 참고 바란다. [Machine Learning/차원 축소] - 주성분 분석(PCA)을 알아보자 위의 두 방법 모두 선형적인 차원 축소 기법이다. 장점으로는 빠르고 축소된 차원의 설명이 어느 정도 가능함이 있다. 하지만 위의 두 선형 차원 축소 기법의 .. 2022. 8. 16.
[차원 축소] 주성분 분석(PCA)을 알아보자 정말 많이 쓰이는 머신러닝 기법이지만 이해하기 어려운 주성분 분석(PCA; principal component analysis)에 대해 설명해본다. 이 글은 고윳값 분해(eigen decomposition) 또는 특이값 분해(SVD; singular value decomposition)를 아는 사람에게 수준이 맞춰져 있음을 미리 밝힌다. 주성분 분석은 데이터의 주성분을 찾는 방법이다. 데이터의 주성분은 데이터들의 분산이 가장 큰 벡터다. 쉽게 말하자면, 기존 단위 벡터로는 설명이 잘 안 되니까 축을 틀어서 더 좋게 설명해보자는 것이고, 그 축을 분산이 가장 큰 벡터로 잡는 것이다. 이를 위해선 먼저 분산이 가장 큰 벡터를 찾아야 한다. 이를 위해 데이터들의 공분산 행렬을 구한다. 물론 여기서 데이터의 중.. 2022. 7. 28.
728x90