데이터 사이언스 기초

거리 측도

skbaek1223 2024. 10. 31. 19:39

통계학에서 자주 사용하는 거리 측도 들에 대해서 정리해 보았습니다.

 

● 유클리디안 거리

 

두 점 사이의 가장 짧은 거리

 

● 맨하튼 거리

 

변수들의 차이의 단순합

 

● 체비셰프 거리

 

변수 간 거리 차이 중 최댓값

 

● 표준화 거리

 

유클리디안 거리에서 표준편차로 나눈 거리

 

 

● 마할라노비스 거리

 

표준화 거리에 변수 간 상관성을 고려한 거리

 

S: 변수의 공분산을 성분으로 하는 대각 행렬

 

 

 

● 민코프스키 거리

 

유클리디안 거리와 맨하튼 거리를 한 번에 표현한 거리

 

● 코사인 유사도

주로 텍스트의 유사도 측정에 활용되며, 크기가 아닌 방향성을 측정하는 지표

 

완전히 일치하면 1, 완전히 다른 방향이면 -1 입니다.

 

'데이터 사이언스 기초' 카테고리의 다른 글

SQL Window Function  (0) 2024.11.04
시계열 분석  (0) 2024.11.02
ML 분류 모형 평가 지표  (0) 2024.10.30
SQL 유용한 코드  (0) 2024.10.30
데이터 분석 관련 개념  (1) 2024.10.29