통계학에서 자주 사용하는 거리 측도 들에 대해서 정리해 보았습니다.
● 유클리디안 거리
두 점 사이의 가장 짧은 거리
● 맨하튼 거리
변수들의 차이의 단순합
● 체비셰프 거리
변수 간 거리 차이 중 최댓값
● 표준화 거리
유클리디안 거리에서 표준편차로 나눈 거리
● 마할라노비스 거리
표준화 거리에 변수 간 상관성을 고려한 거리
S: 변수의 공분산을 성분으로 하는 대각 행렬
● 민코프스키 거리
유클리디안 거리와 맨하튼 거리를 한 번에 표현한 거리
● 코사인 유사도
주로 텍스트의 유사도 측정에 활용되며, 크기가 아닌 방향성을 측정하는 지표
완전히 일치하면 1, 완전히 다른 방향이면 -1 입니다.
'데이터 사이언스 기초' 카테고리의 다른 글
SQL Window Function (0) | 2024.11.04 |
---|---|
시계열 분석 (0) | 2024.11.02 |
ML 분류 모형 평가 지표 (0) | 2024.10.30 |
SQL 유용한 코드 (0) | 2024.10.30 |
데이터 분석 관련 개념 (1) | 2024.10.29 |