본문 바로가기

자기개발/Programming

머신러닝(Machine Learning) 기초 - 6 : 지도학습, 회귀법(Regression) 점 간 거리에 대하여

그래프 상 점(point)은 데이터를 의미하며 해당 데이터 간 거리를 이용한 회귀 법에는 3가지 방식이 있다.

1. Euclidean Distance (유클리드 거리법)
2. Manhattan Distance (맨해튼 거리 법)
3. Hamming Distance (해밍 거리 법)

 

각 거리를 구하는 공식을 들여다보기 전 데이터 포인트들을 어떤 식으로 코드화 할 것인지에 대해 먼저 알아보자.

연습을 위해 리스트(list)를 사용하며 리스트 내 각 아이템은 해당 포인트의 차원 (2차원, 3차원...)을 나타낸다. 예를 들어 포인트 (5, 8)은 파이썬에서 하기와 같이 나타낼 수 있다.

pt1 = [5,8)

2차원뿐 아니라 5차원 포인트 등 차원 수에 한정되지 않는다 (5차원 포인트 [4, 8, 15, 16, 23] )

두 포인트 간 거리를 찾기 위해서는 이렇게 함수로 나타낼 수 있다

distance([1, 2, 3], [5, 8, 9])

여기서 주의할 점은 포인트 간 거리를 찾기 위해서는 해당 포인트들의 차원 수가 같아야 한다는 점이다.

 

다음 포스팅에서 유클리드, 맨해튼, 해밍 거리 법을 사용하여 코딩으로 나타내고 실제 계산까지 실행해 보겠다.