[선형대수] 벡터의 연산 - norm 놈 노름, Similarity 유사도

Statistics

[선형대수] 벡터의 연산 - norm 놈 노름, Similarity 유사도

eun2ng 2024. 12. 4. 14:49

출처: https://en.wikipedia.org/wiki/Linear_algebra

벡터의 놈과 유사도는 감정분석에서 강도와 유형을 구분하는 데 핵심적인 역할을 합니다.

놈은 감정의 강도를 나타내며, 문맥에서 감정이 얼마나 강한지 결정하는 데 사용됩니다.

유사도는 감정의 종류(긍정, 부정, 중립)를 분류하는 데 사용됩니다.
이 두 가지를 효과적으로 결합하면 더 정밀하고 강력한 감정분석 모델을 구축할 수 있습니다.

이번 게시물에서는 벡터의 놈과 유사도에 대해서 알아보도록 하겠습니다.

Norm 놈, 노름

벡터의 크기(magnitude) 또는 길이(length)를 측정하는 방법입니다.

즉 벡터가 원점에서 얼마나 떨어져있는지를 나타낸다고 볼 수 있습니다.

L(p) 노름의 수식 표현은 다음과 같습니다.

다음으로는 벡터가 주어졌을 때 벡터 놈을 계산하는 방법입니다.

L1-norm 맨해튼 놈(Manhatten norm)

벡터에 포함된 요소의 절대값의 합으로 정의됩니다.

L1-norm은 쉽게 말해 대각선으로 갈 수 없다고 생각하시면 됩니다.L1-norm이 뉴욕, 맨해튼의 격자형 도로망과 유사하다고 해서 맨해튼 놈이라고도 부릅니다.

[L1 노름의 수식표현]

위의 그림과 같이 2차원 평면 위의 벡터 (4,3)을 예시로 든다면 | 4 | + | 3 | 이 L1-norm의 값이 됩니다.

L1노름의 값을 구하는 python 코드는

torch.norm(a, p = 1)

입니다.

L2-norm 유클리드 놈(euclidean norm)

벡터에 포함된 요소의 제곱합의 제곱근으로 정의할 수 있습니다.

L2 노름은 유클리드 공간에서 두 점 사이의 최단 거리 구하는 방법과 같기 때문에 유클리드 노름이라고도 부릅니다.

x=[x1,x2, ... xn] 일 때 수식표현은 다음과 같습니다.

또 L2 -norm의 기하학적 표현을 보시면 우리가 익히 알고 있는 피타고라스의 정리로 빗변을 구했던 기억을 떠올리실 수 있습니다.

python으로 L2-norm을 구하는 공식은

torch.norm(a, p=2)

입니다.

L∞ norm

벡터에 포함된 요소의 절대값 중 최대값으로 정의할 수 있습니다.

x=[x1,x2, ... xn] 일 때 수식표현은 다음과 같습니다.

x=[x1,x2]일 때 L∞-norm을 기하학적으로 표현한 것은 다음과 같습니다.

python으로 L∞ -norm을 구하는 공식은

torch.norm(a, p = float(‘inf’))

입니다.

노름에 따른 기하학적 의미

출처 : https://towardsdatascience.com/vector-norms-explained-e72bf26e4a38

L1 노름의 경우 거리가 1인 점들의 집합은 |x1| + |x2| = 1 (2차원 기준)인 모든 점입니다.
이를 좌표평면에 그리면, 각 축에 대해 절대값의 합이 일정하므로 사분면마다 직선 형태의 경계가 그려지고, 전체적으로 마름모 모양의 "원"이 형성됩니다

노름은 벡터의 길이를 계산하는 방식으로, 우리가 흔히 떠올리는 원형 거리와 같습니다.
노름에서 거리가 1인 점들은 반지름이 1인 원을 형성합니다.

노름에서 거리가 1인 점들의 집합은 max(|x1|,|x2|)을 만족하는 모든 점입니다. 이는 각 좌표의 절대값이 최대 1을 넘지 않음을 의미합니다.
2차원에서는 |x1|, |x2| ≤ 1인 점들의 경계가 형성되며, 이는 정사각형 모양의 "원"을 그립니다.