본문 바로가기

수학

[선형대수-2] 이차형식과 행렬 대각화 : 고유값에 따른 타원곡선의 결정

728x90

이번 포스팅에서는 행렬의 대각화가 이차형식에 대해 이해하는데 어떻게 활용 될 수 있는지를 알아보겠습니다. 행렬의 대각화를 이용해 복잡한 것을 단순하게 이해하는 가장 기본적인 예시라고 할 수 있습니다. 이 과정만 제대로 이해한다면 앞으로 다룰 더 복잡한 과정도 쉽게 이해할 수 있습니다.

이차식

변수 $x$에 대한 이차식(이차함수)

$$y=ax^2+bx+c$$

은 중학교 시절에 처음 나오는 것 같은데, 수포자라고 하더라도 한 번 쯤은 들어 봤고, 한 번 쯤은 그래프를 그려봤고, 한 번 쯤은 근의 공식을 외웠던 중요한 함수 입니다. 이차함수는 해석적인 방법으로 해를 쉽게 구할 수 있고, 그래프 역시 쉽게 그릴 수 있으며, 테일러 근사와 같은 방법을 활용하여 임의의 함수를 부분적으로 근사할 때 꼭 나오는 함수이기 때문에 고등학교 수학의 수준을 넘어서 대학교 혹은 그 이상의 레벨에서 매우 자주 등장합니다.

$$f(x)\approx f(0)+f'(0)x+\frac{1}{2}f''(0)x^2$$

 

이차형식

이차형식(Quadratic form)은 모든 항의 차수가 2차인 항으로 이루어진 다항식 입니다. 위와 같이 1변수 함수(x)의 다항식일 수 도 있고, 2변수 함수(x, y)의 함수일 수 도 있습니다. 중요한 것은 모든 항의 차수가 2차이어야 한다는 것 입니다. 2변수 함수의 이차형식의 일반항은 아래와 같습니다.

 

$$f(x,y)=ax^2+by^2+2cxy$$

 

(별다른 언급이 없는 한, x제곱과 y제곱의 계수, a와 b는 0이 아니라고 가정하겠습니다. )

2변수 함수가 아니라 x, y, z로 이루어진 3변수 함수의 경우에도 이차형식을 정의할 수 있는데, 이 경우에는

 

$$f(x,y,z)=ax^2+by^2+cz^2+dxy+eyz+fzx$$

 

가 됩니다.

일반적으로 n개의 변수로 이루어진 이차형식의 경우, $\Sigma$ 기호룰 사용하여

 

$$f(x_1,x_2,...,x_n)=\sum _{i=1}^n\sum _{j=1}^na_{ij}x_ix_j$$

 

와 같이 쓸 수 있습니다.

이 포스팅에서는 2변수 이차형식만을 고려하도록 하겠습니다. 일반적인 n변수 이차형식에 대한 논의는 2변수 이차형식과 같은 방식으로 할 수 있습니다. 또한 2변수 이차형식의 일반형에서 xy 항의 계수를 c가 아닌 2c라고 하였는데, 이는 벡터 형식을 이용하여 이차형식을 표현한다면 c가 아닌 2c를 사용하는 것이 더 자연스러움을 확인할 수 있습니다.

 

$$\vec{x} = (x,y)^T = \begin{pmatrix}x\\y\end{pmatrix} $$

 

라고 정의하면, f(x,y)는 아래와 같이 간단하게 쓸 수 있습니다.

 

$$f(x,y) = f(\vec{x}) = (x,y)^T  \begin{pmatrix}a&c\\c&b\end{pmatrix}  \begin{pmatrix}x\\y\end{pmatrix} = \vec{x}^T A \vec{x}$$

 

$xy$ 항의 계수를 $2c$가 아닌 $c$ 라고 썼다면, 위 행렬 $A$의 $(1,2)$ 성분 혹은 $(2,1)$성분은 $c$가 아닌 $\frac{c}{2}$ 가 되어 항상 $\frac{1}{2}$를 써야한다는 불편함이 있습니다. 그러나 위에서와 같이 $xy$ 항의 계수를 $2c$라고 한다면 $(1,2)$ 성분 혹은 $(2,1)$ 성분을 $c$라고 간단하게 쓸 수 있습니다. 정확히는 $A$의 $(1,2)$ 성분과 $(2,1)$ 성분의 합이 $2c$ 이면 되기 때문에, 각각 $1.5c$, $0.5c$와 같이 두어도 되지만, 위와 같이 행렬 $A$가 대칭행렬이 될 수 있도록 $c$와 $c$로 두는것이 가장 좋습니다.

만일 1차식 $x$혹은 $y$의 항이 있다면?

보통의 경우 다항식을 다룰 때, $n$차식 이라고 하면 변수의 $n$ 제곱으로 이루어진 항 뿐 아니라, $n$보다 작은 제곱으로 이루어진 항도 포함된 식을 $n$차식 이라고 합니다. 예를들어 4차 다항식이라고 한다면

 

$$f(x,y)=ax^4+by^4$$

 

와 같이 모든 항이 4차식인 경우 뿐 아니라,

 

$$f(x,y)=ax^4+by^4+cx^2+dy+e$$

 

와 같이 2차, 1차 혹은 상수항을 포함한 식을 뜻 합니다. 따라서 이차형식을 정의할 때, 변수에 대한 1차식이나 상수항이 포함된 다항식을 생각할 수 도 있습니다. 그것이 보다 일반적인 이차식 혹은 이차형식이 될 것 입니다. 그러나, 변수에 대한 1차식은 매우 간단한(자명한) 변수 변환에 의해서 상쇄 됩니다.

고등학교 수학에서 2차 함수를 "완전제곱꼴"로 바꾸는 것이 구체적인 예시인데,

 

$$ax^2+bx+c=a(x-\frac{b}{2a})^2-\frac{b^2}{4a^2}+c=ax'^2+c'$$

 

와 같이

 

$$x\rightarrow x'=x-\frac{b}{2a}$$

 

로 변환을 하면, 원래식에서 $x$에 대한 1차식은 $x'$에 대한식에서 나타나지 않습니다.

이를 이변수 이차형식에도 확장하여 적용할 수 있습니다. 우선, 변수 $x$와 $y$에 대한 1차식이 있는 경우에 식 $f(x,y)$를

 

$$f(x,y) = f(\vec{x}) = ax^2 + by^2 + 2cxy + dx + ey + g = \vec{x}^T A \vec{x} + \vec{b}^T \vec{x} + g$$

 

와 같이 나타낼 수 있고, 이 경우

 

$$\vec{x} \rightarrow \vec{x'} = \vec{x} - \frac{1}{2} A^{-1} \vec{b}$$

 

와 같이 $\vec{x}$에서 $\vec{x'}$ 으로 변환을 한다면, $f(x,y)$식에서 $x$와 $y$에 대한 1차식은 사라지게 됩니다. 실제로 그렇게 되는지에 대해 궁금하면, 위 식을 전개해 보면 됩니다.

상수항은, 사실 특별히 처리할 수 있는 방법은 없습니다. 단지 함수 $f$를

 

$$f\rightarrow f' = f-C$$

 

와 같이 모든 상수항을 뺀(shift 된) 새로운 $f'$를 정의하는 방식으로 상수항을 처리 할 수 있습니다.

요약하면, 각 변수에 대한 1차식 혹은 상수항이 이차형식에서 추가되더라도, 적당한 벡터 $\vec{a}$와 상수 $C$를 골라서

 

$$\vec{x}\rightarrow \vec{x}' = \vec{x}-\vec{a}$$

$$f\rightarrow f'=f-C$$

 

와 같이 새로운 변수와 함수를 정의하면, 새롭게 정의한 변수와 함수에서는 각 변수에 대한 1차식 혹은 상수항이 사라지게 됩니다.

이차형식의 그래프

함수를 정의했으니, 그래프를 그려보는 것이 다음 과정입니다.

 

$$z=f(x,y)=f(\vec{x})=\vec{x}^TA\vec{x}$$

 

를 그리면 좋은데, 위 그래프는 3차원 공간상에서 그려야 하기 때문에 표현하기가 매우 어렵습니다. 그래서 특정한 $z$ 값에 대한 $(x,y)$ 평면상에서 자취를 구하는 것이 그나마 해 볼만합니다. 특별한 이유가 없다면 $z$값은 $z=1$를 선택하여,

 

$$\vec{x}^TA\vec{x}=1$$

 

의 그래프를 그려보면 됩니다. 간단한 예시로,

 

$$2x^2 + 2y^2 + 2xy = \vec{x}^T \begin{pmatrix}2&1\\1&2\end{pmatrix} \vec{x} = 1$$

 

의 그래프를 그리면 아래와 같습니다.

타원처럼 생겼음을 알 수 있습니다. 이것이 타원이라는것을 아직 증명을 하지 않았으니, "타원처럼 생겼다" 라는 표현을 쓴 것입니다. 만일 이 모양이 정말 타원이 맞다면, 장축의 방향은 $x=-y$ 방향이고, 단축의 방향은 $x=y$ 방향인것으로 보입니다.

행렬 대각화를 통한 간단한 표현

위 식에서 행렬 $A$는 대칭행렬입니다. 행렬의 대각화와 관련된 매우 중요한 정리 중 하나인 "대칭 행렬은 대각화 가능하고, 고유값은 실수이다"를 이용하여 $A$를 대각화할 수 있습니다. 실제로, 위 행렬 $A$의 고유값과 고유값에 대응되는 고유벡터는 각각

 

$$\lambda _1=3, \vec{v}_1=(\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}})^T$$

$$\lambda _2=1, \vec{v}_1=(-\frac{1}{\sqrt{2}},\frac{1}{\sqrt{2}})^T$$

 

가 됩니다. 행렬 대각화의 정의와, 위에서 구한 고유값, 고유벡터를 활용하면 예시로 들었던 2차형식을 다음과 같이 쓸 수 있습니다.

 

$$\vec{x}^T A \vec{x} = \vec{x}^T QDQ^{-1} \vec{x} =  \begin{pmatrix}x&y\end{pmatrix}   \begin{pmatrix}\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\-\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{pmatrix} \begin{pmatrix}3&0\\0&1\end{pmatrix} 
\begin{pmatrix}\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{pmatrix}
 \begin{pmatrix}x\\y\end{pmatrix}$$

 

$$=\begin{pmatrix}\frac{1}{\sqrt{2}}x + \frac{1}{\sqrt{2}}y&-\frac{1}{\sqrt{2}}x + \frac{1}{\sqrt{2}}y\end{pmatrix}  \begin{pmatrix}3&0\\0&1\end{pmatrix}  \begin{pmatrix}\frac{1}{\sqrt{2}}x + \frac{1}{\sqrt{2}}y\\-\frac{1}{\sqrt{2}}x + \frac{1}{\sqrt{2}}y\end{pmatrix}$$

 

$$=  \begin{pmatrix}x'&y'\end{pmatrix}  \begin{pmatrix}3&0\\0&1\end{pmatrix} 
 \begin{pmatrix}x'\\y'\end{pmatrix} = 3x'^2 + 1y'^2$$

 

$$= \frac{x'^2}{(\frac{1}{\sqrt{3}})^2} + \frac{y'^2}{1^2}$$

 

첫 번째 등호에서,

 

$$A=QDQ^{-1}$$

 

를 활용하였는데, 이는 행렬 $A$의 대각화 표현이며, 행렬 $Q$의 각 열벡터는 행렬 $A$의 고유벡터가 됩니다.

네 번째 등호에서,

$$x'=\frac{1}{\sqrt{2}}x+\frac{1}{\sqrt{2}}y$$

$$y'=-\frac{1}{\sqrt{2}}x+\frac{1}{\sqrt{2}}y$$

 

와 같이 $(x,y)$ 좌표계에서 $(x', y')$좌표계로 좌표 변환을 하였습니다. 즉, 기저벡터를 $(1,0)^T$, $(0,1)^T$ 에서 $(1,1)^T$, $(-1,1)^T$에 나란한 방향의 벡터를 사용한 것 입니다.

최종등호는 타원방정식의 기본형에 맞게 다시 쓴 것인데, 이를 통해서 그래프가 실제로 타원이라는 것을 확인할 수 있고, 장축의 길이는 $1$, 단축의 길이는 $\frac{1}{\sqrt{3}}$ 임을 알 수 있습니다. 장축의 방향은 $(-1, 1)^T$ 방향, 단축의 방향은 $(1,1)^T$ 방향입니다. 이는 맨위 그래프의 개형과 일치합니다.

위 그래프를 새로운 좌표인 $(x', y')$에서 그리면, 축에 나란한 타원이 되는데

실제 그래프의 모습은 이와 같습니다.

좌표 변환 $(x, y) \rightarrow (x', y')$을 행렬과 벡터를 이용하여 이쁘게 쓰면,

 

$$\begin{pmatrix}x'\\y'\end{pmatrix} = 
\begin{pmatrix}\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\-\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\end{pmatrix} \begin{pmatrix}x\\y\end{pmatrix}
 = \begin{pmatrix} \cos(\frac{\pi}{4})&\sin(\frac{\pi}{4})\\-\sin(\frac{\pi}{4})&\cos(\frac{\pi}{4})\end{pmatrix}  \begin{pmatrix}x\\y\end{pmatrix}$$

 

가 되는데, 이는 점을 $-45$도 회전 시키는 변환 혹은 좌표축을 $+45$도 회전 시키는 변환이 됩니다. 이 결과는 두 그래프의 생김새와 부합됩니다.

고유값과 고유벡터의 기하학적 의미

위에서는 특수한 값을 같은 행렬 A를 사용하였습니다. 일반적으로 표현하면 최종 결과는 아래와 같습니다.

 

$$1 = \vec{x}^T A \vec{x} = \vec{x}'^T D \vec{x}' = \lambda_1x'^2 + \lambda_2 y'^2 = \text{sgn}(\lambda_1) \frac{x'^2}{(\frac{1}{\sqrt{|\lambda_1|}})^2} + \text{sgn}(\lambda_2) \frac{y'^2}{(\frac{1}{\sqrt{|\lambda_2|}})^2}$$

 

$$\hat{x}' = \vec{v}_1, \hat{y}' = \vec{v}_2$$

 

이차형식은 행렬 $A$의 고유벡터의 방향을 새로운 기저 벡터로 하는 좌표축에 대해서 표준형이 되며, 고유값의 크기에 따라서 그래프의 크기가 결정됩니다.

위의 특수한 예시에서는 두 고유값이 모두 양수였기 때문에, 그래프는 타원형이었는데, 일반적으로는

두 고유값이 모두 양수 : 타원형
두 고유값이 모두 음수 : 실수해가 없음 (실수이 좌표 평면에서는 그래프가 그려지지 않음)
한 고유값은 양수, 다른 한 고유값은 음수 : 쌍곡선
고유값이 0일 때 : 축퇴된 타원형 혹은 쌍곡선 $\rightarrow$ 직선

이 됩니다. 고유값의 절대값에 따라서 고유 벡터를 기저로 하는 새로운(변환된) 좌표계에서의 스케일이 결정 됩니다. 타원형의 경우에는 축의 길이는 기저 벡터의 제곱근에 반비례 하기 됩니다.

결과를 요약하면

고유 벡터 : 타원 혹은 쌍곡선의 축방향을 결정 (축의 방향과 기저 벡터의 방향이 나란함)
고유값 : 부호 = 타원 혹은 쌍곡선을 결정, 절대값 = 크기를 결정

입니다.

위 그래프는 서로 다른 이차형식에 대한 타원형 그래프인데(서로 다른 행렬 $A$값을 갖는 이차형식에 대해서 이차형식=1의 그래프), 고유값의 크기는 같지만 고유벡터의 방향은 다른 경우 입니다. 타원형의 모양은 같고, 축의 방향이 다릅니다.

위 그래프는 고유 벡터의 방향은 같은데, 고유갑의 크기가 다른 경우의 타원형 그래프 입니다. 두 타원의 축방향은 일치하지만 고유값이 다르기 때문에 타원의 크기와 모양(원에서 변형이 된 정도)가 다릅니다.

위 그래프는 역시 서로 다른 이차형식의 그래프인데, 행렬 $A$의 두 고유값의 부호가 다른 경우 입니다. 앞에서 설명한 것과 같이 이 경우에는 쌍곡선이 얻어집니다. 서로 다른 두 행렬 $A$의 고유벡터의 방향이 같은 경우 쌍곡선의 축방향은 같습니다. 고유갑의 절대값이 다르기 때문에 두 그래프의 점근선의 방향이나 원점과의 거리가 다릅니다.

위 그래프는 서로 다른 두 행렬 $A$의 고유값은 같지만 고유벡터의 방향이 다른 경우 입니다. 고유값은 같기 때문에, 그래프가 생긴 모양은 똑같고, 방향이 서로 다릅니다. 파란색 그래프를 원점을 기준으로 회전하면 붉은색 그래프가 됩니다.

행렬의 대각화는 곧 복잡함을 간단하게 해 주는 과정이다

위 과정을 요약하면,

 

이차형식의 성질(그래프의 개형 등)은 이차형식을 정의하는 행렬의 고유값과 고유벡터에 의해서 결정된다

 

가 됩니다. $x$와 $y$의 곱인 $xy$항 때문에 그래프를 그리거나 함수의 성질을 파악하는것이 처음에는 어려워 보이지만, 행렬 대각화를 통해서 $xy$ 항을 없엘 수 있고, 최종적으로 이차형식은 매우 간단한 타원의 방정식 혹은 쌍곡선의 방정식이 됨을 확인하였습니다. 고유값과 고유벡터를 이용한 행렬의 대각화 표현은 행렬의 대각성분을 제외한 다른 성분을 모두 0으로 만들어주는 변환이기 때문에 결국 매우 복잡한 무언가를 간단한 무언가로 변환하는 과정이라고 할 수 있습니다. 이 같은 방법은 이번 포스팅인 이차형식을 간단한 형태로 변환하는 것 뿐 아니라 수학과 물리학의 매우 넓은 부분에 활용 될 수 있습니다. 이에 대해서는 다음 포스팅에서 설명하도록 하겠습니다.

 

728x90