본문 바로가기

물리학

[고전역학-5] 해밀턴 역학 : 정준 변환 Canonical transformation

728x90

해밀턴 역학에 대해서 소개한 지난 포스팅의 결론은 "해밀턴의 방식으로 문제를 풀어야 하는 이유를 아직은 모르겠다" 였습니다. 라그랑주 방정식을 통해서 풀면 간단하게 풀리는 문제를 굳이 왜 더 복잡한 (손이 많이 가는) 방법을 통해서 풀어야 하는지에 대한 이유를 지난 포스팅에서는 할 수 없었습니다. 지난 포스팅에서 이어 다시 한 번 설명하지만, 해밀턴 방정식은 개별 문제를 푸는데는 사실 큰 도움이 되지 않습니다. 해밀턴 역학은 고전 역학의 "수학적 체계"를 이해하고 이를 통해서, 뉴턴 역학이나 라그랑주 역학에서는 다룰 수 없었던 정리를 발굴하는데 적합한 역학의 방법론 이라고 할 수 있습니다.

 

이번 포스팅에서는 해밀턴 역학을 공부하는데 가장 기초적이면서 핵심적인 개념인 정준 변환 Canonical transformation에 대해서 알아 보도록 하겠습니다. 네이버 영어 사전에서 "canonical" 이라는 단어를 검색하면 "(수학에서) 기준이 되는" 이라는 의미가 나옵니다. 국어 사전에서 "정준" 의 단어를 검색하면 여러 동음 이의어가 뜨는데, 그 중에서 準은 "정해진 표준" 이라는 의미가 나옵니다. 또한 이 단어는 수학과 물리학에서 정준 변환 이외의 용례에서는 거의 사용되지 않는 단어이기도 합니다. 어쨌든 정준 변환은 "기준이 되는 변환"이라는 뜻으로 그 뜻 만 살펴 보더라도 매우 중요한 의미를 갖는 변환이라는 것은 짐작할 수 있습니다. 

 

해밀턴 운동 방정식이 변하지 않는 좌표 변환

 

변환 이라는 것은 말 그대로 변화를 시켜준다는 것인데, 정준 변환의 변환은 좌표 변환 (coordinate transformation)의 일부 입니다. 즉, 정준 변환은 "특정한 성질을 만족 시키는 좌표 변환"입니다. 여기서 "특정한 성질"은 "해밀턴 운동 방정식을 변하지 않게 하는" 을 뜻 하고, "좌표"는 "위상 공간에서의 좌표"를 뜻 합니다. 이 둘 중에서는 위상 공간이 더 쉬운 개념이니, 우선 위상 공간에 대해서 알아보도록 하겠습니다. 

 

위상 공간

 

고전 역학계를 명확하게 기술하기 위해서는 각 자유도에 해당하는 값을 명확하게 표현하면 됩니다. 예를 들어, 가장 간단하게 3차원 공간상에 하나의 질점이 있는 시스템이라면, 이 시스템을 기술하기 위해서는 질점의 3차원 상의 공간 좌표 $(x, y, z)$ 값이 있다면 시스템을 명확하게 표현할 수 있습니다. 시스템에 $N$개의 질점으로 이루어져 있다면 각 질점당 3개의 좌표가 필요하니 총 $3N$개의 자유도에 대한 좌표가 있으면 시스템을 명확하게 기술할 수 있습니다. 조금 복잡한 시스템을 생각하면, 강제의 시스템을 생각할 수 있는데, 하나의 강제를 정확하게 표현하기 위해서는 강제의 질량 중심의 좌표 $(x,y,z)$가 필요하고, 강제의 회전을 기술하는 (예를 들면) 오일러 각의 세 각도 $(\alpha, \beta, \gamma)$가 필요 합니다. 

 

위에서의 설명은 정지된 시스템에 대한 기술에 해당합니다. 일반적으로 물제(질점)은 위치 뿐 아니라 속도를 갖고 있기 때문에 속도를 추가적으로 기술해야 합니다. 따라서 하나의 질점의 상태를 명확히 기술하기 위해서는 공간상에서 질점의 위치 $(x,y,z)$ 뿐 아니라 질점의 속도 $(v_x, v_y, v_z)$에 대한 추가적인 정보가 더 필요합니다. 따라서 종합하면, 질점 하나에 대한 완벽한 기술을 위해서는 $(x,y,z,v_x, v_y, v_z)$ 와 같이 총 6개의 실수 정보가 필요합니다. 

 

위상 공간은 위에서와 같이 시스템을 명확하기 기술 하기 위해 준비된 공간이라 할 수 있습니다. 계속 해서 1개의 질점으로 이루어진 시스템을 생각하면 $(\vec{x}, \vec{v}) = (x,y,z,v_x, v_y, v_z)$와 같이 표현되는 공간입니다. 속도 보다는 운동량이 좀 더 일반적인 개념이기 때문에, 속도 보다는 운동량을 이용하여 표현하면 $(\vec{x}, \vec{p})$ 로 표현되는 6차원 공간입니다. 질점의 현재 상태는 6차원 위상 공간의 한 점으로 완벽히 표현될 수 있으며, 반대로 6차원 위상 공간의 한 점은 이에 대응 되는 물리 공간의 상태를 기술하고 있다고 생각할 수 있습니다. 일반적으로 $N$개의 질점으로 이루어진 시스템의 경우, 위상 공간의 차원은 $D = 6N$이 되고, 이 위상 공간의 한 점은 $(\vec{x}^{N}, \vec{p}^N)$ 으로 표현 할 수 있습니다. 여기서 $\vec{x}^N = (\vec{x}_1, \vec{x}_2, ..., \vec{x}_N)$을 간단히 표현한 것 입니다. 해밀턴 역학에서는 보통 "(일반화) 위치"를 $\vec{x}$로 쓰기 보다는 $\vec{q}$로 쓰기 때문에, 이 포스팅에서도 이를 따라서 위상 공간의 점을 $(\vec{q}, \vec{p})$로 표현하도록 하겠습니다. 

 

위상 공간에서의 좌표 변화

 

공간을 정의 했으니, 이 공간에서의 좌표 변환을 정의하는 것은 자연스럽습니다. 좌표 변환은 말 그대로 시스템을 기술하는 좌표의 체계를 바꾸는 것인데, 물리 문제를 풀이 위해서 자주 도입하는 직교좌표에서 극좌표로의 좌표 변환은 좋은 예시 입니다. 위상 공간도 좌표 공간의 하나이니, 변환을 생각할 수 있고 (별다른 이유가 없으면 1개의 질점으로 이루어진 1차원 시스템을 생각하도록 하겠습니다), $(q,p) \rightarrow (q', p')$ 와 같은 일반적인 좌표 변환을 생각할 수 있습니다. 직교좌표 $\rightarrow$ 극좌표로 변환은 "공간상의 점은 그대로 있고, 이 점을 기술하는 축(시스템)이 변환" 된 passive 변환이라면, 우리가 생각하는 변환은 "실제로 공간상의 점이 이동하는 active 변환"을 생각하도록 하겠습니다. 이렇게 생각하는 것이 조금 더 편하기 때문입니다. 

 

좌표 변환의 일반적인 형태는 $(q,p) \rightarrow (q', p') = (q'(q,p), p'(q,p))$와 같이 표현할 수 있습니다. (이 포스팅의 끝 부분쯤 되면 알게 되겠지만) 위상 공간에서는 위치($q$)와 운동량($p$) 가 대등한 관계를 갖기 때문에 일반적으로 $q' = q'(q,p)$와 같이 위치의 변환을 단순히 위치에 대한 함수 뿐 아니라 위치와 운동량의 함수가 허락됩니다. 물론 $q' = q'(q)$와 같이 위치만의 함수로 표현하는 것도 가능한데, 이는 직교좌표 $\rightarrow$ 극좌표와 같이 일반적인 위치 공간에서의 좌표 변환이 됩니다. 위상 공간에서의 좌표 변환은 "위치는 위치끼리, 운동량은 운동량끼리의 변환이 아니라, 위치와 운동량이 모두 한꺼번에 바뀌는 변환"이라는 이라는 것을 인식하고 있는 것이 매우 중요합니다.

 

해밀턴 운동 방정식을 위상 공간에서 표현하기 (해밀턴 운동 방정식을 다시 쓰기)

 

해밀턴 운동 방정식

$$\dot{q} = \frac{\partial H}{\partial p}, \dot{p} = -\frac{\partial H }{\partial q}$$

$q$와 $p$에 대해서 각각 쓰지 않고 $\vec{\eta} = (q, p)$에 대해서 쓰면, 

$$ \frac{d\vec{\eta}}{dt} = \begin{pmatrix}\dot{q}\\\dot{p}\end{pmatrix}  =  \begin{pmatrix} \frac{\partial H}{\partial p}\\-\frac{\partial H}{\partial q}\end{pmatrix}  =  \begin{pmatrix}0&1\\-1&0\end{pmatrix} \begin{pmatrix} \frac{\partial H}{\partial q}\\\frac{\partial H}{\partial p}\end{pmatrix} =  \begin{pmatrix}0&1\\-1&0\end{pmatrix} \begin{pmatrix} \frac{\partial H}{\partial \eta_1}\\\frac{\partial H}{\partial \eta_2}\end{pmatrix} = \begin{pmatrix}0&1\\-1&0\end{pmatrix} \nabla_{\vec{\eta}}H$$

와 같이 쓸 수 있습니다. 여기서 조금 더 간단히(추상적으로) 식을 쓰기 위해서 $J = \begin{pmatrix}0&1\\-1&0\end{pmatrix}$ 를 도입하면, 해밀턴 운동 방정식은 

$$\frac{d\vec{\eta}}{dt} = J \frac{\partial H(\vec{\eta})}{\partial \vec{\eta}}$$

와 같이 표현 됩니다. 운동 방정식을 단 한 줄의 식으로 쓸 수 있게 된 것 입니다. 여기서 중요한 것은 $\vec{\eta}$를 위상 공간의 하나의 점으로 보는 것 입니다. 더 이상 위치와 운동량 이 두 물리량을 서로 다른 두 물리량으로 보는 것이 아니라 위치와 운동량은 위상 공간에서 각 축을 이루는 대등한 물리량이며, 위상 공간에서 한 점은 시스템에 대응된다는 것을 마음속에 지니고 있는 것이 중요합니다. 그리고 그 점의 시간에 따른 움직임은 1계 미분 방정식으로 주어진다는 것 입니다. 

1계 미분 방정식은 개념적으로 생각하기 매우 쉬운 미분 방정식인데, 

$$\vec{\eta}(t+dt) = \vec{\eta}(t) + d\vec{\eta} \approx \vec{\eta}(t) + J\frac{\partial H}{\partial \vec{\eta}}dt$$

따라서, 시간 $dt$에 따른 위상 공간의 점의 변화량 $d\vec{\eta}$는 $d\vec{\eta} = J\frac{\partial H}{\partial \vec{\eta}}dt$ 와 같이 주어집니다. 시간에 따른 위상 공간의 점의 움직임이 $\nabla_{\vec{\eta}}H$에 의해 결정됩니다. 실로 아름다운 방정식 입니다!

 

좌표 변환에 의한 운동 방정식의 변화

 

위상 공간에서 일반적인 좌표 변환 $\vec{\eta} \rightarrow \vec{\zeta} = \vec{\zeta}(\vec{\eta})$와 같은 좌표 변환을 생각하도록 하겠습니다. $\vec{\zeta} = (Q, P)$ 라고 하도록 하겠습니다. 즉, $(q,p)$ 좌표에서 $(Q, P)$ 좌표로 변환하는 것 입니다. 우리는 $\vec{\eta}$ 좌표의 운동 방정식이 $\dot{\vec{\eta}} = J \frac{\partial H }{\partial \vec{\eta}}$ 라는 것을 알고 있습니다. 그렇다면, $\vec{\zeta}$에 대한 운동 방정식은 어떻게 될까요? 즉, $\dot{\vec{\zeta}} $이 무엇인지를 찾는것이 목표입니다.

 

일반적으로 $\zeta_1 = \zeta_1(\eta_1, \eta_2), \zeta_2 = \zeta_2(\eta_1, \eta_2)$라 할 수 있고, 체인룰(Chain rule)에 의해서

$$\dot{\zeta_1} = \frac{\partial \zeta_1}{\partial \eta_1} \dot{\eta _1} + \frac{\partial \zeta_1}{\partial \eta_2} \dot{\eta _2}$$

$$\dot{\zeta_2} = \frac{\partial \zeta_2}{\partial \eta_1} \dot{\eta _1} + \frac{\partial \zeta_2}{\partial \eta_2} \dot{\eta _2}$$

가 됩니다. 이 식을 야코비 행렬(Jacobian Matrix) $M_{ij} = \frac{\partial \zeta_i}{\partial \eta_j}$를 이용하여 간단히 표현하면,

$$\dot{\vec{\zeta}} = M\dot{\vec{\eta}}$$

와 같고, $\dot{\eta} = J \frac{\partial H}{\partial \vec{\eta}}$로 부터,

$$\dot{\vec{\zeta}} = M\dot{\eta} = MJ \frac{\partial H}{\partial \vec{\eta}}$$

를 얻습니다. 

 

이제는 $\frac{\partial H}{\partial \vec{\eta}}$를 $\zeta$의 함수로 나타낼 차례입니다. 역시나 체인룰을 이용해서 구할 수 있는데, 

$$\frac{\partial H}{\partial \eta_i} = \sum_{j}\frac{\partial H}{\partial \zeta_j} \frac{\partial \zeta_j}{\partial \eta_i}$$

와 같고, 앞에서와 같이 야코비 행렬 $M$을 이용하여 간단하게 표현하면,

$$\frac{\partial H}{\partial \vec{\eta}} = \widetilde{M} \frac{\partial H}{\partial \vec{\zeta}}$$

가 됩니다. 위 식을 앞에서 구한 $\dot{\zeta}$에 대한식에 대입하면, 

$$\dot{\vec{\zeta}} =  M J \widetilde{M} \frac{\partial H}{\partial \vec{\zeta}}$$

를 얻습니다. 이것이 위상 공간에서 좌표 변환 $\vec{\eta} \rightarrow \vec{\zeta}$ 된 좌표 $\vec{\zeta}$에 운동 방정식 입니다.

 

$\vec{\eta}$에 대한 운동 방정식 $\dot{\vec{\eta}} = J \frac{\partial H}{\partial \vec{\eta}}$과 $\vec{\zeta}$에 대한 운동 방정식 $\dot{\vec{\zeta}} = MJ \widetilde{M} \frac{\partial H}{\partial \vec{\zeta}}$을 비교하면, 해밀토니안 미분의 앞있는 행렬이 $J$ 와 $MJ\widetilde{M}$으로 서로 다르다는 것을 확인할 수 있습니다. 

 

특정 조건을 만족시키는 좌표 변환만을 고려하자

 

좌표 변환 $\vec{\eta} \rightarrow \vec{\zeta}$에 의한 운동 방정식의 변화는 앞에서 알아 본 바와 같이 운동 방정식의 항에서 $J \rightarrow MJ\widetilde{M}$의 변화 입니다. 일반적으로 좌표 변환을 하면 행렬 $M$과 $\widetilde{M}$이 추가적으로 운동 방정식에 나오기 때문에 운동 방정식이 복잡해 집니다. 

 

일반적인 좌표 변환을 고려하지 않고, $MJ\widetilde{M} = J$ 를 만족하는 좌표 변환만을 고려하면 어떨까요? 그렇게 된다면, 좌표 변환 $\vec{\eta} \rightarrow \vec{\zeta}$에 의해서 운동 방정식이 $$\dot{\vec{\zeta}} = J \frac{\partial H}{\partial \vec{\zeta}}$$와 같이 기본적인 해밀턴 운동 방정식의 형태가 됩니다! 좌표 변환을 했지만, 운동 방정식은 형태가 변하지 않았습니다. $\vec{\eta}$ 좌표를 기본으로 두고, 이 좌표에서 $\vec{\zeta}$ 좌표로 좌표 변환을 하였지만, $\vec{\eta}$ 공간에서 운동 방정식과 $\vec{\zeta}$ 공간에서 운동 방정식이 동일 하기 때문에, $\vec{\eta}$ 공간과 $\vec{\zeta}$ 공간이 무엇이 우선이 되고, 무엇이 차선이 되는지를 구별할 수 없게 됩니다. 서로 다른 좌표 공간에서의 운동 방정식이 해밀턴 운동 방정식의 형태를 유지한다면, 각 좌표 공간은 모두 동등하고, 이 좌표 공간의 위치와 운동량 좌표는 정준 좌표 공간이라고 할 수 있습니다. 정준 변환은 아래와 같이 정의 됩니다. 

 

정준 변환 : 위상 공간의 좌표 변환 $\vec{\eta} \rightarrow \vec{\zeta}$ 중, 운동 방정식의 형태를 변화 시키지 않는 변환. 즉, $MJ\widetilde{M} = J$가 되게 하는 변환

 

따라서, 위상 공간에서 좌표 변환 $(q, p) \rightarrow (Q, P)$ 이 정준 변환이라고 한다면, $(Q, P)$ 좌표에서의 운동 방정식은

$$\dot{Q} = \frac{\partial H}{\partial P}, \dot{P} = -\frac{\partial H}{\partial Q}$$

가 됩니다. 여기서 $H$는 $H(Q, P)$입니다. (중요하기 때문에) 다시 한 번 강조 하면, 변환된 좌표 $(Q, P)$에서의 운동 방정식의 형태는 변하지 않습니다

 

정준 변환의 예시 1) 위치와 운동량의 역할 바꾸기

 

간단하면서도 개념적으로 중요한 예시를 하나 들어 보도록 하겠습니다. 변환,

$$(q, p) \rightarrow (P, Q) = (q, -p)$$

를 생각해 보도록 하겠습니다. 이 변환은 위치를 운동량으로, 운동량을 위치로 바꾸는 변환입니다. 운동량을 위치로 바꾸는 과정에서 마이너스 부호가 있습니다. 위 변환의 야코비 행렬을 구하면,

$$M =  \begin{pmatrix}\frac{\partial Q}{\partial q}&\frac{\partial Q}{\partial p}\\\frac{\partial P}{\partial q}&\frac{\partial P}{\partial p}\end{pmatrix}  =  \begin{pmatrix}0&-1\\1&0\end{pmatrix} $$

이 되고, $MJ\widetilde{M} = J$ 가 됨을 간단한 계산을 통해서 확인할 수 있습니다. 

$$\begin{pmatrix}0&-1\\1&0\end{pmatrix}  \begin{pmatrix}0&1\\-1&0\end{pmatrix} \begin{pmatrix}0&1\\-1&0\end{pmatrix}  =\begin{pmatrix}0&1\\-1&0\end{pmatrix} $$

따라서 이 변환은 정준 변환이 됩니다. 새로운 좌표에서 $Q$는 위치, $P$는 운동량이 됩니다. 정준 변환을 통해서 위치와 운동량의 역할을 바꾼 것입니다. 이 포스팅과 이전 포스팅에서 여러번 해밀턴 역학의 위상 공간에서는 위치와 운동량이 대등한 것이다 라고 하였는데, 이 예시와 같이 정준 변환을 통해서 위치와 운동량의 역할을 자유롭게 바꿀 수 있기 때문에 위치와 운동량이 대등하다는 것을 수식적으로도 확인할 수 있습니다. 

 

정준 변환의 예시 2) 단조화진동자 문제를 간단히 풀기

 

물리계에서 가장 간단하면서도 가장 중요한 단조화진동자 시스템에 대해서 생각해 보도록 하겠습니다. 논의의 편의를 위해서 해밀토니안을 $H = \frac{1}{2}\dot{p}^2 + \frac{1}{2}q^2$로 간단히 하겠습니다. 변환 $(q, p) \rightarrow (Q, P)$에 대해서 $Q(q,p), P(q,p)$를 정의하지 않고, 반대로 $q(Q, P), p(Q,P)$를 정의하도록 하겠습니다. $(q, p) \rightarrow (Q, P)$이 정준 변환이면, $(Q, P) \rightarrow (q, p)$도 정준 변환이 됩니다. 

$$p = \sqrt{2P} \cos Q$$

$$q = \sqrt{2P} \sin Q$$

와 같이 정의하면, 이 변환은 정준 변환이 됩니다. 변환의 야코비 행렬을 구한 뒤, 직접 계산을 하면 이 변환이 정준 변환이 됨을 확인할 수 있습니다. 이 변환에 의해서 해밀토니안 $H(q,p)$는

$$H(Q,P) = \frac{1}{2} (\sqrt{2P} \cos Q)^2+\frac{1}{2} (\sqrt{2P} \sin Q)^2 = P$$

가 됩니다. 해밀토니안 = 운동량이 되었습니다. 이 해밀토니안으로 기술되는 시스템이 어떤 시스템인지는 모르겠으나, 수학적으로는 이와 같은 변환이 얻어졌습니다. $(Q, P)$에 대한 운동 방정식을 구하면, 

$$\dot{Q} = \frac{\partial H}{\partial P} = 1$$

$$\dot{P} = -\frac{\partial H}{\partial Q} = 0$$

으로 매우 간단한 방정식을 얻습니다.

위 미분 방정식의 해는 $Q(t) = t + t_0, P(t) = P_0 = E$입니다. 최종적으로 얻어야 하는 답은 $q(t), p(t)$이기 때문에 위 정준 변환의 역연산을 통해 $(Q, P) \rightarrow (q,p)$ 변환을 하면, 

$$q(t) = \sqrt{2E} \sin (t + t_0)$$

$$p(t) = \sqrt{2E} \cos (t + t_0)$$

를 최종 답으로 얻습니다. 위 답은 단조화진동자를 뉴턴의 방법이나 라그랑주의 방법으로 구한 답과 당연히 동일 합니다. 여기서 $E, t_0$는 초기 조건으로 결정되는 상수입니다. 특히 $E$ 는 시스템의 총 역학적 에너지 입니다. 상수 $P_0$를 $E$라고 쓴 이유가 이것 입니다. 

 

이 예시의 핵심은 정준 변환을 통해서 변환된 좌표의 해밀토니안을 매우 간단하게 변환할 수 있다 입니다. 해밀토니안이 매우 간단해 지면, 운동 방정식을 통해서 해를 찾는 과정이 매우 간단해 집니다. 위 예제에서는 $H= P$가 됐고, 이 해밀토니안은 $Q$에 대해 무관하기 때문에 $Q$에 대응되는 짝(Conjugate variable)인 $P$가 보존량이 되었습니다. 문제가 쉬워진 것일까요? $Q, P$의 미분 방정식을 푸는 것은 말도 안되게 쉬운 것으로 바뀌었지만, 사실은 모든 어려움은 $(q, p) \rightarrow (Q, P)$ 의 변환을 찾는 것으로 전가 되었습니다. 어려움이 완전히 사라진 것이 아니라, 다른 형태의 어려움으로 형태만 바뀌었을 뿐 입니다. 이번 예시에서는 $p = \sqrt{2P}\cos Q, q= \sqrt{2P} \sin Q$ 를 처음 부터 알고 시작했지만, 이 변환을 찾으려고 노력했다면 (만일 처음 한다면) 상당한 시간이 걸렸을 것 입니다. 그냥 이 방법을 택하지 않고, 평범하게 2계 미분 방정식을 푸는것이 훨씬 더 빨랐을 것 입니다. 

 

좋은 변환을 쉽게 찾는 방법은 없을까?

 

위 예시와 논의의 결론은 좋은 변환을 취하면 해밀토니안이 매우 단순해지기 때문에, 운동 방정식을 풀리가 매우 쉬워진다. 그러나 임의의 문제에서 좋은 변환을 찾는 어려움이 있다 입니다. 일반적인 해밀토니안에 대해서 좋은 정준 변환을 찾는 방법은 없을까요? 그 방법만 찾는다면, 모든 문제를 매우 쉽게 풀 수 있습니다. 

 

728x90