돌수학

[선형대수학] 케일리 해밀턴 정리, 기약다항식 본문

전공수학

[선형대수학] 케일리 해밀턴 정리, 기약다항식

돌수학 2024. 12. 7. 16:06

 

 

 

이번 포스팅에서는 케일리 해밀턴 정리와 기약다항식에 대해 알아보겠다. 매우 요긴하게 사용될 정리이니 꼭 알고 넘어가자.

 

 

케일리 해밀턴 정리는 

간단하게 말하면 모든 정사각행렬은 자신의 특성방정식을 만족시킨다는 정리이다.

 

Thm 1. Cayley - Hamilton

$A_{n \times n}$을 $ \mathcal{F} $ 위에서의 정사각행렬이라 하고 $f(x)$를 $A$의 특성다항식이라 하자. 

($f(x)=det(xI-A)$)


그러면 $$f(A)=0$$이다.

 

이 정리는 벡터공간 $V$의 선형연산자 $T$에 대해서도 마찬가지로 성립한다.

즉, $T$의 특성다항식을 $f(x)$라 하면 $f(T)=T_0$이다. ($T_0$은 영변환)

 

 

 

여기서는 adjoint matrix의 개념을 사용하여 증명하고,

추후 T - invariant subspace 등을 학습한 후 다른 증명 또한 소개하겠다.

 

 

그런데 증명에 앞서

"아니 근데 $det(xI-A)$에 $x=A$를 대입하면 $det(AI-A)=det(A-A)=det(0)=0$이니까 증명끝 아닌가?"

라고 생각할 수 있다. 

 

특성다항식의 정의를 생각해보자. 특성다항식 $f(x)$는 $f(x):=det(xI-A)$이다. 

이때 $x$는 스칼라이다. ($x \in \mathcal{F}$) 

특성다항식의 정의 자체가 $x$에 스칼라만 대입할 수 있는 것이다. 

 

즉, $f(x)=det(xI_A)$에서 $x$에 스칼라가 아니라 행렬 $A$를 대입하는 순간,

$f(A)$와 $det(AI-A)$는 따로 놀게 되는 것이다.

즉, $f(A)=det(AI-A)$라 함부로 말할 수 없게 된다는 것이다.

 

$f(x)=det(xI-A)=x^n +a_{n-1}x^{n-1}+\; \cdots \; +a_1x+a_0$라 하면

$f(A)$는 $f(A)=A^n+a_{n-1}A^{n-1}+\; \cdots \; +a_1A+a_0I$인 것 뿐이다. 

특성다항식의 정의 자체가 스칼라에 대해서 정의하고있으므로, 함부로 $f(A)=det(AI-A)$라 할 수 없다는 것이다.

 

 

이해가 안가더라도 깊이 생각해보길 바란다.

 

 

 

adjoint matrix(수반행렬)을 사용하여 증명해보기 전에, 수반행렬의 특징을 먼저 언급하고 넘어가겠다.

수반행렬은 여인수행렬의 전치행렬이다. 정사각행렬 $M$과 그 수반행렬 $adj(M)$에 대하여 다음이 성립한다. $$M \, adj(M)=det(M) \, I$$

 

본격적으로 케일리 해밀턴 정리를 증명하겠다.

행렬 $xI-A$를 위에서 언급한 $M$에 대입해보자. 그러면 $$(xI-A) \, adj(xI-A)=det(xI-A) \, I=f(x) \, I$$가 성립한다.

즉, $$(xI-A) \, adj(xI-A)=a_0 \, I+a_1x \, I+a_2x^2 \, I+\; \cdots \; +a^{n-1}x^{n-1} \, I+x^n \, I $$이다.

 

앞으로 $adj(xI-A)$를 쓰기 귀찮으니 $adj(xI-A)=B(x)$라 하자.

위 식은 $x$에 대한 항등식이므로 우변의 $x$의 차수를 고려하면 

$B(x)=B_0+x \, B_1+ \; \cdots \; + x^{n-1} \, B_{n-1}$ 

꼴 이어야한다. (여기서 $B_i$들은 모두 $n \times n$ 행렬)

 

좌변을 풀어서 쓰면 $$ \begin{align} (xI-A) \, adj(xI-A) &= (xI-A) \, B(x) \\ &= (xI-A) \, (B_0+x \, B_1+ \; \cdots \; + x^{n-1} \, B_{n-1} ) \\ &= x \, (B_0+x \, B_1 + x^2 \, B_2 + \; \cdots \; + x^{n-1} \, B_{n-1}) \, - B_0A - x \, B_1A - x^2 \, B_2A - \; \cdots \; - x^{n-1} \, B_{n-1}A \\ &= -B_0A + x \, (B_0-B_1A)+x^2 \, (B_1-B_2A) + \; \cdots \; +x^{n-1} \, (B_{n-2}-B_{n-1}A)+x^n \, B_{n-1} \end{align} $$

 

따라서 계수비교법을 통해 

$-B_0A=a_0 \, I$,

$B_0-B_1A=a_1 \, I$,

$B_1-B_2A=a_2 \, I$,

$ \cdots $ ,

$B_{n-2}-B_{n-1}A=a_{n-1} \,I$,

$B_{n-1}A=I$

임을 알 수 있다.

 

그러므로 $$ \begin{align} f(A) &= a_0 \, I + a_1 \, A + \; \cdots \; +a_{n-1} \, A^{n-1}+A^n  \\  &=  -B_0A+B_0A-B_1A^2+ \; \cdots \; +B_{n-2}A^{n-1}-B_{n-1}A^n+B_{n-1}A^n \\ &= 0 \end{align} $$이다.

 

 

 

케일리 해밀턴 정리에 의하여 어떤 행렬 $A$의 특성다항식 $f(x)$는 $f(A)=0$ 이므로 

$A$의 최소다항식 $m(x)$가 $f(x)$를 나눈다는 사실을 알 수 있다.

 

이를 조금 더 구체화하기 위해 먼저 기약다항식(irreducible polynomial)에 대해 알야아하는데, 

말 그대로 더 나눌 수 없는 다항식이다. 

$ f(x) \in \mathcal{F} [x] $가 기약다항식이라는 말은 $f(x)=g(x)h(x)$ 꼴로 나타낼 수 있고, 차수가 $f(x)$보다 작은 $g(x), h(x) \in \mathcal{F} [x]$가 존재하지 않는다는 뜻이다. $f(x)$가 상수인 경우는 논하지 않는다.

 

즉, 어떤 다항식이 기약인지 아닌지는 $ \mathcal{F} $가 무엇인지에 따라 달라진다. 

 

예를 들어 $ f(x)=x^2-3 $은 $ \mathcal{F} =  \mathbb{R}$일 때는 $f(x)=(x- \sqrt{3})(x+ \sqrt{3})$으로 인수분해 된다.

$x- \sqrt{3} $, $ x+\sqrt{3} \in \mathbb{R} [x] $이므로 $f(x)$는 $ \mathbb{R} $ 위에서는 기약다항식이 아니다.

 

하지만 $ \mathbb{Q} $ 위에서는 기약다항식이다. 유리수계수 다항식으로 인수분해되지 않기 때문이다.

 

 

 

 

대수학의 기본정리(Fundamental Theorem of Algebra, FTA)와

$f(x) \in \mathbb{R} [x]$,  $f(z)=0$ ($z \in \mathbb{C}$)이면 $f( \bar{z} )=0$ 임을 이용하면 

 

$ f(x) \in  \mathbb{R} [x] $가 기약다항식이면 그 차수는 1 또는 2이다. 

 

라는 사실을 알 수 있다. 증명은 생략하겠다.

 

 

 

 

 

이번 포스팅에서는 케일리 해밀턴 정리와 그 증명, 기약다항식의 개념 등에 대해 알아보았다.

다음 포스팅에서는 케일리 해밀턴 정리와 기약다항식의 개념을 사용하여 중요한 정리를 소개하고 

관련 예제를 풀어보겠다.