Théorème de Cayley-Hamilton

Ne pas confondre avec le théorème de Cayley en théorie des groupes ni avec le théorème d'Hamilton en géométrie.

En algèbre linéaire, le théorème de Cayley-Hamilton affirme que tout endomorphisme d'un espace vectoriel de dimension finie sur un corps commutatif quelconque annule son propre polynôme caractéristique.

En termes de matrice, cela signifie que :

si A est une matrice carrée d'ordre n et si

$p(X)= \det(XI-A) = X^n + p_{n-1}X^{n-1} + \ldots + p_1 X + p_0$

est son polynôme caractéristique (polynôme d'indéterminée X), alors en remplaçant formellement X par la matrice A dans le polynôme, le résultat est la matrice nulle :

$p(A)= A^n + p_{n-1}A^{n-1} + \ldots + p_1 A + p_0 I_n = 0_n.\;$

Le théorème de Cayley-Hamilton s'applique aussi à des matrices carrées à coefficients dans un anneau commutatif quelconque.

Un corollaire important du théorème de Cayley-Hamilton affirme que le polynôme minimal d'une matrice donnée est un diviseur de son polynôme caractéristique.

Bien qu'il porte les noms des mathématiciens Arthur Cayley et William Hamilton, la première démonstration du théorème est donnée par Ferdinand Georg Frobenius en 1878, Cayley l'ayant principalement utilisé dans ses travaux, et Hamilton l'ayant prouvé en dimension 2.

Motivation

Ce théorème possède deux familles d'utilisation :

Il permet d'établir des résultats théoriques, par exemple pour calculer le polynôme caractéristique d'un endomorphisme nilpotent.
Il autorise aussi des simplifications puissantes dans les calculs de matrices. L'approche par les polynômes minimaux est en général moins coûteuse que celle par les déterminants.

On trouve ce théorème utilisé dans les articles sur les polynômes d'endomorphisme, endomorphismes nilpotents, et plus généralement dans la théorie générale des matrices

Exemple

Considérons par exemple la matrice

$A = \begin{pmatrix}1&2\\ 3&4\end{pmatrix}$ .

Le polynôme caractéristique s'écrit

$p(X)=\det\begin{pmatrix}X-1&-2\\ -3&X-4\end{pmatrix}=(X-1)(X-4)-(-2)(-3)=X^2-5X-2.$

Le théorème de Cayley-Hamilton affirme que

A 2 - 5 A - 2 I 2 = 0

et cette relation peut être rapidement vérifiée dans ce cas. De plus le théorème de Cayley-Hamilton permet de calculer les puissances d'une matrice plus simplement que par un calcul direct. Reprenons la relation précédente

A 2 - 5 A - 2 I 2 = 0

A 2 = 5 A + 2 I 2

Ainsi, par exemple, pour calculer A⁴, nous pouvons écrire

A 3 = (5 A + 2 I 2) A = 5 A 2 + 2 A = 5(5 A + 2 I 2) + 2 A = 27 A + 10 I 2

et il vient

A 4 = A 3 A = (27 A + 10 I 2) A = 27 A 2 + 10 A = 27(5 A + 2 I 2) + 10 A

A 4 = 145 A + 54 I 2

On peut également utiliser la relation polynomiale initiale $A 2 - 5 A - 2 I 2 = 0$ pour prouver l'inversibilité de A et calculer son inverse. Il suffit en effet de mettre en facteur une puissance de A là où c'est possible et

A (A - 5 I) = 2 I 2

ce qui montre que A admet pour inverse

$A^{-1} = \frac12 (A-5I)$

Démonstration

Une preuve

Quelle que soit la matrice $S \in \mathcal{M}_n(\mathbb{K})$ , il existe une matrice explicitement déterminée, $Comp(S)$ , la matrice complémentaire de S, qui vérifie $S Comp(S) = Comp(S) S = det S I n$ . La matrice $Comp(S)$ est la transposée de la comatrice ou matrice des cofacteurs de $S$ . Cette relation reste encore vraie si les coefficients de $S$ appartiennent à un anneau, puisqu'on n'a pas fait de divisions. On peut donc poser $S = X I n - A$ , dont les coefficients sont dans $\mathbb{K}[X]$ et on a alors la relation:

$(XI_n-A)\textrm{Comp}(XI_n-A)=\det(XI_n-A)I_n=p(X)I_n. \ \ (1)$

Partons de (1), en écrivant

$\textrm{Comp}(XI_n-A)=\sum_{j=0}^{n-1}B_j X^j$

avec $B_j\in\mathcal{M}_n(\mathbb{K})$ , et

$p(X)=\sum_{j=0}^n p_jX^j.$

On peut développer le produit $(X I n - A)Comp(X I n - A)$ :

$(XI_n-A)\textrm{Comp}(XI_n-A)=X^{n}B_{n-1} +\sum_{i=1}^{n-1}X^i(B_{i-1}-AB_{i}) -AB_0\ \ (2),$

qui est identique à

$\sum_{j=0}^n X^jp_jI_n.\ \ (3)$

Les polynomes (2) et (3) sont égaux. Par conséquent,

$p_{n}I_n=B_{n-1},\quad p_iI_n=B_{i-1}-AB_{i},\quad p_0I_n=-AB_0$ .

Il vient alors un télescopage :

$\begin{align}p(A)&=\sum_{j=0}^n A^j(p_jI_n)\\&=A^nB_{n-1}+\sum_{i=1}^{n-1}A^i(B_{i-1}-AB_{i}) -AB_0\\&=\sum_{i=1}^nA^iB_{i-1}-\sum_{i=0}^{n-1}A^{i+1}B_i\\&=0\end{align}$ ,

La preuve ne consiste pas en une substitution de X par A dans des égalités de polynômes, mais en une identification de leurs coefficients.

Une variante

On peut également aligner des idées abstraites.

Commençons par introduire un morphisme d'évaluation approprié à la résolution du problème. Tout d'abord, $\mathbb{K}[A]$ étant une algèbre commutative sur $\mathbb{K}$ , on a un morphisme d'évaluation : $\mathbb{K}[X] \to \mathbb{K}[A]$ (qui envoie $X$ sur $A$ et $λ$ sur $λ I n$ pour tout scalaire $λ$ ). Ce morphisme d'anneaux commutatifs induit un morphisme d'évaluation sur les anneaux de matrices $\mathcal{M}_n(\mathbb{K}[X]) \to \mathcal{M}_n(\mathbb{K}[A])$ .

Une notation auxiliaire nous sera utile : pour deux matrices carrées $(n, n)$ notées $C = (c i j)$ et $D = (d i j)$ , on notera $C \triangleright D$ la matrice à coefficients matriciels de terme général $c i j D$ . Si le lecteur connaît le produit de Kronecker de deux matrices, il pourra remarquer que $C\triangleright D$ c'est presque la même chose que $C\otimes D$ à ceci près que $C\triangleright D$ est une matrice $(n, n)$ dont les coefficients sont des matrices $(n, n)$ tandis que $C\otimes D$ est une matrice $(n 2, n 2)$ . Les formules ci-dessous ne contiennent de fait que deux cas particuliers de cette opération : des produits de la forme $I_n \triangleright C$ c'est-à-dire des matrices carrées avec des $C$ sur la diagonale et des $0$ ailleurs et un produit $A\triangleright I_n$ c'est-à-dire une variante de $A$ où la matrice $a i j I n$ vient remplacer le coefficient $a i j$ .

Cette notation posée, appliquons le morphisme d'évaluation à la relation :

$(XI_n-A)\,\textrm{Comp}(XI_n-A)=p(X)I_n.$

On obtient une relation

$(I_n\triangleright A-A\triangleright I_n)\,M=I_n\triangleright p(A)\qquad(*)$

dans laquelle $M$ est une certaine matrice à coefficients dans $\mathbb{K}[A]$ dont on n'aura besoin de rien savoir.

Ainsi on a écrit une formule juste, et on en pâtit : on n'a du coup pas fini, l'évaluation de $X I n - A$ par une technique rigoureuse ne fournit pas $0$ mais une bizarre matrice à coefficients matriciels.

Il faut une deuxième idée pour conclure. Elle consiste à remarquer que si $\mathbb{A}$ est un anneau et $E$ un $\mathbb A$ -module à droite, pour tous entiers $r$ , $s$ , $t$ on peut définir par les formules habituelles un produit matriciel :

$\mathcal{M}_{rs}(E)\times\mathcal{M}_{st}(\mathbb{A})\to\mathcal{M}_{rt}(E)$

pour laquelle on a associativité si on veut calculer des produits à trois termes :

$\mathcal{M}_{rs}(E)\times\mathcal{M}_{st}(\mathbb{A})\times\mathcal{M}_{tu}(\mathbb{A})\to\mathcal{M}_{ru}(E).$

Appliquons cette notion à $E=\mathbb{K}^n$ (pour les puristes à $E=\mathcal{M}_{n1}(\mathbb{K})$ ) qui est un module (dont la multiplication s'écrit spontanément à gauche mais peut l'être à droite si on préfère, l'anneau étant commutatif) sur l'anneau commutatif $\mathbb{A}=\mathbb{K}(A)$ , la multiplication externe étant l'application : $\mathcal{M}_{n1}(\mathbb{K})\times\mathbb{K}(A)$ définie par $(E,B)\mapsto BE$ (ce $BE\,$ étant le produit matriciel ordinaire de la matrice carrée $B\,$ par la matrice colonne $E\,$ ).

Multiplions à gauche la relation $( * )$ par le vecteur ligne $\begin{pmatrix}e_1&\cdots&e_n\end{pmatrix}$ où $(e_1,\ldots,e_n)$ désigne la base canonique de $\mathbb{K}^n$ : en utilisant l'expression de droite dans $( * )$ on obtient le vecteur ligne $\begin{pmatrix}p(A)e_1&\ldots&p(A)e_n\end{pmatrix}$ .

Si maintenant on utilise l'expression de gauche dans $( * )$ et qu'on déplace les parenthèses par associativité de la multiplication matricielle un peu inhabituelle décrite ci avant, on est amené à calculer le produit :

$\begin{pmatrix}e_1&\ldots&e_n\end{pmatrix}(I_n\triangleright A-A\triangleright I_n).$

Pour chaque indice $j$ , on ne peut que constater que sa $j$ -ème composante vaut :

$Ae_j-\sum_{i=1}^n(a_{ij}I_n)e_i=Ae_j-\sum_{i=1}^na_{ij}e_i=0$ .

En multipliant ceci à droite par l'inoffensive matrice $M$ et en comparant les deux expressions du produit, on conclut que pour tout indice $j$ , $p (A) e j = 0$ .

Et donc $p (A) = 0$ ^[1].

Remarques additionnelles sur la démonstration

La preuve qui a été donnée évite la substitution de $X$ par une matrice dans un contexte non commutatif, mais les manipulations effectuées sont quand même proches de cette idée : on a bien décomposé l'équation en composantes suivant les puissances de $X$ , on a multiplié à gauche par $A j$ la composante qui était en facteur de $X j$ , et on a additionné tout ensemble. En fait, on a utilisé l'opération $Ev A$ définie en (5), sans supposer qu'il s'agisse d'un homomorphisme d'anneaux, de $\mathcal{M}_n(\mathbb{K})[X]$ dans ${M}_n(\mathbb{K})$ . L'opération $Ev A$ est une évaluation à gauche, parce que la multiplication par l'indéterminée scalaire $X$ est remplacée par la multiplication à gauche par $A$ .

Une autre observation est importante : la forme exacte du polynôme $Comp(X I n - A)$ n'a aucune importance. Il y a donc quelque chose à exploiter ici, ce que n'ont pas manqué de faire les mathématiciens.

Soit $M$ un anneau non commutatif ; on peut définir une division euclidienne d'un polynôme $P\in M[X]$ par un polynôme $B$ monique. C'est un polynôme dont le coefficient du terme de plus haut degré est une unité de $M$ , c'est-à-dire un élément de $M$ qui possède un inverse dans $M$ . Plus précisément, il existe deux polynômes $Q, R\in M[X]$ , avec $R$ de degré strictement inférieur au degré de $B$ , tels que

P = B Q + R .

La démonstration est entièrement analogue à celle du cas scalaire. Si $B = X I n - A$ , alors le reste $R$ est de degré $0$ , et donc identique à une constante appartenant à $M$ . Mais dans ce cas, en raisonnant exactement comme dans la démonstration du théorème de Cayley-Hamilton, on arrive à la conclusion

Ev A (P) = R

Il s'ensuit que $Ev A (P)$ est nul si et seulement si $P$ est divisible à gauche par $X I n - A$ .

La démonstration du théorème de Cayley-Hamilton donne aussi une autre information : le polynôme $Comp(X I n - A)$ est le quotient à gauche de $p (X) I n$ par $t I n - A$ . Comme $p (X) I n$ et $X I n - A$ appartiennent tous deux au sous-anneau commutatif $K[A][X]$ , la division à gauche se passe entièrement dans ce sous-anneau, c'est donc une division ordinaire. En particulier, les coefficients matriciels de $Comp(X I n - A)$ sont des combinaisons linéaires de puissances de $A$ . En d'autres termes, la matrice complémentaire d'une matrice $A$ est un polynôme en $A$ , ce qu'il n'est pas facile de déduire directement de la définition d'une matrice complémentaire. Mieux, on peut calculer explicitement ses coefficients à partir de ceux du polynôme caractéristique $p (X)$ , puisqu'il s'agit de faire une division euclidienne ordinaire, et on trouve

$\textrm{Comp(-A)}=\sum_{j=1}^n p_jA^{j-1}.$

On aurait pu également obtenir cette relation directement à partir du théorème de Cayley-Hamilton, en vertu de l'identité

$p_0I_n=\det(-A)I_n=-A\cdot \textrm{Comp}(-A)=\textrm{Comp}(-A)\cdot-A$ .

Abstraction et généralisations

La preuve donnée ci-dessus n'utilise que les propriétés d'anneau commutatif du corps K, puisqu'elle ne comporte pas de division par des éléments de cet anneau mais s'appuie juste sur la formule de Laplace, valide pour une matrice à coefficients dans n'importe quel anneau commutatif B. On peut donc généraliser le théorème de Cayley-Hamilton à ce cas, en utilisant la formule de Laplace pour des matrices à coefficients dans l'anneau B = R [X], R étant un anneau commutatif quelconque :

Pour toute matrice carrée A de taille nxn à coefficients dans un anneau commutatif R, si l'on note

$p_A(X)=\det(XI_n-A)\,$ ,

on a :

$p_A(A)=0\,$ .

Soit alors M un module de type fini sur cet anneau R (l'analogue de la notion d'espace vectoriel de dimension finie sur un corps, mais sans l'existence de bases : M a seulement des familles génératrices finies), et soit φ un endomorphisme de M, le théorème de Cayley-Hamilton permet de construire comme suit des polynômes en φ qui s'annulent sur M : soit (e₁, e₂, ... , e_n) une famille génératrice de M. On peut trouver des éléments $a i j$ de R tels que

$\varphi(e_j)=\sum_{i=1}^n a_{ij}e_i,$

et on note A la matrice nxn formée de ces coefficients. Cette matrice n'est pas unique, même pour une famille génératrice fixée, puisqu'on n'a pas supposé libre cette famille. Néanmoins, de la formule $p A (A) = 0$ on déduit que $p A (φ) = 0$ .

Parmi les multiples démonstrations^[2] du théorème de Cayley-Hamilton dans le contexte des anneaux commutatifs, soulignons l'élégance de la démonstration générique, dont le principe est abstrait mais courant en algèbre : elle repose sur la remarque que l'équation $p A (A) = 0$ est une équation polynômiale universelle en les coefficients de la matrice A (carrée de taille n fixée). C'est-à-dire que $p A (A) = U (a i, j)$ pour toute matrice A de coefficients $a i, j$ dans n'importe quel anneau commutatif, où $U (Y i, j)$ désigne une certaine matrice carrée de taille n à coefficients dans l'anneau de polynômes à n² indéterminées $R=\Z[(Y_{i,j})_{1\le i\le n, 1\le j\le n}]$ (cette matrice universelle U est indépendante de A et résulte juste des formules de développement du déterminant et des puissances de matrices). Pour démontrer le théorème pour n'importe quelle matrice A dans n'importe quel anneau commutatif, il suffit donc de vérifier que cette matrice $U (Y i, j)$ est nulle, c'est-à-dire de démontrer le théorème pour une seule matrice : la matrice Y dont les coefficients sont les $Y i, j$ , éléments de l'anneau R.

Démonstration générique

Soit $V(X)=\det(XI_n-Y)\in R[X]$ (ainsi, $U(Y_{i,j})=V(Y)\in{\mathcal M}_n(R)$ ), et soit K un corps algébriquement clos contenant R (par exemple le plus petit : la clôture algébrique de son corps des fractions).
Le polynôme V(X) est à racines simples dans K car son discriminant est non nul. En effet, puisque le résultant de deux polynômes de degrés donnés s'écrit comme un polynôme universel en leurs coefficients, le discriminant de V(X) s'écrit lui aussi comme un polynôme universel $W(Y_{i,j})\in R$ tel que pour toute matrice A, le discriminant de $det(X I n - A)$ soit égal à $W (a i, j)$ . Or il existe des matrices A pour lesquelles $W(a_{i,j})\neq 0$ : par exemple la matrice diagonale à coefficients entiers, de diagonale 1, 2, ... , n.
La matrice Y est donc diagonalisable sur K : $Y = P D P - 1$ avec P inversible et D diagonale, donc pour D le théorème de Cayley-Hamilton est immédiat, ce qui permet de conclure :

$V(X)=\det(XI_n-D)\Rightarrow V(D)=0\Rightarrow U(Y_{i,j})=V(Y)=PV(D)P^{-1}=P0P^{-1}=0.$

Références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Cayley-Hamilton Theorem » (voir la liste des auteurs)

↑ Cette preuve est celle qui figure dans Introduction to commutative algebra, M. F. Atiyah et I. G. Macdonald, Addison-Wesley, (ISBN 0-201-00361-9), p. 21.
↑ [PDF] Présentation de 30 démonstrations, par Michel Coste, Université de Rennes 1

Voir aussi

v · d · m Algèbre linéaire générale
Vecteur • Scalaire • Combinaison linéaire • Espace vectoriel • Matrice
Famille de vecteurs	Famille génératrice • Famille libre (indépendance linéaire) • Base • Théorème de la base incomplète • Rang • Colinéarité
Sous-espace	Sous-espace vectoriel • Somme d'ensembles • Somme directe • Sous-espace supplémentaire • Dimension • Codimension • Droite • Plan • Hyperplan
Morphisme et notions relatives	Application linéaire • Noyau • Conoyau • Lemme des noyaux • Pseudo-inverse • Théorème de factorisation • Théorème du rang • Équation linéaire • Système d'équations linéaires • Élimination de Gauss-Jordan • Forme linéaire • Espace dual • Orthogonalité • Base duale • Endomorphisme linéaire • Valeur propre, vecteur propre et espace propre • Spectre • Projecteur • Symétrie • Matrice diagonalisable • Diagonalisation • Endomorphisme nilpotent
En dimension finie	Espace vectoriel de dimension finie • Trace • Déterminant • Polynôme caractéristique • Polynôme d'endomorphisme • Théorème de Cayley-Hamilton • Polynôme minimal d'un endomorphisme • Invariants de similitude • Réduction d'endomorphisme • Réduction de Jordan • Décomposition de Dunford • Décomposition de Frobenius
Enrichissements de structure	Norme • Produit scalaire • Forme quadratique • Espace vectoriel topologique • Orientation • Algèbre sur un corps • Algèbre de Lie • Complexe différentiel
Développements	Théorie des matrices • Représentation de groupe • Analyse fonctionnelle • Algèbre multilinéaire • Module sur un anneau

Portail des mathématiques

Catégories :

Application linéaire
Polynôme
Théorème de mathématiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Théorème de Cayley-Hamilton de Wikipédia en français (auteurs)

Игры ⚽ Нужен реферат?

Regardez d'autres dictionnaires:

Theoreme de Cayley-Hamilton — Théorème de Cayley Hamilton Pour les articles homonymes, voir Hamilton. En algèbre linéaire, le théorème de Cayley Hamilton (qui porte les noms des mathématiciens Arthur Cayley et William Hamilton) affirme que tout endomorphisme d un espace… … Wikipédia en Français
Théorème de cayley-hamilton — Pour les articles homonymes, voir Hamilton. En algèbre linéaire, le théorème de Cayley Hamilton (qui porte les noms des mathématiciens Arthur Cayley et William Hamilton) affirme que tout endomorphisme d un espace vectoriel de dimension finie sur… … Wikipédia en Français
théorème de Cayley-Hamilton — ● théorème de Cayley Hamilton Théorème selon lequel tout endomorphisme d un K espace vectoriel de dimension n ou toute matrice A de Mn(K) annule son polynôme caractéristique P, soit P(f) = 0 ou P(A) = 0 … Encyclopédie Universelle
Cayley-Hamilton — Théorème de Cayley Hamilton Pour les articles homonymes, voir Hamilton. En algèbre linéaire, le théorème de Cayley Hamilton (qui porte les noms des mathématiciens Arthur Cayley et William Hamilton) affirme que tout endomorphisme d un espace… … Wikipédia en Français
Théorème de Hamilton-Cayley — Théorème de Cayley Hamilton Pour les articles homonymes, voir Hamilton. En algèbre linéaire, le théorème de Cayley Hamilton (qui porte les noms des mathématiciens Arthur Cayley et William Hamilton) affirme que tout endomorphisme d un espace… … Wikipédia en Français
Theoreme de la base incomplete — Théorème de la base incomplète Le théorème de la base incomplète énonce que toute famille libre de vecteurs d un espace vectoriel E peut être complétée pour obtenir une base de E. Sommaire 1 Enoncé 2 Démonstration 2.1 … Wikipédia en Français
Théorème de Baire-Brenef — Valeur propre, vecteur propre et espace propre Fig. 1. Cette application linéaire déforme la statue de David. Les vecteurs bleus ont pour images les vecteurs verts. Ils gardent la même direction, ce sont des vecteurs propres. La valeur propre… … Wikipédia en Français
Théorème d'Hamilton — Ne pas confondre avec le théorème de Cayley Hamilton en algèbre linéaire. Le théorème d Hamilton est un théorème de géométrie du triangle, dû à William Rowan Hamilton : Soit ABC un triangle et O son orthocentre. Les triangles ABC, ABO … Wikipédia en Français
Théorème du rang — En mathématiques, et plus précisément en algèbre linéaire, le théorème du rang lie le rang d une application linéaire et la dimension de son noyau. Il peut être vu comme un cas particulier de théorème d isomorphisme, ou être interprété par la… … Wikipédia en Français
Théorème de la base incomplète — En algèbre linéaire, le théorème de la base incomplète affirme que, dans un espace vectoriel E, toute famille libre de vecteurs peut être complétée en une famille libre et génératrice de E (c est à dire une base de E) ; de toute famille… … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Théorème de Cayley-Hamilton

Sommaire

Motivation

Exemple