Symmetrische matrices

Symmetrische matrices We beginnen met een eenvoudige definitie : Definitie Een matrix A heet symmetrisch als A T = A NB Een symmetrische matrix is dus altijd vierkant Symmetrische matrices hebben fraaie eigenschappen De belangrijkste eigenschap van een symmetrische matrix is dat die altijd diagonaliseerbaar is We zullen dit in stappen laten zien We beginnen met : Stelling Als A een symmetrische matrix, dan zijn eigenvectoren van A behorende bij verschillende eigenwaarden orthogonaal Bewijs Stel dat Av = λ v en Av = λ v met λ λ Dan geldt : λ (v v = (λ v v = (λ v T v = (Av T v = v T A T v = v T Av = v T (λ v = v (λ v = λ (v v Dus : (λ λ (v v = Maar λ λ, dus : v v = en dat betekent dat v v Oftewel : v en v zijn orthogonaal We definiëren nu : Definitie Een matrix A heet orthogonaal diagonaliseerbaar als er een orthogonale matrix P en een diagonaalmatrix D bestaan zodat A = P DP = P DP T Een orthogonale matrix is een vierkante matrix met orthonormale kolommen (zie : Lay, 6 Voor een orthogonale matrix P geldt dus dat P T P = I en dat P vierkant is Dus : P is inverteerbaar en P = P T Nu geldt de volgende prachtige stelling : Stelling Een vierkante matrix A is orthogonaal diagonaliseerbaar dan en slechts dan als A symmetrisch is Deze stelling zegt dus dat elke symmetrische matrix niet alleen diagonaliseerbaar is, maar zelfs orthogonaal diagonaliseerbaar Bovendien is elke orthogonaal diagonaliseerbare matrix een symmetrische matrix Dat laatste is erg eenvoudig in te zien : Bewijs Als A orthogonaal diagonaliseerbaar is, dan geldt : A = P DP T voor zekere orthogonale matrix P en diagonaalmatrix D Maar dan geldt dus : A T = (P DP T T = (P T T D T P T = P D T P T = P DP T = A Dus : A T = A Oftewel : A is symmetrisch Het bewijs van het omgekeerde is lastiger In de vraagstukken 3 en 4 van van Lay hebben we al gezien dat een symmetrische matrix alleen reële eigenwaarden heeft In stelling

hebben we gezien dat eigenvectoren van een symmetrische matrix behorende bij verschillende eigenwaarden orthogonaal zijn Die eigenvectoren kunnen dus ook orthonormaal gekozen worden Als een eigenwaarde van een symmetrische matrix een meetkundige multipliciteit groter dan heeft, dan kunnen we met behulp van het proces van Gram-Schmidt eenvoudig een orthonormale basis van de bijbehorende eigenruimte construeren Het is echter niet zo eenvoudig om aan te tonen dat voor elke eigenwaarde de algebraïsche multipliciteit gelijk is aan de meetkundige multipliciteit Dat deel van het bewijs laten we achterwege Voorbeeld Stel A = ( 7 4, dan is A een symmetrische matrix Nu volgt : 7 λ 4 λ = λ λ + 4 = (λ 8(λ 3 De eigenwaarden van A zijn dus : λ = 8 en λ = 3 Verder volgt : ( ( ( λ = 8 : = E 4 8 = Span{ en λ = 3 : ( 4 ( ( = E 3 = Span{ Het is duidelijk dat E 8 E 3 Nu geldt dus (bijvoorbeeld : A = P DP T met P = ( en D = ( 8 3 4 Voorbeeld Stel dat A = 4, dan is A een symmetrische matrix Nu volgt : λ 4 4 λ λ = λ λ 4 λ λ = ( λ 4 λ = ( λ 4 9 λ λ 4 λ = ( λ 9 λ 4 λ = ( λ(λ λ + = ( λ(λ (λ De eigenwaarden van A zijn dus : λ = met algebraïsche multipliciteit en λ = met algebraïsche multipliciteit Verder volgt : 4 λ = : 4 = E = Span{ } 8 } }

en λ = : 4 4 4 4 = E = Span{, Ook nu is eenvoudig in te zien dat E E Met behulp van het orthogonaliseringsproces van Gram-Schmidt (eventueel kunnen we een orthogonale basis van E construeren : E = Span{, } met 4 4 Ten slotte vinden we dat : = 3, = en 4 = 8 = 3 Nu geldt dus (bijvoorbeeld : A = P DP T met D = diag(,, en /3 / /3 P = /3 / /3 /3 4/3 = 3 3 3 4 } Spectraaldecompositie van een symmetrische matrix Een symmetrische (n n-matrix is orthogonaal diagonaliseerbaar Dit betekent dat er een orthonormale basis {u,, u n } van R n bestaat geheel bestaande uit eigenvectoren van A, zeg : Au i = λ i u i voor i =,,, n Dan geldt dus : A = P DP T met P = u u n en D = diag(λ,, λ n Dit kan ook geschreven worden in de vorm A = λ u u T + + λ n u n u T n Dit heet een spectraaldecompositie van de matrix A Merk op dat elke term in deze som een (n n-matrix is met rang, want elke kolom van λ i u i u T i is een veelvoud van u i Elke matrix u i u T i is een projectiematrix, want u i u T i x = (ut i xu i = (x u i u i is de (orthogonale projectie van x langs de vector u i Voorbeeld 3 In voorbeeld vonden we voor A = vonden we (bijvoorbeeld u = ( Nu geldt dus : A = λ u u T + λ u u T A = 8 ( ( ( 3 + oftewel ( 7 4 en u = ( ( = 8 ( 4 : λ = 8 en λ = 3 Verder + 3 ( 4 3

Het bewijs van de spectraaldecompositie volgt eenvoudig door uitschrijven : λ u T A = P DP T = u u n = λ u λ n u n u T λ n u T n = λ u u T + + λ n u n u T n u T n Kwadratische vormen Een aardige toepassing van symmetrische matrices treedt op bij kwadratische vormen : Definitie 3 Een kwadratische vorm op R n is een functie Q : R n R die voor elke x R n geschreven kan worden in de vorm Q(x = x T Ax met A een symmetrische (n n-matrix Deze symmetrische matrix A heet de matrix van de kwadratische vorm Q Enkele voorbeelden : ( 7 A = : Q 4 (x = x T Ax = ( ( ( 7 x x x = 7x 4 x + 4x x + 4x ( Q (x = x + x x + 3x = xt Ax met A = Dus : A is de matrix van de 3 kwadratische ( vorm Q Merk op, dat ook geldt : Q (x = x T Bx met (bijvoorbeeld B = Maar B is geen symmetrische matrix 3 3 Q 3 (x = x + x + 3x 3 + 4x x 8x x 3 6x x 3 = x T Ax met A = 4 3 4 3 3 De coëfficiënten van de kwadraten komen op de hoofddiagonaal en de coëfficiënten van de zogenaamde kruisproducten worden netjes over twee plaatsen verdeeld zodat er een symmetrische matrix ontstaat Deze matrix is dus uniek en heet daarom de matrix van de kwadratische vorm Q 4 Q 4 (x = (x x +4(x +x 3 +(x 3x 3 Dan geldt : Q 4 (x = x 4x x +4x + 4x + 8x x 3 + 4x 3 + x x x 3 + 8x 3 = x + 6x + x 3 4x x + 8x x 3 x x 3 = 4 x T Ax met A = 6 6 Aan de eerste vorm zien we dat Q(x, omdat 4 6 het een som van kwadraten is met positieve coëfficiënten Verder zien we vrij gemakkelijk dat Q 4 (x = x = o Dus : Q 4 (x > voor alle x o We noemen zo n kwadratische vorm dan positief definiet of definiet positief Merk op, dat dit bij de laatste vorm niet zo evident is 4

We definiëren nu eerst : Definitie 4 Een kwadratische vorm Q heet positief definiet of definiet positief als Q(x > voor alle x o, negatief definiet of definiet negatief als Q(x < voor alle x o, 3 indefiniet als Q(x zowel positieve als negatieve waarden aanneemt Als slechts geldt dat Q(x voor alle x en Q(x = voor zekere x o, dan noemt men Q positief semidefiniet Als slechts geldt dat Q(x voor alle x en Q(x = voor zekere x o, dan noemt men Q negatief semidefiniet Enkele voorbeelden : Q (x = (x x (x + x 3 (x 4x 3 is negatief definiet Q (x = (x x (x + x 3 is negatief semidefiniet Immers, er geldt (bijvoorbeeld dat Q (x = voor x = o 3 Q 3 (x = (x +x (x x 3 is indefiniet Immers : Q 3 (x = > voor x = en Q 3 (x = < voor x = 4 Q 4 (x = x + 6x + x 3 + 4x x x x 3 is positief definiet, want : Q(x = (x + x + x + x 3 x x 3 = (x + x + (x 3x 3 + 4x 3 Stel nu Q(x = x T Ax met A een symmetrische matrix Dan is A orthogonaal diagonaliseerbaar, dat wil zeggen : A = P DP T voor zekere orthogonale matrix P en diagonaalmatrix D Stel nu x = P y, dan volgt : Q(x = x T Ax = (P y T AP y = y T P T AP y = y T Dy Omdat D een diagonaalmatrix is, D = diag(λ,, λ n, bevat de laatste uitdrukking géén kruisproducten : y T Dy = λ y + + λ n y n Hieraan is eenvoudig te zien of de kwadratische vorm Q positief definiet, negatief definiet of indefiniet is Er geldt :

Stelling 3 Als A een symmetrische matrix is en Q(x = x T Ax Dan geldt : Q is positief definiet dan en slechts dan als alle eigenwaarden van A positief zijn, Q is negatief definiet dan en slechts dan als alle eigenwaarden van A negatief zijn, 3 Q is indefiniet dan en slechts dan als A zowel positieve als negatieve eigenwaarden heeft Als er een eigenwaarde optreedt dan geldt : als alle andere eigenwaarden van A positief zijn, dan is Q positief semidefiniet en als alle andere eigenwaarden van A negatief zijn, dan is Q negatief semidefiniet Door de transformatie x = P y kunnen we de kwadratische vorm Q(x = x T Ax schrijven in de gedaante y T Dy zonder kruisproducten Dit noemt men het op hoofdassen brengen van de kwadratische vorm De kolommen van de matrix P worden wel de hoofdassen van de kwadratische vorm genoemd Deze terminologie wordt verklaard door de volgende voorbeelden : Beschouw de vergelijking x ( 4x x + x = 48 Dit kan geschreven worden in de vorm x T Ax = 48 met A = Dan volgt : Verder volgt : en λ λ = 7 : λ = 3 : ( ( λ = λ λ + = (λ 7(λ 3 ( ( = u = ( = u = ( De vergelijking is dus equivalent met 7y + 3y = 48 waarbij x = P y met P = u u = ( Dit leidt tot de ellips in figuur 3 op pagina 44 van Lay Beschouw de vergelijking ( x 8x x x = 6 Dit kan geschreven worden in de vorm 4 x T Ax = 6 met A = Dan volgt : 4 λ 4 4 λ = λ + 4λ = (λ + 7(λ 3 6

Verder volgt : en λ = 3 : λ = 7 : ( 4 4 8 ( 8 4 4 ( ( = u = ( = u = ( De vergelijking is dus equivalent met 3y 7y = 6 waarbij x = P y met P = u u = ( Dit leidt tot de hyperbool in figuur 3 op pagina 44 van Lay Voorbeeld 4 De kwadratische ( vorm Q(x = 7x + 4x x + 4x is positief definiet, want 7 Q(x = x T Ax met A = en in voorbeeld hebben we gezien dat A de eigenwaarden 4 λ = 8 en λ = 3 heeft Voorbeeld De kwadratische vorm Q(x = x + x + x 3 8x x 4x x 3 + 4x x 3 is 4 positief definiet, want Q(x = x T Ax met A = 4 en in voorbeeld hebben we gezien dat A de eigenwaarden λ = (eenmaal en λ = (tweemaal heeft Voorbeeld 6 De kwadratische vorm Q(x = x T Bx met B = Immers, Q(x = x T Ax met A = 3 3 3 6 3 is indefiniet en A is symmetrisch Dus : A is de matrix van de kwadratische vorm Q (en dus niet B De eigenwaarden van A zijn λ =, λ = en λ 3 =, want : λ 3 3 λ 3 λ = λ + λ 3 λ 3 λ = ( + λ 3 λ = ( + λ 3 λ 3 4 λ 4 λ = ( + λ(λ 7λ + = (λ + (λ (λ De eigenwaarden van B zeggen dus blijkbaar niets over de kwadratische vorm Q 7