Hoofdstuk 9 Bilineaire Vormen In dit hoofdstuk beschouwen we bilineaire vormen op een vectorruimte V nader. Dat doen we onder andere om in het volgende hoofdstuk de begrippen afstand en lengte in een vectorruimte te bekijken. In het algemeen is er geen begrip lengte gedefinieerd in een lichaam. Maar in C, en dus in deellichamen daarvan, zoals Q en R, is dat wel het geval. Het afstandsbegrip in een vectorruimte wordt bepaald door het inproduct; dat is een speciaal geval van een bilineaire vorm. Definitie 9. Een bilineaire vorm op V, voor een L-vectorruimte V, is een bilineaire vorm op de verzameling V V ; dus een afbeelding die aan een paar (v,v ) van vectoren uit V een element van het lichaam L toevoegt, op een manier die lineair is in het eerste en in het tweede argument. We noemen B symmetrisch als B(v,w) = B(w,v) voor elke v,w V. en anti-symmetrisch als B(v,w) = B(w,v) voor elke v,w V. Stelling 9. Zij V een eindig-dimensionale L-vectorruimte met basis E = {e,..., e n }. Er is een bijectie tussen de verzameling bilineaire vormen op V en de verzameling n n matrices over L, gegeven door aan B de matrix M ij = B(e i,e j ) toe te kennen. Bewijs. Als A M n n (L) een n n matrix is dan geeft de afbeelding B A, gedefinieerd door B A (v,w) = v T Aw L, een bilineaire vorm op L n. Omgekeerd, als B een bilineaire vorm is op een vectorruimte V met basis E = {e,...,e n }, dan geldt: B(a,b) = B( α i e i, β j e j ) = i= j= = α i B(e i, β j e j ) i= i= j= j= α i β j B(e i,e j ) = a T M ij b, als we a,b als kolomvectoren met coördinaten α i, resp. β i ten opzichte van de basis E schrijven, en M = M ij de matrix met op positie i,j het element B(e i,e j ) is. Het is duidelijk dat verschillende bilineaire B verschillende matrices geven, en dat bij elke matrix M een bilineaire vorm te vinden is. Definitie 9.3 Matrix M = M B = M E B = (B(e i,e j )) ij heet de Grammatrix van B. Veel eigenschappen van een bilineaire vorm B zijn van de matrix M B af te lezen. 9
6 HOOFDSTUK 9. BILINEAIRE VORMEN Stelling 9.4 B is symmetrisch M B is symmetrisch. Bewijs. M B is symmetrisch dan en slechts dan als (M B ) ij = (M B ) ji voor alle i,j. Per definitie is (M B ) ij = B(e i,e j ), dus symmetrie van M B volgt direct uit symmetrie van B. Maar B(a,b) = B( n i= α ie i, n j= β je j ) = i,j α iβ j B(e i,e j ) en dat is voor alle a,b gelijk aan B(b,a) = B( n j= β je j, n i= α ie i ) = i,j α iβ j B(e j,e i ) als M B symmetrisch is. In het bovenstaande hebben we niets geëist over de gekozen basis. Dus symmetrie is onafhankelijk van de keuze van basis! Gevolg 9. De volgende beweringen zijn equivalent: (i) B is symmetrisch; (ii) er is een basis E van V ten opzichte waarvan MB E symmetrisch is; (iii) ten opzichte van elke basis F van V is MB F symmetrisch. Zoals we ons in het vorige hoofdstuk afvroegen of we een matrix die een lineaire afbeelding ten opzichte van een gekozen basis representeerde altijd op diagonaalvorm konden brengen door basisverandering, zo kunnen we hier dezelfde vraag stellen voor de matrix die een bilineaire vorm representeert. Met B F zullen we de bilineaire vorm ten opzichte van de basis F aangeven. Ging een matrix M die een lineaire afbeelding representeerde onder basistransformatie over in een geconjugeerde matrix T MT, de matrix M B van een bilineare vorm gaat over in T T M B T. Stelling 9.6 Laten E en F bases voor V zijn, en zij T = F Mid E, de transformatiematrix die E in F overvoert. Dan geldt: M E B = T T M F B T. Bewijs. Laten v en v twee vectoren uit V, uitgedrukt als kolomvectoren ten opzichte van de basis E, zijn. Dan zijn Tv en Tv dezelfde vectoren uitgedrukt op de basis F, dus moet en het resultaat volgt. v T M E B v = (Tv ) T M F B Tv = v T T T M F B Tv, Voorbeeld 9.7 Zij V = R 3 en laat, voor vectoren ten opzichte van de standaardbasis E: B((α,α,α 3 ),(β,β,β 3 )) = α β α β α β + α β + 4α 3 β 3. Zij, bijvoorbeeld, F := {f,f,f 3 } = {e,e + e, e 3}. Laten we eens kijken hoe B er ten opzichte van F uitziet. B(a f + a f + a 3 f 3,b f + b f + b 3 f 3 ) = B(a e + a (e + e ) + a 3 e 3,b e + b (e + e ) + b 3 e 3) = B((a + a )e + a e + a 3e 3,(b + b )e + b e + b 3e 3 ) = (a + a )(b + b ) (a + a )b a (b + b ) + a b + 4( a 3 b 3) = a b + a b + a 3 b 3.
6 Ten opzichte van deze basis is de bilineaire afbeelding gewoon het inproduct! In dit voorbeeld is MB E =, 4 en MB F =, terwijl E Mid F : inderdaad, =. 4 Definitie 9.8 We noemen twee vierkante matrices M,N M n n (L) equivalent als er een inverteerbare T bestaat zodat M = T T NT. We schrijven M N. Twee bilineaire vormen B en C noemen we equivalent (en we schrijven wel B C) als (voor zekere basiskeuze) geldt: M C M B. Het is duidelijk dat het dan voor elke basiskeuze geldt, en dat B en C equivalent zijn als er bases E, F bestaan zodat B E = C F. Een voor de hand liggende vraag is nu of symmetrische matrix equivalent is met een diagonaalmatrix. In dit geval is het antwoord bijna altijd bevestigend. Eerst maar eens een uitzondering. Voorbeeld 9.9 Zij M = ( ) M (F ). Dan is M niet equivalent met een diagonaalmatrix. Kijk maar: laat T een willekeurige inverteerbare matrix zijn dan ( )( )( ) ( ) T T a c a b ca ad + bc MT = = b d c d ad + bc bd en ad + bc = ad bc = det(t) in F. Dat dit niet werkt in dit geval heeft te maken met het feit dat in F de gelijkheid = geldt. In een lichaam met gaat het wel goed. Stelling 9. Zij M een symmetrische matrix over een lichaam L van karakteristiek. Dan is M equivalent met een diagonaalmatrix D. Bewijs. We geven een bewijs in de vorm van een algoritme, dat je precies vertelt hoe je D kunt construeren. We veronderstellen dat M M n n (L). Stap : Als M een diagonaalmatrix is (bijvoorbeeld de nulmatrix, of een matrix), dan ben je klaar. Stap : Veronderstel dat n. Allereerst moet je een v vinden met v T Mv :
6 HOOFDSTUK 9. BILINEAIRE VORMEN Als er een diagonaalelement M ii is, kies dan v = e i (want e T i Me i = M ii ). Zijn alle elementen op de diagonaal zoek dan i,j zodat M ij. Neem v = e i + e j, want (e i + e j ) T M(e i + e j ) = e T i Me i + e T i Me j + e T j Me i + e T j Me j = M ii + M ij + M ji + M jj = M ij + M ji = M ij. Stap 3: Laat w = Mv, en bepaal de kern van de afbeelding f : V L gedefinieerd door f(u) = u T w. Merk op dat dit een lineaire afbeelding is. Bovendien is f surjectief: laat a = f(v ) L, dan is a door de keuze van v. Voor b L is f((b/a)v ) = (b/a)f(v ) = b. Omdat n = dim(ker f)+dim(im f) heeft de deelruimte Ker(f) van V dimensie n. Laat {v,...,v n } een basis voor Ker f zijn. Stap 4: Maak nu T n = (v,v,...,v n ), met de vectoren v i als kolommen. Stel T n is niet inverteerbaar. Dat is equivalent met: {v,v,...,v n } is een afhankelijk stelsel. Omdat {v,...,v n } een onafhankelijk stelsel is, kan dat laatste alleen als v v,...,v n = Ker(f), oftewel f(v ) = ; dat is in tegenspraak met de keuze in Stap. Dus T n is inverteerbaar. Bovendien is T T n MT n van de vorm ( a M ) waar M een symmetrische (n ) (n ) matrix is, omdat (T T n MT n) ij = v T i Mv j en v T i Mv = v T i w = f(v i) = voor i > want v i Ker(f). Ga nu naar Stap en herhaal de procedure voor M. Het is duidelijk dat dit proces na eindig veel stappen een diagonaalmatrix D oplevert. Voorbeeld 9. Laten we Algoritme 9. toepassen op de kwadratische vorm met M = MB E =, 4 over R, uit voorbeeld 9.7. Voor v in Stap kunnen we e nemen, en dan is Mv = (,,) T. In Stap 3 zoeken we de kern van de afbeelding die aan u = (u,u,u 3 ) het getal u u toevoegt; dan wordt de kern opgespannen door v = (,,) T en v 3 = (,,) T, zodat T =, en we zijn in één klap klaar: T T MT = =. 4 4 Kwadratische Vormen Definitie 9. Een kwadratische vorm Q in n variabelen over een lichaam L is een homogeen polynoom van graad met coëfficiënten in L.
63 Opmerking 9.3 Dat een polynoom P = P(x,x,...,x n ) in n variabelen homogeen van graad k is betekent dat wanneer we P schrijven als som van termen P = p k,k,...,k n x k xk xkn n, met natuurlijke exponenten k j, een coëfficiënt p k,k,...,k n alleen maar ongelijk mag zijn als k +k + +k n = k. Een kwadratische vorm bestaat dus uit termen van de vorm q i,j x i x j (waar i en j gelijk kunnen zijn): 3x + x x is wél een kwadratische vorm, maar 3x + x + x niet. Door substitutie kunnen we een polynoom over een lichaam L in n variabelen opvatten als een afbeelding van L n (of een willekeurige n-dimensionale L- vectorruimte V ) naar L; met andere woorden, via Q(v) = Q((v,v,...,v n )) = Q(v,v,...,v n ), kan een kwadratische vorm als afbeelding Q : L n L worden opgevat. De volgende stelling drukt uit dat dit hetzelfde is als Q(v) = v T M Q v met M Q de matrix bepaald door Q. Stelling 9.4 Als L een lichaam is van karakteristiek ongelijk aan dan is er een één-éénduidig verband tussen kwadratische vormen in n variabelen op L en symmetrische n n matrices over L. Bewijs. Laat Q(x,x,...,x n ) = i j n q i,j x i x j. Definieer dan de matrix M Q M n n (L) door (M Q ) ii = q i,i en (M Q ) ij = q i,j / voor i j; hier is i,j n. Gevolg 9. Over een lichaam van karakteristiek ongelijk kunnen we met een kwadratische vorm Q in n variabelen een unieke symmetrische bilineaire vorm B op L n, voorzien van de standaardbasis, associëren. Dan geldt: Q(x) = B(x,x). Bewijs. Deze associatie volgt uit de stelling, omdat een symmetrische matrix M Q uit M n n (L) correspondeert met een symmetrische bilineaire vorm op L n met een gegeven basis, via B(v,w) = v T M Q w. Dan is Q(x) = B(x,x), en M B = M Q. Gevolg 9.6 Onder bovenstaande correspondentie geldt: B(v,w) = (Q(v + w) Q(v) Q(w)). Bewijs. Dit volgt direct door het herschrijven van Q(v + w) = B(v + w, v + w): B(v +w,v +w) = B(v,v)+B(v,w)+B(w,v)+B(w,w) = Q(v)+B(v,w)+Q(w). Voorbeeld 9.7 Laat Q de kwadratische vorm in 3 variabelen over Q zijn gegeven door Q(x,x,x 3 ) = x + x x + x x 3 + x 3. Dit is een homogeen polynoom, waarmee we de symmetrische matrix associëren. Met Q correspondeert dan de symmetrische bilineaire vorm B(v,w) = v w + v w + v w + v w 3 + v 3 w + v 3 w 3.
64 HOOFDSTUK 9. BILINEAIRE VORMEN Reëel-symmetrische bilineaire vormen In deze sectie laten we zien dat we symmetrische bilineaire vormen (en daarmee kwadratische vormen) op een reële vectorruimte onder equivalentie kunnen karakteriseren door drie invarianten. Definitie 9.8 Voor een reële diagonaalmatrix D definiëren we de 3 natuurlijke getallen n,n +,n als volgt: n (D) is het aantal nullen op de diagonaal van D, n + (D) is het aantal positieve elementen op de diagonaal van D, en n (D) is het aantal negatieve getallen op de diagonaal van D. Voor een symmetrische bilineaire vorm B op een eindig-dimensionale reële vectorruimte V definiëren we dan n (B) = n (D), n + (B) = n + (D), n (B) = n (D), voor een diagonaalmatrix D met D M B. Merk op dat bij elke symmetrische B volgens Stelling 9. zo n D bestaat. In het algemeen zijn er natuurlijk meerdere diagonaalmatrices die voldoen (je kunt immers bijvoorbeeld de basisvectoren verwisselen, of met een factor opblazen), maar de volgende stelling drukt uit dat dit toch een goede definitie is, namelijk, onafhankelijk van de keuze van D. Stelling 9.9 Laat B een bilineaire vorm op een reële n-dimensionale vectorruimte V zijn. Als D M B D, met diagonaalmatrices D en D, dan geldt: n (D) = n (D ), n + (D) = n + (D ), n (D) = n (D ). Bewijs. Merk eerst op dat een equivalentierelatie is, zodat de twee diagonaalmatrices D en D voldoen aan D D, oftewel er is een inverteerbare T zodat T T D T = D. Nu is n (D) = n rang(d) de dimensie van de kern van D, en net zo n (D ) = n rang(d ) de dimensie van de kern van D. Maar omdat T inverteerbaar is, geldt rang(d) = rang(d ) = r en dus n (D) = n (D ). Laat B nu de basis van V zijn ten opzichte waarvan B matrix D = MB B heeft, dan is D = T T D T = D de matrix MB C waar C = T B. We ordenen deze bases zo dat de eerste p = n + (D), resp. p = n + (D ) elementen b,...,b p en c,...,c p positieve waarden B(b i,b i ) en B(c j,c j ) opleveren, en de volgende m = n (D), resp. m = n (D ) negatieve waarden. Veronderstel nu eens dat p = n + (D) < n + (D ) = p ; omdat n = n + n + + n voor een diagonaalmatrix, geldt dan m = n (D) > n (D ) = m. Bekijk nu de verzameling vectoren S = {b,b,...,b p,c p +,... c p +m }. Dat zijn er p + m < p + m = r. De lineaire afbeelding f : V R p+m gegeven door f(v) = (B(v,b ),...,B(v,b p ),B(v,c p +),... B(v,c p +m )) heeft een beeld van dimensie p + m < r = n n (D), dus kern van dimensie n (p + m ) > n (n n (D)) = n (D) = n r, en daarom is er een w in de kern van f die niet bevat is in de ruimte opgespannen door {b r+,...,b n }. Schrijf w op basis B en gebruik dat w Kerf, dan is voor i p: = f(w) i = B( w k b k,b i ) = w i B(b i,b i ), zodat B(w,w) = B( w k b k, k= k= w k b k ) = k= wk B(b k,b k ) = k= p+m k=p+ w k B(b k,b k ) <,
6 omdat minstens één w k. Schrijf vervolgens w op basis C, dan is voor p + j p + m : = f(w) j = B( w k c k,c j ) = w j B(c j,c j ), zodat B(w,w) = B( w k c k, k= k= w k c k) = k= p w k B(ck,c k ) = w k B(ck,c k ) >, k= omdat weer minstens één w k. Maar dat is een tegenspraak! Omdat het geval n + (D) > n + (D ) op precies dezelfde manier tot een tegenspraak leidt, moet n + (D) = n + (D ), en dus ook n (D) = n (D ). Gevolg 9. Twee symmetrische bilineaire vormen op een reële vectorruimte V zijn equivalent dan en slechts dan als hun invarianten n,n +,n hetzelfde zijn. Gevolg 9. Zij B een symmetrische bilineaire vorm op een reële vectorruimte V. Dan bestaat er een basis voor V zodanig dat voor elk tweetal vectoren v, w V met coördinaten v i,w i ten opzichte van deze basis geldt: k= B(v,w) = v w + + v p w p v p+ w p+ v r w r, waar p = n + (B), en r = p + m met m = n (B). Bewijs. De bewering is equivalent met de bewering dat de Gram matrix van B een diagonaalmatrix is (ten opzichte van zekere basis) met op de diagonaal p getallen, dan m getallen en tenslotte n r getallen. Stelling 9.9 zegt dat een basis B bestaat zodat M B diagonaalmatrix D is met positieve D ii voor i p en negatieve D ii voor p+ i r. Vervangen we de basisvectoren b i door b i / D ii dan volgt de bewering. Voorbeeld 9. We bekijken het voorbeeld uit 9.7, en laten B op R 3 gegeven zijn door M = ten opzichte van de standaardbasis e,e,e 3. Het algoritme uit het bewijs van 9. heeft het volgende effect. Omdat M nemen we v = e ; dan heeft w = Mv coördinaten,/, en de kern van de afbeelding f(u) = u + /u wordt voortgebracht door van ( /,,) T en (,,) T. Dat betekent dat we moeten kijken naar T3 T MT 3 =, = 4 en het algoritme met de deelmatrix herhalen. We vinden ( )( )( ) ( T T M T = 4 = 4 7 4 4 6 Als diagonaalvorm van B vinden we dus (na normalisatie van de lengten): B(v,w) = v w v w + v 3 w 3. ).,
66 HOOFDSTUK 9. BILINEAIRE VORMEN Gevolg 9.3 Bij elke kwadratische vorm Q in n variabelen x i over R bestaat een lineaire transformatie T : R n R n zodanig dat voor de variabelen y i, gegeven door y = Tx geldt: Q(y) = n i= q iyi. Bovendien is het aantal q i dat positief, negatief, of nul is onafhankelijk van de keuze van T, en kan q i {,,} door geschikte keuze van T bereikt worden. Bewijs. Dit volgt onmiddellijk uit de resultaten van deze en de vorige paragraaf. Voorbeeld 9.4 Natuurlijk werkt het algoritme uit het bewijs van Stelling 9. altijd, zoals in het voorgaande voorbeeld. We geven een alternatieve methode om met de hand de diagonaalvorm voor een kwadratische vorm te bepalen. Daarvoor bezien we hetzelfde geval als in het vorige voorbeeld, waar Q correspondeert met dus Q(x,x,x 3 ) = x + x x + x x 3 + x 3. We proberen eerst alle termen met x erin als sommen (of verschillen) van kwadraten te schrijven;, x + x x = (x + x ) ( x ), hebben toege- en daarna hetzelfde voor x (bedenk dat net we een term met x voegd!): ( x ) + x x 3 = ( x x 3), zodat we vinden: Q(x,x,x 3 ) = (x + x ) ( x x 3) + 9 x 3. Na overgang op nieuwe variabelen wordt dit: Q(y,y,y 3 ) = y y + y 3.