Principale Componenten
|
|
- Leopold van de Velden
- 8 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Principale componenten E. Omey HI AJ Principale Componenten 1. Inleiding In econometrische studies is het bij de selectie van verklarende variabelen van groot belang om QMC te vermijden. We willen immers werken met (econometrisch) stabiele modellen. De praktijk leert dat QMC veel voorkomt. Meer nog, bij de gewone selectie van variabelen komt het frequent voor dat omwille van QMC veel verklarende variabelen uit het model verdwijnen. Meteen verdwijnt ook veel relevante informatie. Om QMC (en het verwijderen van informatie) te vermijden helpt het niet steeds om bijkomende data te vinden of om de variabelen geschikt te transformeren. Als alternatief bekijken we hier hoe we op een verstandige manier verklarende variabelen kunnen samenvoegen tot één of meerdere nieuwe verklarende variabelen. Naast toepassingen in econometrie kan het ook de bedoeling zijn om databanken te reduceren. Indien we over een groot aantal variabelen beschikken kan nuttig zijn om de onderliggende dimensies te zoeken. Op die manier reduceren we het grote aantal variabelen tot een beperkt aantal factoren die voldoende van de oorspronkelijke variantie verklaren. Mogelijke toepassingen zijn: - antwoorden op een groot aantal (enquëte) vragen reduceren tot een beperkt(-er) aantal onderliggende dimensies; - een index creëren voor aandelen: we vertrekken van de koers van k aandelen en zoeken de belangrijkste (eerste) principale component; - profielen opsellen van klanten op basis van een aantal kenmerken; enzovoort. In principe gaat men er van uit dat de variabelen van het type interval of van het type ratio zijn. Ook dienen er genoeg waarnemingen te zijn. Als vuistregel wordt aangenomen dat er ongeveer 10 keer zoveel waarnemingen moeten zijn als variabelen. Tot slot is het slechts zinvol om principale componenten te gaan zoeken als de variabelen onderling voldoende gecorrelleerd zijn: als de variabelen onderling slechts lage correlaties vertonen dan wijst er dit op dat de variabelen onderling niet (of zwak) afhangen van elkaar. Dan lijkt het moeilijk verdedigbaar om de variabelen te transformeren tot ongecorrelleerd nieuwe variabelen.
2 Principale componenten E. Omey HI AJ Notaties We vertrekken van k verklarende variabelen X(1) data: x(1,1), x(1,2),, x(1,n) X(2) data: x(2,1), x(2,2),, x(2,n) X(k) data: x(k,1), x(k,2),, x(k,n) De datamatrix stellen we voor door X: X = x(1,1) x(1,2) x(1,3)... x(1, n) x(2,1) x(2,2) x(2,3)... x(2, n) x(3,1) x(3,2) x(3,3)... x(3, n) x( k,1) x( k,2) x( k,3)... x( k, n) We plaatsen de data per variabele in kolommen en we noteren kortweg als X = (x(1), x(2),, x(k)). Om geen last te hebben van de verschillende meeteenheden veronderstellen we hierbij dat de data gestandardiseerd zijn. Dit betekent dat voor elke j = 1,2,, k het rekenkundig gemiddelde gelijk is aan 0 is en dat de (steekproef-) variantie gelijk is aan 1: n 1 x ( j) = x( j, i) = 0 n i= 1 2 s ( j) = 1 Hierbij is 2 V ( j) s ( j) = = ( x( j, i) x( j)) = x ( j, i) n n n de gebruikelijke steekproefvariantie. Bemerk dat s²(j) = V(j)/n, waarbij V(j) = V(X(j)) de variatie is van X(j). Bemerk eveneens dat V(j) in matrixnotatie kan geschreven worden als V(j) = x(j,1)*x(j,1) + x(j,2)*x(j,2) x(j,n)*x(j,n) x( j,1) =( x( j,1)... x( j, n) )... x( j, n) = x T (j)x(j) De totale variabiliteit in de data kan weergegeven worden door
3 Principale componenten E. Omey HI AJ of door TV = s (1) + s (2) s ( k) = k TVV = V(1) + V(2) + + V(k) = nk De variabelen kunnen onderling gecorreleerd zijn en de variantie-covariantie-matrix stellen we voor door C, dit is C = (c(i, j)) = (r(x(i), X(j)) In de plaats van c(i, j) gebruikt men soms ook de variatie-covariatie-matrix waarbij C*(i, j) = V(X(i), X(j)). Herinner dat V(X(i), X(j)) de covariatie is tussen X(i) en X(j): C *( i, j) = V ( i, j) = ( x( i, s) x( i))( x( j, s) x( j)) = nr( i, j) Bemerk dat r(i,j) in dit geval gelijk is aan r(i,j) = C*(i,j)/n. Omdat C(i, j) = C(i, j) is de matrix C* een symmetrische matrix. Bij gestandardiseerde gegevens vinden we In matrix notatie vinden we hier: C *( i, j) = x( i, s) x( j, s) C*(i,j) = x T (i)x(j) = x T (j)x(i). De variatie-covariatie-matrix C* (bij gestandardiseerde gegevens) is dus gelijk aan C* = X T X waarbij X T de getransponeerde matrix is van de matrix X. De variantie-covariantie-matrix C is dezelfde matrix op een gemeenschappelijke factor n na.
4 Principale componenten E. Omey HI AJ Voorbeeld. We bekijken de volgende ruwe data i.v.m. de consumptie van varkensvlees. De correlatiematrix is de volgende Y X1 X2 25,65 29,79 34,59 29,12 29,55 32,71 29,82 31,62 35,8 30,96 31,26 37,03 32,23 30,9 38,27 31,89 35,9 41,13 33,55 33,3 40,2 34,39 30,5 41,97 35,62 33,6 49,37 38,22 43,3 50,53 38,78 35,1 48,33 36,67 41,6 57,3 36,99 45,7 58,53 36,84 45, ,16 42,1 63,37 40,94 41,7 62,87 41,17 43,3 60,77 41,27 48,1 68,57 43,47 57,9 78,6 44,27 54,8 80,7 46,18 58,7 77,8 46,05 59,7 80,97 47,14 53,6 77,2 45,57 45,9 74,13 46,92 45,6 77 Y X1 X2 Y 1 X1 0, X2 0, , We merken dat de correlatie tussen X1 en X2 groot is. Het is onmogelijk om in één model tegelijk X1 en X2 op te nemen als verklarende variabelen. Om te standardiseren berekenen we het rekenkundig gemiddelde en de (steekproef-) standaardafwijking. m = 38, , ,1496 s² = 36, , ,1769 s = 6, , ,25352 en we vinden de volgende nieuwe tabel:
5 Principale componenten E. Omey HI AJ y x(1) x(2) -2, , , , , , , , , ,1836-1, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,8859 1, , , , , , , , , , , , , , , , , , , , De correlatiematrix en de variatie-covariatiematrix is gelijk aan: C x(1) x(2) x(1) 1 0, x(2) 0, C* x(1) x(2) x(1) 25 23,5701 x(2) 23, Bemerk dat deze matrices mooie symmetrische matrices zijn. Grafisch vinden we het volgende scatterdiagram
6 Principale componenten E. Omey HI AJ scatter x(1) vs x(2) 2 1,5 1 0, , ,5-2 De totale varia(n)tie in de data kan worden voorgesteld met TV = s²(1) + s²(2) = 2 TVV = 25*2 = 50 De grote correlatiecoëfficiënt (r = 0,94) komt tot uiting in de aanwezigheid van een lineaire band in de grafiek.
7 Principale componenten E. Omey HI AJ De eerste principale component 3.1. Constructie We construeren nu een eerste nieuwe variabele z(1) als volgt. Voor getallen a(1), a(2),, a(k) die we later bepalen stellen we Toegepast op onze data krijgen we z(1) = a(1)x(1) + a(2)x(2) + + a(k)x(k) z(1,i) = a(1)x(1,i) + a(2)x(2,i) + + a(k)x(k,i) voor i = 1, 2,, n 3.2. Voorbeeld (vervolg) We nemen bijvoorbeeld a(1) = 0,6 en a(2) = -0,3 en berekenen z(1) = 0,6*x(1) 0,3*x(2). We vinden de volgende tabel: x(1) x(2) z(1) -1,2814-1,3880-0,3525-1,3067-1,5036-0,3329-1,0885-1,3135-0,2590-1,1264-1,2379-0,3045-1,1644-1,1616-0,3502-0,6373-0,9856-0,0867-0,9114-1,0428-0,2340-1,2066-0,9339-0,4438-0,8797-0,4786-0,3843 0,1429-0,4073 0,2079-0,7216-0,5426-0,2702-0,0364 0,0093-0,0246 0,3959 0,0849 0,2121 0,3326 0,2369 0,1285 0,0164 0,3827-0,1050-0,0258 0,3519-0,1211 0,1429 0,2227 0,0189 0,6489 0,7026 0,1786 1,6821 1,3197 0,6133 1,3553 1,4489 0,3785 1,7664 1,2705 0,6787 1,8718 1,4656 0,6834 1,2287 1,2336 0,3672 0,4170 1,0447-0,0632 0,3853 1,2213-0,1352 m 0,0000 0,0000 0,0000 s² 1,0000 1,0000 0,1106
8 Principale componenten E. Omey HI AJ Bemerk dat het rekenkundig gemiddelde van z(1) gelijk is aan: z ( 1) = a(1) x(1) + a(2) x(2) = 0 We vinden als resultaat steeds de waarde 0 omdat de variabelen gestandardiseerd zijn. Voor de varia(n)tie vinden we en s ²( z(1)) = a²(1) s²(1) + a²(2) s²(2) + 2a(1) a(2) r(1,2) = 0,1106 V ( z(1)) = a²(1) V (1) + a²(2) V (2) + 2a(1) a(2) V (1,2) = 2,7647 Bij andere keuzes van a(1) en a(2) vinden we uiteraard andere waarden. Bij de keuze a(1) = a(2) = 0,8 vinden we bijvoorbeeld dat s²(z(1)) = 2, Matrixnotatie In het algemeen is het handig om met matrixnotaties te werken. In matrixnotatie vinden we dat z(1) = Xa, waarbij en X de datamatrix is, a de kolom met daarin a(1), a(2),, a(k) z(1) de kolom met z(1,i)-waarden. We berekenen nu V(z(1)) en vinden V(z(1)) = Σ i Σ j a(i)a(j)v(i, j) = Σ i Σ j a(i)a(j)c(i, j) In matrixnotatie is V(z(1)) gelijk aan: V(z(1)) = a T C a Wanneer we met de variantie-covariantiematrix werken vinden we s²(z(1)) = V(z(1))/n. We willen nu met één variabele (z(1)) zovéél mogelijk van de totale variatie TVV vastleggen. Dit betekent dat we een zo goed mogelijke vector a wensen te vinden. Dit leidt tot het volgend optimalisatieprobleem: max s²(z(1)) = a T C* a of max s²(z(1)) = a T C a
9 Principale componenten E. Omey HI AJ Voorbeeld (vervolg) In ons voorbeeld moeten we de volgende functie maximaliseren: s ²( z(1)) = a²(1) s²(1) + a²(2) s²(2) + 2a(1) a(2) r(1,2) Omdat de gegevens gestandardiseerd zijn is dit: s ²( z(1)) = a²(1) + a²(2) + 2a(1) a(2) r(1,2) Als we geen bijkomende voorwaarden opleggen aan de getallen a(1) en a(2) leidt dit optimaliseringsprobleem niet tot een oplossing! (Waarom niet?) 3.5. Optimaliseren Als we geen restricties opleggen aan de getallen (a(1), a(2),..., a(k)) dan leidt dit probleem niet tot een oplossing: door a geschikt te kiezen kan men V(z(1)) of s(z(1)) zo groot maken als men maar wil! Om de coëfficiënten a(j) onder controle te houden eisen we dat de vector a = (a(1), a(2),, a(k)) een genormaliseerde vector is, d.w.z. dat Σ a²(j) = 1. In matrixnotatie kunnen we deze voorwaarde herschrijven als: a T a = 1. Dit leidt tot het volgend optimalisatieprobleem: max s²(z(1)) = a T C a randvoorwaarde: a T a = 1 Voor een 2x2-voorbeeld vinden we: max V(z(1)) = a²(1)c(1,1) + 2a(1)a(2)C(1,2) + a²(2)c(2,2) randvoorwaarde: a²(1) + a²(2) = 1 Met de methode van Lagrange vinden we L = a²(1)c(1,1) + 2a(1)a(2)C(1,2) + a²(2)c(2,2) - λ(a²(1) + a²(2) 1) Afleiden naar a(1) en naar a(2) geeft: 2a(1)C(1,1) + 2a(2)C(1,2) - 2λa(1) = 0 2a(1)C(1,2) + 2a(2)C(2,2) - 2λa(2) = 0 en a²(1) + a²(2) = 1
10 Principale componenten E. Omey HI AJ Vereenvoudigen geeft: a(1)c(1,1) + a(2)c(1,2) = λa(1) (**) a(1)c(1,2) + a(2)c(2,2) = λa(2) en a²(1) + a²(2) = 1 In matrixnotatie vinden we Ca = λa en a T a = 1 We merken de vector a een genormaliseerde rechtereigenvector is van de matrix C bij de eigenwaarde λ. Voor een kxk-probleem vinden we identiek dezelfde vergelijkingen Ca = λa en a T a = 1 In het algemeen heeft een kxk-matrix meerdere eigenwaarden (en bijhorende genormaliseerde eigenvectoren). Welke eigenwaarde moeten we nu kiezen? Bemerk dat uit Ca = λa en a T a = 1 volgt dat s²(z(1)) = a T C a = λ a T a = λ Omdat we V(z(1)) willen maximaliseren volgt hieruit dat we de grootste eigenwaarde moeten kiezen. Opmerking. Het bestaan van een grootste (reële) eigenwaarde is gegarandeerd omdat de matrix C een symmetrische matrix is
11 Principale componenten E. Omey HI AJ Procedure De nieuwe variabele z(1) vinden we bijgevolg via de volgende procedure: - bepaal de grootste eigenwaarde λ(1) van de matrix C; - bepaal de bijhorende genormaliseerde rechtereigenvector a; - bereken nu z(1) = Xa - De gevonden a is de oplossing van het optimaliseringsprobleem max V(z(1)) = a T C a randvoorwaarde: a T a = 1 Uit de constructie volgt onder meer dat s²(z(1)) = a T C a = a T λ(1) a = λ(1) De nieuwe variabele z(1) noemen we de eerste principale component. Als matrix C kiezen we ofwel de covariatiematrix ofwel de covariantiematrix. Opmerking Om de bijdrage tot z(1) van de twee variabelen te bepalen berekenen we covariaties en correlaties. De covariantie tussen z(1) en x(1) is gelijk aan C(z(1), x(1)) = a(1)c(1,1) + a(2)c(1, 2) Dank zij formule (**) vinden we C(z(1), x(1)) = a(1)c(1,1) + a(2)c(1, 2) = λ(1)a(1) Anderzijds weten we dat s²(z(1)) = λ(1) en dat s²(x(1)) = 1. De correlatiecoëfficiënt tussen z(1) en x(1) is bijgevolg gelijk aan r(z(1), x(1)) = λ(1)a(1)/ λ(1) = a(1) λ(1) Op gelijkaardige wijze vinden we dat Bemerk nu dat r(z(1), x(2)) = a(2) λ(1) r²(z(1), x(1)) + r²(z(1), x(2)) = a²(1) λ(1) + a²(1) λ(1) = λ(1) Men noemt r²(z(1), x(1)) de bijdrage van x(1) tot de eerste principale component.
12 Principale componenten E. Omey HI AJ Praktisch Om z(1) effectief te bepalen kunnen we bijvoorbeeld de solver-functie van EXCEL gebruiken. We illustreren m.b.v. het vorige voorbeeld - we beginnen met arbitrair gekozen waarden a(1) en a(2) start kwadrateren a(1) 0,6 0,36 a(2) -0,3 0,09 som = 0,45 1 = must In het voorbeeld beginnen we met (0,6, -0,3); Om de eis a²(1) + a²(2) = 1 hard te maken berekenen we a²(1) en a²(2) en berekenen we de som. Hier vinden we som = 0,45. In een lege cel plaatsen we de waarde 1. Later eisen we dat de inhoud van de cel waar we de som berekenden gelijk moet zijn aan de inhoud van de cel waar we het getal 1 plaatsten. - De doelfunctie is de functie f = a T C a. In een lege cel gebruiken we de formules om voor onze keuze van a(1) en a(2) de functiewaarde van f te berekenen. In ons voorbeeld vinden we f = 0, We activeren nu de solver en vullen de volgende gegevens in: - Bij de target cell klikken we op de cel waar we de doelfunctie berekenden. - We willen hier maximaliseren.
13 Principale componenten E. Omey HI AJ Bij by changing cells klikken we op ons eerste voorstel van a-waarden - Bij de voorwaarden eisen we dat de berekende som van de kwadraten gelijk is aan 1. - Nu klikken we op solve en vinden de volgende output: start kwadrateren a(1) 0, ,5 a(2) 0, ,5 som = 1 1 = must f = 1, We vinden optimale a-waarden gelijk aan (afgerond) a(1) = 0,7071, a(2) = 0,7071 De som van de kwadraten is (zo goed als) gelijk aan 1. De maximale waarde van de doelfunctie is f* = We besluiten dat - dee grootste eigenwaarde van C is dus gelijk aan de bijhorende genormalseerde rechtereigenvector is a T = (0,7071, 0,7071) De eerste principale component kunnen we dus bepalen via de volgende formule: z(1) = *x(1) *x(2) Opmerking. Bij grotere problemen is het aan te raden om de solver 2 of 3 maal te gebruiken met andere startwaarden voor a Grafische betekenis (voor k = 2) In het scatterdiagram kunnen we de rechte tekenen met vergelijking y = x. Dit is de vergelijking van de rechte lijn door de oorsprong en door de gevonden vector (a(1), a(2)) = (0,7071, 0,7071). Dit is de eerste bissectrice! Voor het voorbeeld vinden we de volgende grafiek:
14 Principale componenten E. Omey HI AJ ,0000 1,5000 1,0000 0,5000 0,0000-2,0000-1,5000-1,0000-0,5000 0,0000 0,5000 1,0000 1,5000 2,0000-0,5000-1,0000-1,5000-2,0000 De eerste principale component correspondeert nu met de projectie van de verschillende punten op de diagonaal.
15 Principale componenten E. Omey HI AJ Tweede principale componenten 4.1. Algemeen We construeren nu een tweede variabele z(2) als volgt. Voor getallen b(1), b(2),, b(k) die we later zullen bepalen stellen we z(2) = b(1)x(1) + b(2)x(2) + + b(k)x(k) Toegepast op onze data krijgen we z(2,i) = b(1)x(1,i) + b(2)x(2,i) + + b(k)x(k,i) voor i = 1, 2,, n In matrixnotatie vinden we dat waarbij en z(2) = Xb, X de datamatrix is, b de kolom met daarin b(1), b(2),, b(k) z(2) de kolom met z(i)-waarden. Om de coëfficiënten b(j) onder controle te houden eisen we opnieuw dat de vector (b(1), b(2),, b(k)) een genormaliseerde vector is, d.w.z. dat Σ b²(j) = 1. In matrixnotatie kunnen we deze voorwaarde herschrijven als: b T b = 1. Om geen QMC te vermijden eisen we eveneens dat V(z(1), z(2)) = 0 of dat de correlatie tussen de reeds gevonden principale component en de nieuwe component gelijk is aan 0. We vinden hier V(Z(1), Z(2)) = Σ z(1,i)z(2, j) = z T (2)z(1) = b T X T Xa = b T C a (constructie a!) = b T λ(1)a = λ(1) b T a Omdat we willen dat V(z(1), z(2)) gelijk is aan 0 volgt dat we bijkomend moeten eisen dat b T a = 0. In matrixnotatie is s²(z(2)) gelijk aan s²(z(2)) = b T C b Omdat we de variatie willen maximaliseren vinden we het volgend optimalisatieprobleem: max s²(z(2)) = b T C b randvoorwaarden: b T b = 1 en b T a = 0 Hier is a uiteraard de vector die we reeds vonden bij de eerste principale component. Het optimalisatieprobleem leidt tot de volgende vergelijking:
16 Principale componenten E. Omey HI AJ Cb = λb Hieruit volgt dat de vector b een genormaliseerde rechtereigenvector is van de matrix C bij de eigenwaarde λ. Welke eigenwaarde moeten we nu kiezen? Bemerk dat uit Cb = λb volgt dat s²(z(2)) = b T Cb = λb T b = λ Omdat we s²(z(2)) willen maximaliseren volgt hieruit dat we de tweede grootste eigenwaarde van C moeten kiezen Procedure De nieuwe variabele z(2) vinden we bijgevolg als volgt: - bepaal de tweede grootste eigenwaarde λ(2) van de matrix C; - bepaal de bijhorende rechtereigenvector b; - bereken nu z(2) = Xb Opmerking Het bestaan van een tweede grootste (reële) eigenwaarde is gegarandeerd omdat de matrix C een symmetrische matrix is. Uit deze constructie volgt onder meer dat s²(z(2)) = b T Cb = b T λ(2)b = λ(2) De nieuwe variabele z(2) noemen we de tweede principale component.
17 Principale componenten E. Omey HI AJ Voorbeeld (vervolg). Voor ons voorbeeld gebruiken we opnieuw EXCEL en de solver-optie. We vinden hier het volgende resultaat f* = 0, We vinden nu b(1) = -0,7071 en b(2) = +0,7071 a b b² ab 0, , ,5-0,5 0, , ,5 0,5 som = 1, eis = 1 0 De doelfunctie heeft nu de optimale waarde f* = Dit is meteen de tweede grootste eigenwaarde van de matrix C. De tweede principale component is dus gelijk aan We vinden de volgende tabel met data: z(2) = -0,7071*x(1) *x(2) x(1) x(2) z*(1) z*(2) -1,2814-1,3880-1,8875-0, ,3067-1,5036-1,9872-0, ,0885-1,3135-1,6985-0, ,1264-1,2379-1,6718-0, ,1644-1,1616-1,6447 0, ,6373-0,9856-1,1475-0, ,9114-1,0428-1,3818-0, ,2066-0,9339-1,5136 0, ,8797-0,4786-0,9605 0, ,1429-0,4073-0,1870-0, ,7216-0,5426-0,8940 0, ,0364 0,0093-0,0192 0, ,3959 0,0849 0,3400-0, ,3326 0,2369 0,4027-0,0677 0,0164 0,3827 0,2822 0, ,0258 0,3519 0,2306 0, ,1429 0,2227 0,2585 0, ,6489 0,7026 0,9557 0, ,6821 1,3197 2,1226-0, ,3553 1,4489 1,9829 0, ,7664 1,2705 2,1474-0, ,8718 1,4656 2,3599-0, ,2287 1,2336 1,7411 0, ,4170 1,0447 1,0336 0, ,3853 1,2213 1,1361 0, ,0000 0,0000 0,0000 0,0000 1,0000 1,0000 1,9428 0,0572
18 Principale componenten E. Omey HI AJ Bemerk dat λ(1) + λ(2) = 1, ,0572 = 2 Opmerking. In de terminologie van lineaire algebra voerden we de volgende manipulaties uit: * we vertrekken van (x(1), x(2)) en van de eenheidsbasisvectoren e T (1) = (1,0) en e T (2) = (0, 1) * we construeren (z(1), z(2)) = (a(1)x(1) + a(2)x(2), b(1)x(1) + b(2)x(2)) In matrixnotatie is dit de volgende transformatie : z(1) a(1) = z(2) b(1) a(2) x(1) = b(2) x(2) x(1) A x(2) We kunnen ook de omgekeerde transformatie uitvoeren. In dit geval vinden we x(1) a(1) b(1) z(1) t z(1) = = A x(2) a(2) b(2) z(2) z(2) waarbij A t = A -1 de inverse is van de matrix A. In feite vervangen wij bij principale componenten de eenheidsbasis e T (1) = (1,0) en e T (2) = (0, 1) door een nieuwe basis a T en b T. Grafisch betekent dit dat we ons assenkruis roteren tot de coördinaten van de punten t.o.v. de nieuwe basis loodrecht op elkaar staan. Zie verderop.
19 Principale componenten E. Omey HI AJ Bemerkingen Informatie In ons voorbeeld met twee variabelen vinden we dat λ(1) + λ(2) = 1, ,0572 = 2 Dit is uiteraard geen toeval! Intuïtief kunnen we dit verklaren als volgt: we vertrekken met informatie over twee variabelen en we construeren 2 nieuwe variabelen. De informatie vervat in de nieuwe variabelen is even groot als de informatie vervat in de oude variabelen. We merken ook dat de eerste principale component een groot deel van het totaal (nl. 2) vertegenwoordigt. Met de eerste principale component verklaren we 1,94/2 = 0,97 van het totaal. Met andere woorden: de eerste principale component vertegenwoordigt 97% van de totale informatie. De tweede component vertegenwoordigt slechts 3% van het totaal. Dit betekent eigenlijk dat z(2) een overbodige variabele is Grafisch Grafisch vinden we het volgend beeld. Op de grafiek tekende ik de twee rechten: * door de oorsrpong en (a(1), a(2)): y = x * door de oorsprong en (b(1), b(2)): y = - x 2,0000 1,5000 1,0000 0,5000 0,0000-2,0000-1,5000-1,0000-0,5000 0,0000 0,5000 1,0000 1,5000 2,0000-0,5000-1,0000-1,5000-2,0000
20 Principale componenten E. Omey HI AJ De twee rechten staan loodrecht op elkaar. De principale componenten vinden we nu door de oorspronkelijke puntenkoppels te projecteren op deze rechten. Wanneer we nu alles bekijken vanuit het standpunt van de twee getekende rechten (en dus alles roteren), dan vinden we: 0,8 0,6 0,4 0, , ,4-0, Diagonaliseren De gevolgde werkwijze komt er op neer dat we de correlatiematrix diagonaliseren. Onze constructie toonde dat In matrix notatie vinden we b T C a = b T C a = 0 a T C a = λ(1) b T C b = λ(2) a(1) b(1) a(2) a(1) C b(2) a(2) b(1) λ(1) = b(2) 0 0 λ(2) De twee kolomvectoren a en b vormen een nieuwe basis voor de twee-dimensionele ruimte.
21 Principale componenten E. Omey HI AJ Volgende principale componenten Het procédé zoals hiervoor beschreven zetten we nu verder om nieuwe variabelen te genereren. We bepalen de eigenwaarden van de matrix C en bepalen telkens een bijhorende genormaliseerde rechtereigenvector. Vervolgens construeren we hiermee nieuwe variabelen Z(j): λ(1) a z(1) = Xa s²(z(1)) = λ(1) λ(2) b z(2) = Xb s²(z(2)) = λ(2) en V(z(1), z(2)) = 0 λ(j) d z(j) = Xd s²z(j)) = λ(j) en V(z(j),Z(i)) = 0, i j Wanneer we vertrekken van k variabelen, dan kunnen we in principe k principale componenten bepalen. Van de bijhorende eigenwaarden weten we dat λ(1) +λ(2) λ(k) = k Over hoeveel principale componenten men moet nemen is er onenigheid bij verschillende auteurs. Meestal spreekt men vooraf een bepaald percentage (p) af en men berekent principale componenten 1, 2,..., r tot (λ(1) +λ(2) λ(r))/k > p.
22 Principale componenten E. Omey HI AJ Uitgewerkt voorbeeld We gebruiken data omtrent de prijs (in BEF) van tweedehandswagens en een viertal relevante variabelen. PRIJS LEEFTIJD OPTIES KM DEUREN Y X1 X2 X3 X m , ,2 9, ,86 4, s , , , ,11 1, De correlatiematrix is gelijk aan: C Y X1 X2 X3 X4 Y 1,00 X1-0,84 1,00 X2 0,72-0,53 1,00 X3-0,66 0,75-0,42 1,00 X4-0,41 0,33-0,28 0,16 1,00
23 Principale componenten E. Omey HI AJ Na standardiseren vinden we de volgende principale componenten. a b c d 0, ,1555 0,223-0,753-0,4895 0,0499 0,862-0,124 0, ,4099 0,376 0,6284 0,3251-0,897 0,258 0,1496 lambda 2, ,8844 0,597 0,2186 cumul 2, ,1844 3,781 4 % 0,575 0,7961 0,945 1 Met de eerste component verklaren we 2,3/4 = 57% van de totale variabiliteit. Met de eerste en de tweede principale component verklaren we 79% van de totale variatie. Met 3 componenten samen verklaren we 94% van de variatie. In het licht van de (gestandardiseerde) prijs bekijken we de volgende (z(1), Y) ) grafiek: y versus z(1) z(1) y We merken dat een grote resp. lage z(1)-score overeenstemt met een grote resp. lage (gestandardiseerde) prijs. De z(1)-score kan als het ware dienen als een soort prijsindex.
24 Principale componenten E. Omey HI AJ Hoeveel componenten? Bij deze analyses kunnen we vertrekkend van k variabelen in principe k principale componenten bepalen. Veelal zal men voor verder gebruik enkel de belangrijke componenten weerhouden. Empirisch stelt men vast dat vanaf een ogenblik de eigenwaarden zeer klein worden en dit impliceert dat de marginale bijdrage van de bijhorende componenten zeer klein worden. In de literatuur is men het niet eens over het aantal componenten dat men moet weerhouden. Dikwijls legt men de grens op p = 50 % We werkten het vorige voorbeeld uit wanneer we beschikken over meer informatie. Via de beschreven procedure bepaalden we de eerste drie principale componenten en vonden de volgende resultaten: a b c X1 LEEFTIJD 0, , ,33878 X2 OPTIES -0,4618-0,0532-0,03794 X4 CC -0, , ,09657 X5 # eig 0,2739 0, ,28179 X6 BORG -0, , ,47806 X7 DEUREN 0, , , X9 VERSN 0, ,3923 0,3994 X10 KM 0, , ,20044 X11 DIESEL 0, , ,54821 eigenwaarden 2,606 1,554 0,878 cumulatief/9 29% 46% 56% Bij de eerste principale component spelen vooral de kenmerken van de auto s mee (leeftijd, opties, # deuren, # km). Bij de tweede component zijn het objectieve kenmerken ( CC, Diesel of niet) die doorwegen. Met de drie componenenten samen bekomen we 56% van de variatie in de oorspronkelijke data. In vele gevallen is het moeilijk om een concrete (economische) betekenis te geven aan de principale componenten zelf. 8. Regressie-analyse In praktijkstudies willen we een variabele y verklaren met één of méér verklarende variabelen x(1), x(2),..., x(k). Het doel van principale componenten is om dit uit te voeren met minder, maar betere verklarende variabelen. Stel dat we vertrekken van 5 variabelen x(1), x(2), x(3),x(4) en x(5) en daaruit 2 principale compontenten distilleren: z(1) = a(1)x(1) + a(2)x(2) + a(3)x(3) + a(4)x(4) + a(5)x(5) z(2) = b(1)x(1) + b(2)x(2) + b(3)x(3) + b(4)x(4) + b(5)x(5) Een regressie van y op z(1) en z(2) geeft dan:
25 Principale componenten E. Omey HI AJ y = uz(1) + vz(2) + e = (ua(1) + vb(1))x(1) + (ua(2) + vb(2))x(2) (ua(5) + vb(5))x(5) + e Deze laatste formule is dan op zijn beurt nuttig om voorspellingen te maken en te beoordelen. Opmerking Om het met de woorden van G.S. Madalla te zeggen: The method of PCA is of limited use and it can be (and has been) easily misused in econometric work Bronnen G. Henrion, A. Henrion und R. Henrion. Beispiele zur Datenanlyse mit BASIC- Programmen. VEB Deutscher Verlang dr Wissenschaften, Berlin J. Johnston. Econometric Methods (2nd edition). McGraw-Hill Inc G.S. Maddala. Econometrics. McGraw-Hill Inc Website:
26 Principale componenten E. Omey HI AJ Principale Componenten Inleiding Notaties De eerste principale component Constructie Voorbeeld (vervolg) Matrixnotatie Voorbeeld (vervolg) Optimaliseren Procedure Praktisch Grafische betekenis (voor k = 2) Tweede principale componenten Algemeen Procedure Voorbeeld (vervolg) Bemerkingen Informatie Grafisch Diagonaliseren Volgende principale componenten Uitgewerkt voorbeeld Hoeveel componenten? Regressie-analyse...24
Matrixalgebra (het rekenen met matrices)
Matrixalgebra (het rek met matrices Definitie A a a n a a n a m a mn is e (m n-matrix Hierbij is m het aantal rij van A n het aantal kolomm (m n noemt m de afmeting( van de matrix A We noter vaak kortweg
Nadere informatieMeetkunde en lineaire algebra
Meetkunde en lineaire algebra Daan Pape Universiteit Gent 7 juni 2012 1 1 Möbius transformaties De mobiustransformatie wordt gegeven door: z az + b cz + d (1) Als we weten dat het drietal (x 1, x 2, x
Nadere informatieTENTAMEN LINEAIRE ALGEBRA 1 donderdag 23 december 2004,
TENTAMEN LINEAIRE ALGEBRA donderdag december 004, 0.00-.00 Bij elke vraag dient een berekening of motivering worden opgeschreven. Het tentamen bestaat uit twee gedeelten: de eerste drie opgaven betreffen
Nadere informatie11.0 Voorkennis V
11.0 Voorkennis V 8 6 4 3 6 3 0 5 W 8 1 1 12 2 1 16 4 3 20 5 4 V is een 2 x 4 matrix. W is een 4 x 3 matrix. Deze twee matrices kunnen met elkaar vermenigvuldigd worden. Want het aantal kolommen van matrix
Nadere informatieHOOFDSTUK VII REGRESSIE ANALYSE
HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens
Nadere informatieTentamen lineaire algebra voor BWI maandag 15 december 2008, uur.
Vrije Universiteit Amsterdam Faculteit der Exacte Wetenschappen Afdeling Wiskunde Tentamen lineaire algebra voor BWI maandag 5 december 8, 5.5-8. uur. ELK ANTWOORD DIENT TE WORDEN BEARGUMENTEERD. Er mogen
Nadere informatieHertentamen Biostatistiek 3 / Biomedische wiskunde
Hertentamen Biostatistiek 3 / Biomedische wiskunde 2 juni 2014; 18:30-20:30 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het
Nadere informatieWI1808TH1/CiTG - Lineaire algebra deel 1
WI1808TH1/CiTG - Lineaire algebra deel 1 College 6 26 september 2016 1 Hoofdstuk 3.1 en 3.2 Matrix operaties Optellen van matrices Matrix vermenigvuldigen met een constante Matrices vermenigvuldigen Machten
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Lineaire Algebra voor ST (2DS06) op 16-4-2012, 14.30-17.00 uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Lineaire Algebra voor ST (DS6) op 6--,.-7. uur. Aan dit tentamen gaat een MATLAB-toets van een half uur vooraf. Pas als de laptops
Nadere informatieGaap, ja, nog een keer. In één variabele hebben we deze formule nu al een paar keer gezien:
Van de opgaven met een letter en dus zonder nummer staat het antwoord achterin. De vragen met een nummer behoren tot het huiswerk. Spieken achterin helpt je niets in het beter snappen... 1 Stelling van
Nadere informatiePrincipale Componenten Analyse:
Principale Componenten Analyse: Doelstellingen: dimensiereductie inzicht in de variabiliteit van de data dataexploratie PCA is een transformatie: van p oorspronkelijke variabelen naar p PC s ˆΣ Σ variantie
Nadere informatieAanvullingen bij Hoofdstuk 8
Aanvullingen bij Hoofdstuk 8 8.5 Definities voor matrices De begrippen eigenwaarde eigenvector eigenruimte karakteristieke veelterm en diagonaliseerbaar worden ook gebruikt voor vierkante matrices los
Nadere informatieRuimtemeetkunde deel 1
Ruimtemeetkunde deel 1 1 Punten We weten reeds dat Π 0 het meetkundig model is voor de vectorruimte R 2. We definiëren nu op dezelfde manier E 0 als meetkundig model voor de vectorruimte R 3. De elementen
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen
Nadere informatie3 Wat is een stelsel lineaire vergelijkingen?
In deze les bekijken we de situatie waarin er mogelijk meerdere vergelijkingen zijn ( stelsels ) en meerdere variabelen, maar waarin elke vergelijking er relatief eenvoudig uitziet, namelijk lineair is.
Nadere informatie3.2 Vectoren and matrices
we c = 6 c 2 = 62966 c 3 = 32447966 c 4 = 72966 c 5 = 2632833 c 6 = 4947966 Sectie 32 VECTOREN AND MATRICES Maar het is a priori helemaal niet zeker dat het stelsel vergelijkingen dat opgelost moet worden,
Nadere informatieFuncties van vectoren
Functies van vectoren Alexander Ly Psychological Methods University of Amsterdam 15 September 2014 Overview 1 Notatie 2 Overview 1 Notatie 2 Matrices Een matrix schrijven we vaak met een hoofdletter A.
Nadere informatieHoofdstuk 3. Matrices en stelsels. 3.1 Matrices. [[1,7]],[[12,8] ] of [ 1, 7; 12,8 ] bepaalt de matrix
Hoofdstuk 3 Matrices en stelsels 3.1 Matrices Een matrix is in DERIVE gedefinieerd als een vector van vectoren. De rijen van de matrix zijn de elementen van de vector. Op de volgende manier kan je een
Nadere informatieToepassingen op differentievergelijkingen
Toepassingen op differentievergelijkingen We beschouwen lineaire differentievergelijkingen of lineaire recurrente betrekkingen van de vorm a 0 y k+n + a y k+n + + a n y k+ + a n y k = z k, k = 0,,, Hierbij
Nadere informatieBekijk nog een keer het stelsel van twee vergelijkingen met twee onbekenden x en y: { De tweede vergelijking van de eerste aftrekken geeft:
Determinanten Invoeren van het begrip determinant Bekijk nog een keer het stelsel van twee vergelijkingen met twee onbekenden x en y: { a x + b y = c a 2 a 2 x + b 2 y = c 2 a Dit levert op: { a a 2 x
Nadere informatie3.0 Voorkennis. y = -4x + 8 is de vergelijking van een lijn. Hier wordt y uitgedrukt in x.
3.0 Voorkennis y = -4x + 8 is de vergelijking van een lijn. Hier wordt y uitgedrukt in x. y = -4x + 8 kan herschreven worden als y + 4x = 8 Dit is een lineaire vergelijking met twee variabelen. Als je
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Lineaire Algebra voor ST (DS6) op -4-, 4.-7. uur. Opgave Gegeven is het volgende stelsel lineaire vergelijkingen met parameters
Nadere informatieHoofdstuk 1. Afspraken en notaties
Hoofdstuk 1 Afspraken en notaties In deze tekst onderzoeken we een eenvoudig dobbelspel: twee spelers hebben een dobbelsteen, gooien deze, en wie het hoogst aantal ogen gooit wint. Er blijken setjes dobbelstenen
Nadere informatieCollege WisCKI. Albert Visser. 16 januari, Department of Philosophy, Faculty Humanities, Utrecht University. Loodrechte Projectie
College WisCKI Albert Visser Department of Philosophy, Faculty Humanities, Utrecht University 16 januari, 2012 1 Overview 2 Overview 2 Overview 2 Overview 3 Zij V een deelruimte met basis v 1,..., v k.
Nadere informatieJe kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen
Lesbrief: Correlatie en Regressie Leerlingmateriaal Je leert nu: -een correlatiecoëfficient gebruiken als maat voor het statistische verband tussen beide variabelen -een regressielijn te tekenen die een
Nadere informatie3.0 Voorkennis. Voorbeeld 1: Los op: 6x + 28 = 30 10x.
3.0 Voorkennis Voorbeeld 1: Los op: 6x + 28 = 30 10x. 6x + 28 = 30 10x +10x +10x 16x + 28 = 30-28 -28 16x = 2 :16 :16 x = 2 1 16 8 Stappenplan: 1) Zorg dat alles met x links van het = teken komt te staan;
Nadere informatieLineaire Algebra en Vectorcalculus 2DN60 College 5.a Basis en dimensie
Lineaire Algebra en Vectorcalculus 2DN60 College 5.a Basis en dimensie Ruud Pellikaan g.r.pellikaan@tue.nl /k 205-206 Definitie opspansel 2/35 Stel S = {v,..., v n } is een deelverzameling van de vectorruimte
Nadere informatieAntwoorden op de theoretische vragen in de examen voorbereiding
Antwoorden op de theoretische vragen in de examen voorbereiding Theorie vraag Zij A een m n-matrix. Geef het verband tussen de formule voor de dimensie d van een niet-strijdig stelsel, d = n rang (A) (zie
Nadere informatieStatistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn
Statistiek: Spreiding en dispersie 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Met spreiding willen we in één getal uitdrukken hoe verspreid de gegevens zijn: in hoeveel
Nadere informatie9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
Nadere informatiex = b 1 x 1 , b = x n b m i,j=1,1 en een vector [x j] n j=1 m n a i,j x j j=1 i=1
WIS9 9 Matrixrekening 9 Vergelijkingen Stelsels lineaire vergelijkingen Een stelsel van m lineaire vergelijkingen in de n onbekenden x, x 2,, x n is een stelsel vergelijkingen van de vorm We kunnen dit
Nadere informatie( ) Hoofdstuk 4 Verloop van functies. 4.1 De grafiek van ( ) 4.1.1 Spiegelen t.o.v. de x-as, y-as en de oorsprong
Hoofdstuk 4 Verloop van functies Met DERIVE is het mogelijk om tal van eigenschappen van functies experimenteel te ontdekken. In een eerste paragraaf onderzoeken we het verband tussen de grafieken van
Nadere informatieSamenvatting Lineaire Algebra, periode 4
Samenvatting Lineaire Algebra, periode 4 Hoofdstuk 5, Eigenwaarden en eigenvectoren 5.1; Eigenvectoren en eigenwaarden Definitie: Een eigenvector van een n x n matrix A is een niet nulvector x zodat Ax
Nadere informatieGeef niet alleen antwoorden, maar bewijs al je beweringen.
Tentamen Lineaire Algebra donderdag 29 januari 205, 9.00-2.00 uur Het is niet toegestaan telefoons, computers, grafische rekenmachines (wel een gewone), dictaten, boeken of aantekeningen te gebruiken.
Nadere informatieOverzicht. Eigenwaarden. Beurzen en afhankelijkheid. Eigenwaarden: Intro
Overzicht Eigenwaarden VU Numeriek Programmeren. Charles Bos Vrije Universiteit Amsterdam c.s.bos@vu.nl, A april Waarom? Voorbeelden Eigenwaarden/eigenvectoren Hoe vind ik ze? Polynoom Powermethode Andere
Nadere informatieExamen Lineaire Algebra en Meetkunde Tweede zit (13:30-17:30)
Examen Lineaire Algebra en Meetkunde Tweede zit 2016-2017 (13:30-17:30) 1 Deel gesloten boek (theorie) (5.5pt) - indienen voor 14u30 (0.5pt) Geef de kleinste kwadratenoplossing van het stelsel AX = d,
Nadere informatieLineaire Algebra voor W 2Y650
Lineaire Algebra voor W 2Y650 Docent: L. Habets HG 8.09, Tel: 040-2474230, Email: l.c.g.j.m.habets@tue.nl http://www.win.tue.nl/wsk/onderwijs/2y650 1 Eigenwaarden en eigenvectoren Zij A een n n matrix.
Nadere informatie16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA
16. MANOVA MANOVA Multivariate variantieanalyse (MANOVA) kan gebruikt worden in een situatie waarin je meerdere afhankelijke variabelen hebt. Met MANOVA kan er 1 onafhankelijke variabele gebruikt worden
Nadere informatieV Kegelsneden en Kwadratische Vormen in R. IV.0 Inleiding
V Kegelsneden en Kwadratische Vormen in R IV.0 Inleiding V. Homogene kwadratische vormen Een vorm als H (, ) = 5 4 + 8 heet een homogene kwadratische vorm naar de twee variabelen en. Een vorm als K (,
Nadere informatieStatistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
Statistiek met Excel Schoolexamen en Uitbreidingsopdrachten 2 Inhoudsopgave Achtergrondinformatie... 4 Schoolexamen Wiskunde VWO: Statistiek met grote datasets... 5 Uibreidingsopdrachten vwo 5... 6 Schoolexamen
Nadere informatieTussentijdse Toets Wiskunde 2 1ste bachelor Biochemie & Biotechnologie, Chemie, Geografie, Geologie en Informatica april 2011
Tussentijdse Toets Wiskunde ste bachelor Biochemie & Biotechnologie, Chemie, Geografie, Geologie en Informatica april Deze toets is bedoeld om u vertrouwd te maken met de wijze van ondervraging op het
Nadere informatieTentamen lineaire algebra voor BWI dinsdag 17 februari 2009, uur.
Vrije Universiteit Amsterdam Faculteit der Exacte Wetenschappen Afdeling Wiskunde Tentamen lineaire algebra voor BWI dinsdag 7 februari 9, 8.-.5 uur. ELK ANTWOORD DIENT TE WORDEN BEARGUMENTEERD. Er mogen
Nadere informatieLineaire Algebra Een Samenvatting
Lineaire Algebra Een Samenvatting Definitie: Een (reële) vectorruimte is een verzameling V voorzien van een additieve en multiplicatieve operatie, zodat (a) u V en v V u + v V, (1) u + v = v + u voor alle
Nadere informatieSymmetrische matrices
Symmetrische matrices We beginnen met een eenvoudige definitie : Definitie Een matrix A heet symmetrisch als A T = A NB Een symmetrische matrix is dus altijd vierkant Symmetrische matrices hebben fraaie
Nadere informatieAkternatieve doorrekenen. 7.2 Tabellen
7.2 Tabellen Een tabel geeft een overzicht van de uitkomsten van een berekening voor verschillende waarden van een of meerdere variabelen. Excel kent twee soorten tabellen. Een eenzijdige en een tweezijdige
Nadere informatieLineaire Algebra voor ST
Lineaire Algebra voor ST docent: Judith Keijsper TUE, HG 9.3 email: J.C.M.Keijsper@tue.nl studiewijzer: http://www.win.tue.nl/wsk/onderwijs/2ds6 Technische Universiteit Eindhoven college 2 J.Keijsper (TUE)
Nadere informatieZomercursus Wiskunde. Rechten en vlakken (versie 14 augustus 2008)
Katholieke Universiteit Leuven September 2008 Rechten en vlakken (versie 14 augustus 2008) 2 Rechten en vlakken Inleiding In deze module behandelen we de theorie van rechten en vlakken in de driedimensionale
Nadere informatieUITWERKINGEN d. Eliminatie van a geeft d. Eliminatie van b,
UITWERKINGEN 1. Gegeven in R 3 zijn de punten P = (1, 1, ) t en Q = ( 2,, 1) t en het vlak V gegeven door de vergelijking 2x 1 x 2 + x 3 = 1. Zij l de lijn door P loodrecht op V en m de lijn door Q loodrecht
Nadere informatieTentamen Lineaire Algebra 1 (Wiskundigen)
Tentamen Lineaire Algebra Wiskundigen Donderdag, 23 januari 24,.-3. Geen rekenmachines. Motiveer elk antwoord.. Voor alle reële getallen a definiëren we de matrix C a als a C a = a 2. a Verder definiëren
Nadere informatieCTB1002 deel 1 - Lineaire algebra 1
CTB100 deel 1 - Lineaire algebra 1 College 5 5 februari 014 1 Opbouw college Vandaag behandelen we hoofdstuk 1.7 en deel van 1.8 Voor de pauze: hoofdstuk 1.7 Na de pauze: hoofdstuk 1.8 Verschillende notaties
Nadere informatieToepassingen op discrete dynamische systemen
Toepassingen op discrete dynamische systemen Een discreet dynamisch systeem is een proces van de vorm x k+ Ax k k met A een vierkante matrix Een Markov-proces is een speciaal geval van een discreet dynamisch
Nadere informatieb) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte
Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte
Nadere informatieTentamen Lineaire Algebra
Tentamen Lineaire Algebra 3 januari 214, 8:3-11:3 uur - Bij dit tentamen mogen dictaten en boeken niet gebruikt worden - Een eenvoudige rekenmachine, hoewel niet nodig, is toegestaan, maar geen grafische
Nadere informatiePraktische informatie. m.b.t. College. Lineaire Algebra en Beeldverwerking. Bachelor Informatica. 1e jaar. Voorjaar semester 2012
Praktische informatie m.b.t. College Lineaire Algebra en Beeldverwerking Bachelor Informatica 1e jaar Voorjaar semester 2012 Docenten: Jesse Goodman en Charlene Kalle Universiteit Leiden Praktische informatie
Nadere informatie2.1 Lineaire formules [1]
2.1 Lineaire formules [1] De lijn heeft een helling (richtingscoëfficiënt) van 1; De lijn gaat in het punt (0,2) door de y-as; In het plaatje is de lijn y = x + 2 getekend. Omdat de grafiek een rechte
Nadere informatieFACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie
FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie Lineaire Algebra, tentamen Uitwerkingen vrijdag 4 januari 0, 9 uur Gebruik van een formuleblad of rekenmachine is niet toegestaan. De
Nadere informatieUitwerking opgaven 17 december. Spoilers!!
Uitwerking opgaven 7 december Spoilers!! (duh... 8 januari 206 Inhoudsopgave Complex diagonaliseren matrix 2. Opgave................................................ 2.2 Oplossing...............................................
Nadere informatie1.1.2. Wiskundige taal. Symbolen om mee te rekenen + optelling - aftrekking. vermenigvuldiging : deling
Examen Wiskunde: Hoofdstuk 1: Reële getallen: 1.1 Rationale getallen: 1.1.1 Soorten getallen. Een natuurlijk getal is het resultaat van een tellg van een edig aantal dgen. Een geheel getal is het verschil
Nadere informatieIntroductie in R. http://www.math.montana.edu/stat/tutorials/r-intro.pdf http://www.math.montana.edu/stat/docs/splus_notes.ps
Introductie in R R is een programmeer taal met een groot aantal voorgeprogrammeerde statistische functies. Het is de open source versie van S-plus. Wij gebruiken R dan ook omdat het gratis is. Documentatie
Nadere informatieFormules Excel Bedrijfsstatistiek
Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor
Nadere informatieEen rappere Newton-Raphson
Een rappere Newton-Raphson Edward Omey EHSAL (Stormstraat, 000 Brussel) [edward.omey@ehsal.be]. Inleiding Bij vele kwantitatieve problemen is het nodig om nulpunten te bepalen van functies. Soms kunnen
Nadere informatieBasiskennis lineaire algebra
Basiskennis lineaire algebra Lineaire algebra is belangrijk als achtergrond voor lineaire programmering, omdat we het probleem kunnen tekenen in de n-dimensionale ruimte, waarbij n gelijk is aan het aantal
Nadere informatiete vermenigvuldigen, waarbij N het aantal geslagen Nederlandse munten en B het aantal geslagen buitenlandse munten zijn. Het resultaat is de vector
Les 3 Matrix product We hebben gezien hoe we matrices kunnen gebruiken om lineaire afbeeldingen te beschrijven. Om het beeld van een vector onder een afbeelding te bepalen hebben we al een soort product
Nadere informatie1.0 Voorkennis. Voorbeeld 1: Los op: 6x + 28 = 30 10x.
1.0 Voorkennis Voorbeeld 1: Los op: 6x + 28 = 30 10x. 6x + 28 = 30 10x +10x +10x 16x + 28 = 30-28 -28 16x = 2 :16 :16 x = 2 1 16 8 Stappenplan: 1) Zorg dat alles met x links van het = teken komt te staan;
Nadere informatieWI1808TH1/CiTG - Lineaire algebra deel 1
WI1808TH1/CiTG - Lineaire algebra deel 1 College 10 13 oktober 2016 1 Samenvatting Hoofdstuk 4.1 Een constante λ is een eigenwaarde van een n n matrix A als er een niet-nul vector x bestaat, zodat Ax =
Nadere informatieVierde huiswerkopdracht Lineaire algebra 1
Vierde huiswerkopdracht Lineaire algebra December, 00 Opgave : Voor positieve gehele getallen m, n schrijven we Mat(m n, R) voor de vectorruimte van alle m n matrices, met de gebruikelijke optelling en
Nadere informatie2. Het benaderen van nulpunten
Het benaderen van nulpunten Benaderen van vierkantswortels Als we met een numerieke rekenmachine benadering, 7 =,64575 7 berekenen, krijgen we als resultaat een Het numeriek benaderen kan met een recursieve
Nadere informatieNP2.5w3 Eigenwaarden. Eigenwaarden. VU Numeriek Programmeren 2.5. Charles Bos. Vrije Universiteit Amsterdam 1A april /26
1/26 Eigenwaarden VU Numeriek Programmeren 2.5 Charles Bos Vrije Universiteit Amsterdam c.s.bos@vu.nl, 1A40 22 april 2013 2/26 Overzicht Waarom? Voorbeelden Eigenwaarden/eigenvectoren Hoe vind ik ze? Polynoom
Nadere informatieTechnische Universiteit Delft. ANTWOORDEN van Tentamen Gewone differentiaalvergelijkingen, TW2030 Vrijdag 30 januari 2015,
Technische Universiteit Delft Faculteit EWI ANTWOORDEN van Tentamen Gewone differentiaalvergelijkingen, TW23 Vrijdag 3 januari 25, 4.-7. Dit tentamen bestaat uit 6 opgaven. Alle antwoorden dienen beargumenteerd
Nadere informatieLineaire Algebra voor W 2Y650
Lineaire Algebra voor W 2Y65 Docent: L Habets HG 89, Tel: 4-247423, Email: lcgjmhabets@tuenl http://wwwwintuenl/wsk/onderwijs/2y65 1 Herhaling: bepaling van eigenwaarden en eigenvectoren (1) Bepaal het
Nadere informatieHoofdstuk 3 : Determinanten
(A5D) Hoofdstuk 3 : Determinanten Les : Determinanten Definitie 3. De determinant van de [2 x 2]-matrix A = ( a c det(a) = ad bc. b ) is een getal met waarde d a b Notatie : det(a) = = ad bc c d Voorbeeld
Nadere informatieM1 Wiskundig taalgebruik en notaties
M1 Wiskundig taalgebruik en notaties Verzamelingenleer Verzameling = aantal objecten samengebracht tot een geheel - Lege verzameling = verzameling die geen elementen bevat A = - Singleton verzameling =
Nadere informatieMatrices en Stelsel Lineaire Vergelijkingen
Complexe Getallen Wat is de modulus van een complex getal? Hoe deel je twee complexe getallen? Wat is de geconjugeerde van een complex getal? Hoe kan je z z ook schrijven? Wat is de vergelijking van een
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Lineaire Algebra voor ST (2DS06) op , uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Lineaire Algebra voor ST (DS) op --9,.-7. uur. Aan dit tentamen gaat een MATLAB-toets van een half uur vooraf. Pas als de laptops
Nadere informatiePraktische informatie m.b.t. College Lineaire Algebra en Beeldverwerking Bachelor Informatica en Economie 2 e jaar Voorjaar semester 2013 Docent:
Praktische informatie m.b.t. College Lineaire Algebra en Beeldverwerking Bachelor Informatica en Economie 2 e jaar Voorjaar semester 2013 Docent: D.P. Huijsmans LIACS Universiteit Leiden College Lineaire
Nadere informatieUitwerkingen Lineaire Algebra I (wiskundigen) 22 januari, 2015
Uitwerkingen Lineaire Algebra I (wiskundigen) januari, 5 In deze uitwerkingen is hier en daar een berekening weggelaten (bijvoorbeeld het bepalen van de kern van een matrix) die uiteraard op het tentamen
Nadere informatieEen functie is een kant en klare formule. Via de knop Som in de groep Bewerken van het tabblad Start kun je een aantal veelgebruikte functies kiezen:
SAMENVATTING HOOFDSTUK 6 De functies Gemiddelde en Afronding Een functie is een kant en klare formule. Via de knop Som in de groep Bewerken van het tabblad Start kun je een aantal veelgebruikte functies
Nadere informatieJordan normaalvorm. Hoofdstuk 7
Hoofdstuk 7 Jordan normaalvorm Zoals we zagen hangt de matrix die behoort bij een lineaire transformatie af van de keuze van een basis voor de ruimte In dit hoofdstuk buigen we ons over de vraag of er
Nadere informatieExamenvragen Meetkunde en lineaire algebra Eerste examenperiode
Examenvragen Meetkunde en lineaire algebra Eerste examenperiode 2008-2009 Door rotatie van de rechte r die bepaald wordt door de punten P(3, 1, 2) en Q(1, 1, 2) omheen de rechte s die gaat door het punt
Nadere informatieMatrixoperaties. Definitie. Voorbeelden. Een matrix is een rechthoekig array van getallen, die kentallen of elementen heten.
Definitie Een matrix is een rechthoekig array van getallen, die kentallen of elementen heten. Voorbeelden De coëfficiëntenmatrix of aangevulde matrix bij een stelsel lineaire vergelijkingen. Een rij-echelonmatrix
Nadere informatieFLIPIT 5. (a i,j + a j,i )d i d j = d j + 0 = e d. i<j
FLIPIT JAAP TOP Een netwerk bestaat uit een eindig aantal punten, waarbij voor elk tweetal ervan gegeven is of er wel of niet een verbinding is tussen deze twee. De punten waarmee een gegeven punt van
Nadere informatieConflictmeetkunde, dominante termen, GGD s en = 1.
Conflictmeetkunde, dominante termen, GGD s en + =. Jan Stienstra Mathematisch Instituut, Universiteit Utrecht Nationale Wiskunde Dagen, 8+9 januari Samenvatting We laten zien hoe het platte plaatje van
Nadere informatieUniversiteit Utrecht Departement Informatica
Universiteit Utrecht Departement Informatica Uitwerking Tussentoets Optimalisering 20 december 206 Opgave. Beschouw het volgende lineair programmeringsprobleem: (P) Minimaliseer z = x 2x 2 + x 3 2x 4 o.v.
Nadere informatieModellen en Simulatie Speltheorie
Utrecht, 20 juni 2012 Modellen en Simulatie Speltheorie Gerard Sleijpen Department of Mathematics http://www.staff.science.uu.nl/ sleij101/ Program Optimaliseren Nul-som matrix spel Spel strategie Gemengde
Nadere informatieParagraaf 1.1 : Lineaire verbanden
Hoofdstuk 1 Formules, grafieken en vergelijkingen (H4 Wis B) Pagina 1 van 11 Paragraaf 1.1 : Lineaire verbanden Les 1 Lineaire verbanden Definitie lijn Algemene formule van een lijn : y = ax + b a = richtingscoëfficiënt
Nadere informatieLinalg.nb 1. Werk het notebook aandachtig door en maak de (genummerde) oefeningen aan het einde van elke sectie. Succes!
Linalg.nb Lineaire Algebra Andr Heck AMSTEL Instituut, Universiteit van Amsterdam Werk het notebook aandachtig door en maak de (genummerde) oefeningen aan het einde van elke sectie. Succes! Å Introductie
Nadere informatie1 Eigenwaarden en eigenvectoren
Eigenwaarden en eigenvectoren Invoeren van de begrippen eigenwaarde en eigenvector DEFINITIE Een complex (of reëel getal λ heet een eigenwaarde van de n n matrix A als er een vector x is met Ax = λx Dan
Nadere informatieEerste deeltentamen Lineaire Algebra A
Eerste deeltentamen Lineaire Algebra A 8 november 2011, 13u30-16u30 Bij dit tentamen mag het dictaat niet gebruikt worden. Schrijf op elk vel je naam, studnr en naam practicumleider (Victor Blasjo, Esther
Nadere informatieTentamen Lineaire Algebra B
Tentamen Lineaire Algebra B 29 juni 2012, 9-12 uur OPGAVEN Uitwerkingen volgen na de opgaven 1. Gegeven is de vectorruimte V = R[x] 2 van polynomen met reële coefficienten en graad 2. Op V hebben we een
Nadere informatieTENTAMEN LINEAIRE ALGEBRA 1A. maandag 16 december 2002, b. Bepaal een basis voor de rijruimte en voor de kolomruimte van A.
TENTAMEN LINEAIRE ALGEBRA 1A maandag 16 december 2002, 1000-1200 Coördinaten zijn gegeven tov een standaardbasis in R n 1 De matrix A en de vector b R 4 zijn gegeven door 1 0 1 2 0 1 1 4 3 2 A =, b = 0
Nadere informatie1.1 Tweedegraadsvergelijkingen [1]
1.1 Tweedegraadsvergelijkingen [1] Er zijn vier soorten tweedegraadsvergelijkingen: 1. ax 2 + bx = 0 (Haal de x buiten de haakjes) Voorbeeld 1: 3x 2 + 6x = 0 3x(x + 2) = 0 3x = 0 x + 2 = 0 x = 0 x = -2
Nadere informatie1.0 Voorkennis. Voorbeeld 1: Los op: 6x + 28 = 30 10x.
1.0 Voorkennis Voorbeeld 1: Los op: 6x + 28 = 30 10x. 6x + 28 = 30 10x +10x +10x 16x + 28 = 30-28 -28 16x = 2 :16 :16 x = 2 1 16 8 Stappenplan: 1) Zorg dat alles met x links van het = teken komt te staan;
Nadere informatieONBETWIST ONderwijs verbeteren met WISkunde Toetsen Voorbeeldtoetsen Lineaire Algebra Deliverable 3.10 Henk van der Kooij ONBETWIST Deliverable 3.
ONBETWIST ONderwijs verbeteren met WISkunde Toetsen Voorbeeldtoetsen Lineaire Algebra Deliverable 3.10 Henk van der Kooij ONBETWIST Deliverable 3.8 ONBETWIST ONderwijs verbeteren met WISkunde Toetsen Inleiding
Nadere informatieextra sommen bij Numerieke lineaire algebra
extra sommen bij Numerieke lineaire algebra 31 oktober 2012 1. Stel, we willen met een rekenapparaat (dat arithmetische bewerkingen uitvoert met een relatieve nauwkeurigheid ξ, ξ ξ) voor twee getallen
Nadere informatieSamenvatting Wiskunde Hoofdstuk 1 & 2 wisb
Samenvatting Wiskunde Hoofdstuk 1 & 2 wisb Samenvatting door J. 803 woorden 7 maart 2015 4,6 6 keer beoordeeld Vak Methode Wiskunde Getal en Ruimte Wiskunde Hoofdstuk 1 1 Lineaire verbanden Lineaire formule.
Nadere informatie1.1 Oefen opgaven. Opgave Van de lineaire afbeelding A : R 3 R 3 is gegeven dat 6 2, 5 4, A 1 1 = A = Bepaal de matrix van A.
. Oefen opgaven Opgave... Van de lineaire afbeelding A : R 3 R 3 is gegeven dat A = Bepaal de matrix van A. 4, 4 A =, A = 3 4. In de volgende opgave wordt het begrip injectiviteit en surjectiviteit van
Nadere informatieKlantonderzoek: statistiek!
Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van
Nadere informatieRekenen aan wortels Werkblad =
Rekenen aan wortels Werkblad 546121 = Vooraf De vragen en opdrachten in dit werkblad die vooraf gegaan worden door, moeten schriftelijk worden beantwoord. Daarbij moet altijd duidelijk zijn hoe de antwoorden
Nadere informatieComplexe eigenwaarden
Complexe eigenwaarden Tot nu toe hebben we alleen reële getallen toegelaten als eigenwaarden van een matrix Het is echter vrij eenvoudig om de definitie uit te breiden tot de complexe getallen Een consequentie
Nadere informatieEXCEL BASIS 2013
EXCEL BASIS 2013 WWW.I-LEARNING.BE - 4 FORMULE-INVOER ALS EXCEL EEN BEREKENING MOET DOEN, MOET JE EEN FORMULE OF EEN FUNCTIE INVOEREN 4.1 OPERATOREN + om op te tellen - om af te trekken / om te delen *
Nadere informatie