Efficiente benadering van Google s PageRank (Engelse titel: Efficient approximation of Google s PageRank)

Maat: px
Weergave met pagina beginnen:

Download "Efficiente benadering van Google s PageRank (Engelse titel: Efficient approximation of Google s PageRank)"

Transcriptie

1 Technische Universiteit Delft Faculteit Elektrotechniek, Wiskunde en Informatica Delft Institute of Applied Mathematics Efficiente benadering van Google s PageRank (Engelse titel: Efficient approximation of Google s PageRank) Verslag ten behoeve van het Delft Institute for Applied Mathematics als onderdeel ter verkrijging van de graad van BACHELOR OF SCIENCE in TECHNISCHE WISKUNDE door Erik Berkhof Delft, Nederland Juli 2009 Copyright c 2009 door Erik Berkhof. Alle rechten voorbehouden.

2

3 BSc verslag TECHNISCHE WISKUNDE Efficiente benadering van Google s PageRank (Engelse titel: Efficient approximation of Google s PageRank ) Erik Berkhof Technische Universiteit Delft Begeleider Prof.dr.ir. C. Vuik Overige commissieleden Dr.ir. H.X. Lin Dr. J.G. Spandaw Drs. A. Verweij Juli, 2009 Delft

4

5 Voorwoord Dit verslag is gemaakt in het kader van het bachelorproject van de studie Technische Wiskunde aan de Technische Universiteit Delft. Van alle richtingen die er zijn in de wiskunde, trok de numerieke wiskunde mij het meest aan, zeker toen ik zag dat het onderwerp Hoe werkt Google? bij de lijst van keuzen voor het project zat. Een uitgesproken moment om er achter te komen hoe de zoekmachine werkt waar ik wekelijks in zoek. Dankzij de duidelijke artikelen van Jan Brandts, werd het voor mij snel duidelijk wat het idee achter de Google lijst is. Tijdens colleges van numerieke wiskunde vakken wordt er voldoe tijd besteed aan verschille methoden om vergelijkingen van matrices op te lossen. Op het moment dat je verschille methoden kan toepassen in een onderzoek, krijg je een beter beeld wat de methoden doen en betekenen. De PageRank methode is een praktisch en leuk onderwerp om verschille methoden op uit te testen. Ten slotte wil ik Prof.dr.ir. K. Vuik bedanken voor het begeleiden tijdens het project en het tot stand komen van dit verslag. 4

6 Inhoudsopgave Inleiding 6. Opbouw Doelstellingen Voorkennis 7 3 PageRank model 8 3. PageRank Problemen in het model Creëren van de Google-matrix PageRank vector Verschille Methoden De Power Methode De Arnoldi Methode Jacobi en Gauss-Seidel Methode Methoden Combineren Numerieke Experimenten Gebruikte Data Internet Programma Vergelijken Resultaten van Methoden Resultaten Power Methode Resultaten Arnoldi Methode Resultaten Jacobi en Gauss-Seidel Testen van de Stop Criteria Combineren Power Methode en Arnoldi Methode Arnoldi Methode tot een gegeven ɛ Vast aantal stappen met de Arnoldi Methode Verklaren Resultaten Combinatie Methode Conclusie & Discussie Conclusie Discussie Bijlagen Creëren van een eigen matrix Maken van de Google matrix PageRank met de Power Methode PageRank met de Arnoldi methode PageRank met de Jacobi methode PageRank met de Gauss-Seidel methode Combinatie Arnoldi methode en Power methode met error Combinatie Arnoldi methode en Power methode met vast aantal iteraties

7 Inleiding De oorsprong van het internet, het ARPANET, komt uit 969 en werd gebruikt door het Amerikaanse leger. In 983 ging het ARPANET over op het internet zoals wij het kennen. Maar pas in de jaren negentig werd het bek bij het grote publiek en was het voor iedereen toegankelijk. Iedereen kon er zijn of haar informatie op kwijt, waardoor het overzicht al snel verdwenen was. Larry Page en Sergey Brin (twee studenten van Stanford University in de VS) maakten gebruik van de structuur van het internetweb om van deze onoverzichtelijke hoeveelheid informatie een lijst te creëren waarbij de pagina s gesorteerd worden op belangrijkheid. Dit bedrijf heet Google en werd in 998 opgericht. In 920 is het woord Googol ontstaan door de 9-jarige Milton Sirotta die van zijn vader de vraag kreeg om een term te verzinnen voor het getal Larry Page en Sergey Brin maakten voor hun lijst gebruik van een enorme matrix, namelijk het internetweb. Voor deze enorme berekening wilde ze ook een term gebruiken van een enorm getal, het getal Googol. Maar door een schrijffout is dit Google geworden en dit hebben ze zo gelaten. Het web wordt steeds groter en er zijn momenteel meer dan 0 miljard pagina s te vinden. Dit geeft grote berekeningen om de lijst samen te stellen. Een ander probleem is ook dat het web erg dynamisch is; bij ongeveer 40 procent van de pagina s verandert de inhoud binnen een week en 23 procent zelfs dagelijks. Hierdoor moet de lijst regelmatig vernieuwd worden. Google is momenteel één van de grootste zoekmachines op het internet en wordt wereldwijd goed bezocht. Voor bedrijven is het een goede advertentie om snel zichtbaar te zijn in de lijst en wenselijk om zo hoog mogelijk te staan. Larry Page en Sergey Brin kwamen er achter dat de lijst (PageRank) gemanipuleerd werd door bedrijven, waardoor niet meer de belangrijkste site bovenaan kwam. Dit ging ten koste van de geloofwaardigheid van Google, waardoor ze besloten hebben om elke andere aanpassing van Google achter gesloten deuren te houden. In mijn verslag gaan we uit van de PageRank methode die de twee studenten uit Stanford ooit bek hebben gemaakt.. Opbouw Google maakt gebruik van de PageRank methode. Hiervoor hebben we een vierkante matrix nodig die aan geeft hoe de pagina s naar elkaar linken via een hyperlink. Allereerst zullen we het model uitleggen van de PageRank. De matrix wordt opgesteld door middel van twee principes. Deze matrix heeft een paar vervele eigenschappen, die we kunnen omzeilen door er een zogenoemde Google-matrix van te maken. De Google-matrix is een volle, stochastische, vierkante matrix, die we kunnen gebruiken als een Markov-keten. We kunnen hier de powermethode op toepassen om de gewenste vector (de lijst) te verkrijgen. Dit principe zal uitlegd worden in hoofdstuk 3. Bij de methode wordt gebruik gemaakt van de Power methode. Dit is een lineair convergere methode die gebruik maakt van de eigenwaarden van de matrix. Er zijn meerdere methoden om het probleem van de PageRank op te lossen. De Arnoldi-methode is ook een methode die gebruik maakt van de bijbehore eigenwaarden en heeft de eigenschap sneller te convergeren dan de powermethode. Ondanks deze eigenschap is het geen methode om toe te passen op onze enorme matrix. Voor ons probleem zijn er ook methoden om lineaire stelsels op te lossen, Gauss-Seidel en Jacobi. Al deze methoden zullen we toelichten in hoofdstuk 4. 6

8 Vervolgens zullen we een aantal methoden combineren om de berekening van de PageRank te versnellen. Hiervan worden de resultaten gegeven..2 Doelstellingen Voor het creëren van de Google-matrix maken we gebruik van verwijzingen tussen pagina s en teleportatie (dit wordt uitgelegd in hoofdstuk 3). Hierin is α de kans dat er gebruik wordt gemaakt van verwijzingen. Deze α heeft effect op de convergentie van de Power methode. Dit zal mijn eerste deelvraag zijn: Welk effect heeft de waarde van α op de convergentie op de methode? De Google-matrix heeft eigenschappen die prettige voordelen hebben voor de methode. Eén van deze eigenschappen is dat de matrix een eigenwaarde van heeft. Dit is mijn tweede doelstelling: Bewijs dat de maximale eigenwaarden van de Google-Matrix gelijk is aan. Mijn uiteindelijke doel is om de methode sneller te laten werken. Dit zou kunnen met een andere methode, maar misschien ook door methoden te combineren. Hier volgt mijn doelvraag: Is er een andere methode of een combinatie van methoden zodat de PageRank sneller gevonden kan worden? 2 Voorkennis Voordat we starten met de uitleg van de PageRank methode, zijn er een paar stellingen en difinities die we moeten kennen. Stelling (Geršgorin Cirkel). [3](blz 06) Laat A een n n-matrix. De eigenwaarden van matrix A liggen in de vereniging van de cirkels z a ii n j=,j i a ij waarbij z C Stelling 2 (Dekpunt). [5] (blz 277) Als f is gedefinieerd op een interval I = f : [a, b] R en de volge twee condities gelden:. f(x) behoort tot I wanneer x behoort tot I. 2. Er bestaat een constante K met 0 < K < zodat voor elke u en v in I geldt f(u) f(v) K u v Dan heeft f een dekpunt r in I, f(r)=r. Als we starten met x 0 in I, dan convergeert de iteratie x i+ = f(x i ) naar r als i. Definitie (Convexe Verzameling). [6] (blz 42) Een verzameling F H heet convex wanneer geldt dat als x, y F, dan ( t)x + ty F voor alle 0 t. Definitie 2 (Stochastische Matrix). [4] (blz 29) Stel A is een n n matrix. A is stochastisch als de som van elke kolom gelijk is aan. Definitie 3 (Irreducibele- en reducibele Matrix). Laat A een stochastische n n- matrix. A is irreducibel als de lim n A n voor elk element A n ij > 0 met i, j n. Dit wil zeggen dat je van elk punt in de matrix een kans groter dan nul hebt om in elk ander punt te komen. A is reducibel als de lim n A n voor minstens één element A n ij = 0 met i, j n. 7

9 Definitie 4 (Primitieve Matrix). [] (blz 73) Een matrix A is een primitieve matrix wanneer A is een niet-negatieve irreducibele matrix is die alleen één eigenwaarde r = ρ(a) op de spectrale cirkel heeft. Definitie 5 (Reccurente state). [7] (blz 34) Een state i S heet recurrent als f i = P (X n = i voor een n X 0 = i) =. Definitie 6 (Periodieke en Aperiodieke Matrix). [7] (blz 50) Stel i is een recurrente state. De periode d(i) van de state i is de grootst gemeenschappelijke deler van de set T i = {n ; p [n] ii > 0}. Een reccurente state met periode heet aperiodiek. Stelling 3. [4] (blz 38) Als P een n n stochastische matrix is, dan is een eigenwaarde van P. Nu we deze stellingen en definities gezien hebben kunnen we beginnen met de uitleg van het PageRank model. 3 PageRank model Het doel van de PageRank methode is om een lijst te maken van belangrijke naar onbelangrijke pagina s. In de lijst heeft de belangrijkste pagina de hoogste PageRank waarde en de onbelangrijkste pagina de laagste PageRank waarde. Maar hoe komt een pagina aan de waarde? 3. PageRank De belangrijkheid van een pagina hangt af van de volge twee principes: Een bladzijde is belangrijk als er naar wordt verwezen door een andere belangrijke bladzijde. Als een bladzijde naar veel bladzijden verwijst, dan hebben zijn verwijzingen minder waarde dan als hij maar naar enkele bladzijden verwijst. Voor een pagina geeft een verwijzing van een belangrijke pagina, die maar weinig verwijzingen weggeeft, een grotere verhoging van de PageRank waarde. Een pagina is belangrijk als hij linken krijgt van andere belangrijke pagina s, maar die zijn weer belangrijk als ze weer linken krijgen van andere belangrijke pagina s. Dit leidt tot een cirkelredenatie en geeft nog geen waarden. Hieronder volgt de definitie van de PageRank. Definitie 7 (PageRank). Veronderstel dat bladzijde B i naar L i verschille bladzijden verwijst. De PageRank van pagina B i noemen we p i. Als B i verwijst naar B j, dan draagt B i een hoeveelheid p i L i bij aan de PageRank van B j, met i, j n, waar n het totaal aantal bladzijden is. Voor p i geldt n p i = c p k L k k= c = als B k een verbinding heeft met B i, zo niet dan c=0. Als B i niet verwijst naar B j, dan draagt B i niks bij aan de PageRank van B j. 8

10 Figuur : Een voorbeeld web met vier bladzijden Hoe dit werkt kunnen we het beste laten zien met een voorbeeld. Neem een web met maar vier bladzijden. Deze bladzijden linken met elkaar zoals hieronder. Als we kijken naar bladzijde B, dan krijgt hij een verwijzing van bladzijden B 3 en B 4. Omdat bladzijde B 3 naar totaal drie bladzijden verwijst, krijgt B een derde deel van de PageRank van bladzijde B 3. Bladzijde B 4 verwijst naar twee bladzijden, dus krijgt B de helft van de PageRank van bladzijde B 4. De PageRank p van B bepalen we als volgt: p = p p 4 2 Op dezelfde manier bepalen we de PageRank van de andere drie pagina s. p 2 = p 2 + p p 4 2, p 3 = p 2, p 4 = p 2 + p 3 3 Om deze gelijkheden op te lossen moeten we een matrix creëren, deze matrix noemen we de hyperlink matrix H, zodat er geldt: Hp = p De definitie voor de matrix H is als volgt. Definitie 8 (Hyperlink matrix H). Hyperlink matrix H is een n n-matrix, waarbij n het totaal aantal bladzijden is. H ij is de bijdrage van bladzijde B i aan bladzijde B j. Dit wordt als volgt gedefinieerd H ij = L i als bladzijde B i een verbinding heeft met bladzijde B j. Met L i het aantal linken die bladzijde B i geeft aan andere bladzijden. Zo niet dan H ij = 0. Een bladzijde mag naar zichzelf verwijzen, dus H ii hoeft niet gelijk te zijn aan 0. Eigenschappen matrix H. De som van elke kolom van H is of 0. n j= H ij = met i n als B i geen Dangling node (dit begrip wordt in de volge paragraaf uitgelegd). 2. De grootste eigenwaarde van H is maximaal. 3. H is een sparse matrix als n groot is. In de meeste gevallen verwijzen pagina s naar een handje vol andere bladzijden, waardoor het grootste deel van de matrix uit nullen zal bestaan. 9

11 Bewijs eigenschappen van matrix H. We hebben aangenomen dat bladzijde B i geen Dangling node is. L i is het aantal verbindingen die vanuit B i vertrekken. Dit betek dat er een L i aantal bladzijden B j zijn die een link hebben vanuit B i met i, j n. Als we kijken naar matrix H dan geldt H ij = L i als bladzijde B i en bladzijde B j een link heeft, anders is H ij = 0. Als we een kolom j van H optellen dan geldt dat n i= H kj = L i L i =. Dus elke kolom van matrix H is gelijk aan (Voor elke bladzijde die geen dangling node is). 2. Vanuit de lineaire algebra weten we dat det(a) = det(a T ) [4] (blz 269). Dan geldt ook dat de karakteristieke polynomen van A en A T gelijk zijn en zo ook de eigenwaarden van A en A T. We zoeken naar het gebied waar de eigenwaarden van H T zich bevinden. Hiervoor gebruiken we de stelling van Geršgorin. We onderscheiden hier twee mogelijkheden. Als eerste kijken we als H ii = 0 en daarna als H ii 0. We hebben een n n-matrix. De stelling luidt nu als volgt: z H ii n j=,j i H ij waarbij z C Neem H ii = 0. We hebben gezien dat elke som van een kolom van H gelijk is aan of 0, zodat geldt dat de rij van H T gelijk is aan of 0. Dan zien we met Geršgorin dat n j=,j i H ij gelijk is aan of 0. Neem H ii = c met 0 < c. In dat geval geldt: n j=,j i H ij = c. Als we Geršgorin invullen: n z c H ij = c j=,j i z Dus de eigenwaarden van H zijn kleiner of gelijk aan en dus is de grootste eigenwaarden maximaal. 3. Dit is geen eigenschap die per definitie geldt voor de PageRank, maar in ons web van het internet is dit het geval. Nu we de theorie van de hyperlink matrix H hebben gezien, gaan we een voorbeeld hiervan geven. Als we ons voorbeeldweb beschouwen, dan komt de hyperlink-matrix H er als volgt uit te zien: H = Kies een vector p = [p, p 2, p 3, p 4 ] T, met p 0. Als we nu de gelijkheid Hp = p lineair oplossen, dan krijgen we de volge waarden voor p: p = k

12 met de scalar k R. In ons voorbeeld is bladzijde vier de belangrijkste pagina, gevolgd door bladzijde twee, en de onbelangrijkste pagina is bladzijde drie. Hier is te zien dat bladzijde vier belangrijker is dan twee, ondanks het feit dat bladzijde twee meer linken krijgt. Dit komt doordat bladzijde twee, een belangrijke site, een link geeft aan bladzijde vier, zodat hij hoog komt te staan. Het voorbeeld kan goed opgelost worden door de veeg methode die we kennen uit de lineaire algebra. Er gaat veel tijd in zitten om de vergelijking Hp = p op te lossen als de matrix groter wordt. We kunnen hier gebruik maken van de eigenwaarden en eigenvectoren van de matrix. Eerst een beke definitie: Definitie 9. [4] (blz 249) Laat H een n n matrix zijn. Een scalar λ is een eigenwaarde van H als er een vector p bestaat ongelijk aan 0, zodat Hp = λp. De vector p is een eigenvector van H corresponder met eigenwaarde λ. Als de matrix H een eigenwaarde gelijk aan heeft,wat in ons voorbeeld zo is, dan hoeven we alleen de eigenvector hor bij deze eigenwaarde te vinden. In dat geval is λ = en geldt er Hp = p. Matrix H heeft als eigenschap dat zijn maximale waarde is, dus de grootste eigenwaarde kan ook kleiner zijn dan. Maar nu is de vraag of onze matrix altijd een eigenwaarde heeft van? Omdat de matrices te groot zijn om exact op te lossen, gebruiken een dekpunt iteratie. Bij het standaard model gebruiken we als dekpunt iteratie de Power methode. 3.2 Problemen in het model Het voorbeeld uit de vorige paragraaf is een voorbeeld wat een mooi resultaat heeft. Maar het PageRank model wat we nu hebben heeft te maken met de volge problemen:. Het web is onsamenhang. In dit geval is H een reducibele matrix. 2. De dekpunt iteratie convergeert niet naar een oplossing. 3. De gelijkheid Hp = p heeft als enige oplossing de triviale oplossing p = 0. Bij het eerste punt is voornamelijk de startvector het probleem. Op het moment dat een web onsamenhang is, is de oplossing afhankelijk van je startvector. In het web zijn er op dat moment twee of meer subwebben, die niet met elkaar corresponderen. Dit punt kan eenvoudig verholpen worden, maar is zeker een punt om rekening mee te houden. Het tweede probleem is iets wat bij grote matrices niet veel zal voorkomen, maar voornamelijk bij hele kleine matrices. Neem als web twee punten die alleen naar elkaar verwijzen. Dan zal de vergelijking er als volgt uitzien: [ 0 0 ] p = p Neem als startvector p 0 = [, 3] T, die we toepassen op de Power methode (deze methode wordt in Hoofdstuk 4 uitgelegd). Dan is de volge vector p = [3, ] T en de vector erna is p 2 = [, 3] T. Dit blijft zo doorgaan, waardoor de dekpunt iteratie niet convergeert naar een oplossing.

13 De eerste twee problemen zijn beide voor onze enorme Google lijst niet zo n groot probleem. Het derde probleem daarentegen is wel een groot probleem. We zijn opzoek naar een oplossing voor Hp = λp, waar de eigenwaarde λ =, zodat er geldt Hp = p. Op het moment dat er geen eigenwaarde gelijk aan aanwezig is, dan is de enige oplossing de triviale oplossing. Dit probleem komt voort uit Dangling nodes. Definitie 0 (Dangling nodes). Een Dangling node is een bladzijde die naar geen andere bladzijde verwijst. Als B i een Dangling node is, dan zijn al zijn bijdragen aan andere pagina s gelijk aan 0. In het world wide web zijn zo n 80% van de bladzijden Dangling nodes. Hierbij moet je denken aan pdf bestanden of plaatjes waarnaar verwezen kan worden, maar die zelf niet kunnen verwijzen. Dit betekent niet dat deze pagina s niet belangrijk zijn. In een pdf bestand staat vaak nuttige informatie, maar zou vanwege het feit dat het pdf bestand niet kan verwijzen geen belangrijke pagina zijn. Omdat een Dangling node nergens naar verwijst, betekent dit dat de kolom van deze pagina helemaal nul is. Dit betekent dat het geen stochastische matrix meer is en dat hij niet meer vanzelfsprek een eigenwaarde heeft van. Dit zou betekenen dat onze vergelijking alleen de triviale oplossing heeft. Hieronder geven we een voorbeeld. Neem het volge web: Figuur 2: Voorbeeld web met vier bladzijden, waarvan één dangling node In het voorbeeld zien we dat bladzijde twee geen verwijzingen heeft naar een andere bladzijde, bladzijde twee is een Dangling node. De matrix H is als volgt: H = De tweede kolom bestaat uit alleen nullen, waardoor je aan de matrix ziet dat we te maken hebben met een Dangling node. Voor dit probleem hebben we een oplossing gevonden. 2

14 3.3 Creëren van de Google-matrix De hyperlink-matrix H kunnen we zien als een kansmatrix hoe we ons door het web bewegen. Neem aan dat bladzijde B i naar L i andere bladzijden verwijst, waaronder bladzijde B j. Als we op bladzijde B i zijn aangekomen, dan is er de kans L i dat we naar bladzijde B j gaan. Stel dat bladzijde B j een Dangling node is, dan zou in het geval van matrix H de weg ophouden. Als je op internet op zo n pagina bent aangekomen is de enige mogelijkheid om weg te gaan, door in de navigatiebalk een ander adres in te vullen. Dit noemen we teleportatie. Definitie (Teleportatie). Als er niet via een verwijzing, maar via de navigatiebalk naar een andere pagina gaat, wordt dat teleportatie genoemd. Laat n het totaal aantal webpagina s. De kans dat een pagina naar een willekeurige pagina gaat is n voor elke pagina, inclusief naar zichzelf. We gaan er op dit moment vanuit dat er altijd gebruik wordt gemaakt van verwijzingen, behalve als we op een Dangling node terecht komen. Als we dit toepassen op ons web, dan betekent dit dat matrix H aangepast moet worden. De aangepaste matrix noemen we S. Definitie 2 (Matrix S). Matrix H bevat kolommen waar de som gelijk is aan nul. In dit geval is er sprake van een Dangling node. Laat n het totaal aantal webpagina s zijn. Matrix S wordt als volgt gedefinieerd: S = H + n β n i e T waarbij β i = vector als B i een Dangling node is, anders is β i = 0 vector met i n. Eigenschappen matrix S i=. De som van elke kolom van S is. n j= S ij = 2. Matrix S is een stochastiche matrix. 3. De grootste eigenwaarde van S is. Bewijs eigenschappen van matrix S. We hebben gezien dat de som van elke kolom van H gelijk is aan als deze kolom niet hoort bij een Dangling node. Deze rijen zijn in S onveranderd gebleven en hebben nog steeds een som van. De enige kolommen die zijn aangepast zijn die behoren aan Dangling nodes. De som van deze kolommen is in H gelijk aan 0. In matrix S is elk element in deze kolom veranderd in n. Omdat er naar n aantal pagina s wordt verwezen is de som van deze kolom n n =. Dus de som van elke kolom van S is. 2. Dit is een gevolg van eigenschap. Kijk hiervoor in de definities van Hoofdstuk Allereerst laten we zien dat de eigenwaarde maximaal kan zijn. Dit gaat op exact de zelfde wijze als bij matrix H. We weten dat geldt dat de karakteristieke polynomen van A en A T gelijk zijn en ook de eigenwaarden van A en A T. We zoeken naar het gebied waar de eigenwaarden van S T zich bevinden. Hiervoor gebruiken we de stelling van Geršgorin. We hebben een n n-matrix. De stelling luidt nu als volgt: z S T ii n j=,j i 3 S T ij waarbij z C

15 We hebben gezien dat elke som van een kolom van S gelijk is aan, geldt dat de rij van S T gelijk is aan. Neem S T ii = c met 0 c en c Q. In dat geval geldt: n j=,j i ST ij = c. Als we Geršgorin invullen: z c n j=,j i S T ij = c z Dus de eigenwaarden van S zijn kleiner of gelijk aan en dus is de grootste eigenwaarden maximaal. Maar nu de vraag of ook een eigenwaarde is van S, want in dat geval is ook gelijk de grootste eigenwaarde. We weten dat S een stochastische matrix is en dat elke kolom optelt tot. Neem een willekeurige vector x. Laat s(x) de som zijn van alle elementen van x. We maken de volge vermenigvuldiging Sx = y. Als we kijken naar het i de element van x, dan wordt de waarde van dit element verdeelt over de elementen van y. Dit komt omdat de som van elke kolom optelt tot. Dit gebeurt bij elk element van x. Omdat alle kolommen van S optellen tot, betekent dit dat de waarde van s(x) exact hetzelfde is als s(sx). Dus er geldt s(x) = s(sx). We weten dat er Sx = λx met λ een eigenwaarde van S en x de bijbehore eigenvector. Dan geldt er: s(sx) = s(λx) = λs(x) We willen weten wanneer s(x) = s(sx) geldt. Invullen geeft s(x) = λs(x). Deze vergelijking klopt als λ = of als s(x) = 0. We hebben gezien dat s(x) =, dus moet λ = zijn. Alle eigenwaarden λ en er is een eigenwaarde gelijk aan, dus is de grootste eigenwaarde. Als we dit toepassen op ons voorbeeld, dan krijgen we de volgens matrix S: S = In ons model gaan we er van uit dat we de verwijzingen gebruiken als deze er zijn. Een surfer zal niet alleen in het geval van Dangling nodes gebruik maken van de navigatiebalk. Er bestaat bij elke pagina een kans dat een persoon naar een andere willekeurige bladzijde gaat. Dit noemen we globale teleportatie. Definitie 3 (Globale Teleportatie). Laat 0 < α < de kans zijn dat er gebruik wordt gemaakt van links naar andere sites (behalve als we te maken hebben met een Dangling node). Dan is ( α) de kans dat er gebruik gemaakt wordt van de navigatiebalk. Om de globale teleportatie in ons model te verwerken hebben we nog een matrix nodig die weergeeft dat er alleen gebruik wordt gemaakt van teleportatie. Deze matrix noemen we de pure teleportatie matrix. 4

16 Definitie 4 (Pure Teleportatie-matrix T). Matrix T is een n n -matrix. In deze matrix wordt alleen gebruik gemaakt van teleportatie. Matrix T is als volgt gedefineerd: T = n eet =.... n Matrix T is een stochastische matrix. Als we weer kijken in ons voorbeeld, dan ziet onze teleportatie-matrix T er als volgt uit: T = Nu hebben we alle gegevens om ook de globale teleportatie in de matrix toe te voegen. matrix die we hier vervolgens uit krijgen noemen we de Google matrix G. De Definitie 5 (Google matrix G). Stel G is een n n -matrix. Laat α de kans zijn dat er via verwijzingen door het web wordt gelopen en dat ( α) de kans is dat dit gaat er door middel van teleportatie met 0 < α <. Matrix G is als volgt gedefinieerd: G = αs + ( α)t = α(h + n n β i e T ) + ( α)t i= waarbij β i = vector als B i een Dangling node is, anders is β i = 0 vector met i n. Hieronder geven we een aantal eigenschappen van matrix G, die daaronder aangetoond worden. Eigenschappen van de Google matrix G. De som van elke kolom van G is. matrix. n j= G ij =. Hierdoor is G ook een stochastische 2. Het is een convexe combinatie van twee stochastische matrices S en T. 3. G is irreducibel. 4. G is aperiodiek. 5. G is primitief, want G k > 0 voor een k (dit geldt namelijk voor k = ). Dit impliceert dat er een unieke p bestaat en de Power methode uitgevoerd op G garandeerd convergeerd naar deze vector. 6. G is een volle matrix. 7. De grootste eigenwaarde van G is. 5

17 Bewijs eigenschappen van matrix G. We hebben gezien dat de som van elke kolom van S gelijk is aan. De kolommen van matrix T tellen ook op tot. Matrix S wordt in de Google matrix vermenigvuldigd met de scalar α. Als we kijken naar de i de vector van matrix S, dan is deze na de vermenigvuldiging opgeteld α. Matrix T wordt in de Google matrix vermenigvuldigd met de scalar ( α). Als we kijken naar de i de kolomvector van matrix S, dan is deze na de vermenigvuldiging opgeteld ( α). In de Google matrix worden deze twee weer bij elkaar opgeteld, zodat de i de kolomvector opgeteld weer is. Dus elke kolom van matrix G is opgeteld en G is dus een stochastische matrix. 2. Dit is volgens de definitie Convex, die staat in Hoofdstuk Elke pagina is doormiddel van teleportatie verbonden met elke andere pagina. Hierdoor is de matrix irreducibel. 4. Door de teleportatie matrix T heeft elk element uit G ook een lus naar zichzelf. Hierdoor is G ii > 0 voor alle i. 5. Zie de stelling van primitieve matrix in Hoofdstuk Matrix T zorgt ervoor dat er vanaf elke bladzijde naar elke andere bladzijde kan worden gegaan. Matrix T is dus een volle matrix. Hierdoor is matrix G ook een volle matrix. 7. Allereerst laten we zien dat de eigenwaarden maximaal kan zijn. Dit gaat op exact dezelfde wijze als bij matrix H. We weten dat geldt dat de karakteristieke polynomen van A en A T gelijk zijn en ook de eigenwaarden van A en A T. We zoeken naar het gebied waar de eigenwaarden van G T zich bevinden. Hiervoor gebruiken we de stelling van Geršgorin. We weten dat matrix G irreducibel is en dat er dus geldt G ii 0. We hebben een n n- matrix. De stelling luidt nu als volgt: z G T ii n j=,j i G T ij waarbij z C Neem G T ii = c met 0 < c met c Q. In dat geval geldt: n j=,j i GT ij = c. Als we Geršgorin invullen: z c n j=,j i G T ij = c z Dus de eigenwaarden van G zijn kleiner of gelijk aan en is dus de grootste eigenwaarden maximaal. Maar nu de vraag of ook een eigenwaarde is van G, want in dat geval is ook gelijk de grootste eigenwaarde. We weten dat G een stochastische matrix is en dat elke kolom optelt tot. Neem een willekeurige vector x. Laat s(x) de som zijn van alle elementen van x. We maken de volge vermenigvuldiging Gx = y. Als we kijken naar het i de element van x, dan wordt 6

18 de waarde van dit element verdeelt over de elementen van y. Dit komt omdat de som van elke kolom optelt tot. Dit gebeurt bij elk element van x. Omdat alle kolommen van G optellen tot, betekent dit dat de waarde van s(x) exact hetzelfde is als s(gx). Dus er geldt s(x) = s(gx). We weten dat er Gx = λx met λ een eigenwaarde van G en x de bijbehore eigenvector. Dan geldt er: s(gx) = s(λx) = λs(x) We willen weten wanneer s(x) = s(gx) geldt. Invullen geeft s(x) = λs(x). Deze vergelijking klopt als λ = of als s(x) = 0. We hebben gezien dan s(x) =, dus moet λ = zijn. Alle eigenwaarden λ en er is een eigenwaarde gelijk aan, dus is de grootste eigenwaarde. 3.4 PageRank vector We weten nu dat matrix G een eigenwaarde heeft gelijk aan en er een niet triviale oplossing moet zijn van de vergelijking Gp = p. De matrix die Google gebruikt is te groot om op te lossen door de veeg methode. We kunnen gebruik maken van het feit dat de matrix een stochastische matrix is. Het probleem kunnen we als volgt schetsen. We verdelen een hoeveelheid mensen over alle pagina s. Al deze mensen gaan elke seconde naar een andere (of eventueel naar dezelfde) pagina. De kans hoe deze mensen zich door het web bewegen zijn aangegeven in de matrix G. Omdat we te maken hebben met een stochastische matrix zal dit leiden tot een stabiele oplossing, deze oplossing is de vector die we zoeken. Deze manier kunnen weergeven als de volge dekpunt iteratie: p (k+) = Gp (k) met gegeven startvector p (0) en k een niet negatief geheel getal. Deze methode wordt de Power methode genoemd (het is een simpele vorm van de Power methode). De Power methode zal in het volge hoofdstuk verder uitgediept worden. De vector p (k) zal na enige iteraties weinig veranderen en de vector p goed genoeg benaderd hebben, zodat we de PageRank vector p hebben gevonden. Definitie 6 (PageRank vector). De PageRank vector p R is de unieke vector die voeldoet aan Gp = p en e T p = Deze vector heeft aan elke pagina een waarde toegek. De pagina met de hoogste waarde is de belangrijkste pagina, tot aan de pagina met de laagste waarde die het onbelangrijkste is. Op dit moment hebben we onze lijst gevonden. We besteden nu aandacht aan de volge vragen:. Heeft de matrix G maar één eigenwaarde gelijk aan? 2. Zijn er niet meer vectoren die voldoen aan de vergelijking Gp = p? 3. Welke waarde heeft α en wat voor invloed heeft deze waarde? Allereerst zullen we laten dat er maar één eigenwaarde is in matrix G. 7

19 Stelling 4. [](blz 46) Als het spectrum van de stochastische matrix S is {, λ 2, λ 3,..., λ n }, dan is het spectrum van de Google matrix G = αs + ( α)t is {, αλ 2, αλ 3,..., αλ n }. Bewijs [2] (blz 2). We kiezen een reële n (n )-matrix X. Laat e = [... ] T R n. Definieer Z = (e X) een niet-singuliere matrix. Neem y R n en een reële n (n )-matrix Y zodat geldt (Z ) T = (y Y ). Nu volgt dat: ( Z y T Z = Y T ) ( y (e X) = T e y T X Y T e Y T X ) = ( 0 0 I Nu zien we dat er geldt dat y T e = en Y T e = 0. We weten dat er geldt: G = αs + ( α)t. Matrix T is symmetrisch en is te schrijven als T = n eet. Nu geldt dat: Z G T Z = αz S T Z + ( α)z T T Z = αz S T Z + ( α) n Z ee T Z Omdat bij de matrix S de kolommen optellen tot, geldt er dat S T e = e. Dit gebruiken we om Z S T Z te bepalen. ( y T Y T ) ( S T y T (e X) = Y T ( y T e y T S T ) X Y T e Y T S T = X ) ( (S T e S T y T X) = Y T ( y T S T X 0 Y T S T X ) ) (e S T X) = We weten vanuit de lineaire algebra dat S T dezelfde eigenwaarden heeft als Z S T Z [8] (blz 2). We zien hierboven dat er sowieso een eigenwaarde is gelijk aan, dus zien we dat Y T S T X de eigenwaarden λ 2,..., λ n heeft. Nu beschrijven we Z T Z : ( ) y T n Y T ee T (e X) = ( y T ) e n Y T (e T e e T X) = ( ) (n e T X) = e n 0 ( n e T ) ( ) X = n et X n Nu vullen we dit in: ( y α T S T X 0 Y T S T X Z G T Z = αz S T Z + ( α) n Z ee T Z = ) ( ) + ( α) n et X = 0 0 ) ( αy T S T X + n et X 0 αy T S T X We hebben gezien dat Y T S T X de eigenwaarden λ 2,..., λ n heeft. Er geldt dat Sx = λx, dus αsx = αλx. Dus heeft αy T S T X de eigenwaarden αλ 2,..., αλ n. Nu geldt ook dat de eigenwaarden van G gelijk zijn aan de eigenwaarden van Z G T Z. Aan de matrix Z G T Z is te zien dat een eigenwaarde is en de rest van de eigenwaarden zitten in αy T S T X. Dus de eigenwaarden van Z G T Z zijn, αλ 2,..., αλ n. Dit zijn ook de eigenwaarden van G. Dit is precies wat we wilde bewijzen. We zien dat de tweede eigenwaarde van G αλ 2 is. De eigenwaarden van S zijn maximaal, dus als de waarde van α > 0, dan is de tweede eigenwaarde van G kleiner dan. Dit betekent dat er maar één eigenwaarde is gelijk aan. Dat betekent ook dat er maar één eigenvector is, op een scalar na, die voldoet aan de vergelijking Gp = p. ) 8

20 Stelling 5. Laat 0 < α < en Gp = p, waar G de Google matrix is. Neem als startvector p 0, waarvan alle elementen groter zijn dan 0, waar we de Power methode op toepassen. Dan zijn alle elementen van de Google vector p groter dan 0. Met andere woorden, elke bladzijde heeft een positieve PageRank. Bewijs We hebben al gezegd dat we dit probleem kunnen zien als een Markov keten. Op elke bladzijde beginnen we met een hoeveelheid personen, die zich door het web bewegen. Hoe de mensen verdeeld zijn is onze startvector p 0. Het kan niet zo zijn dat een element van de startvector negatief is. Een bladzijde kan met een waarde van 0 beginnen, maar we kiezen ervoor dat bij elk element een positieve waarde is. Matrix G is een irreducibele stochastische matrix, wat betekent dat we vanaf elke pagina naar elke andere pagina toe kunnen. Alle elementen van G zijn groter dan nul. Bij elke vector p k met k > 0 is elk element in ieder geval niet negatief. Maar omdat je vanaf elke pagina een kans hebt om naar elke andere pagina te gaan, zal elke pagina een positieve waarde hebben. Dus is elke element in vector p positief. Stelling 6. Gegeven de Google matrix G, waarvoor geldt dat Gp = p. Laat r = µp een meervoud zijn van p met scalar µ R. Dan voldoet r aan de vergelijking Gr = r. Bewijs Laat r = µp met µ R. Gp = p µgp = µp Gµp = µp Gr = r Een veelvoud van p veranderd alle elementen met een scalar µ, maar er veranderd niets aan de volgorde van de waarden van hoog naar laag. Dit gebeurt wel als µ < 0, maar dit kunnen we verhelpen door de absolute waarde te gebruiken: G r = r. We zitten nog de vraag wat de waarde van α is. We gebruiken hier de Power methode, deze methode benadert de vector p. De covergentie snelheid van de Power methode is weer afhankelijk van de waarde van α. Stelling 7. Kies de parameter α zodanig dat 0 α <. Neem de dekpunt- iteratie waarvoor geldt p (k+) = Gp (k). Laat p (0) een willekeurige startvector zijn, waarbij de som van alle elementen moet zijn. Dan geldt p p (k) α k p p (0) Bewijs De snelheid van convergentie voor de Power methode is van de orde O = λ 2 λ k met k het aantal iteraties die zijn uitgevoerd, λ de grootste eigenwaarde en λ 2 de op een na grootste eigenwaarde [9] (blz 56). Bij matrix G is λ = en λ 2 α. Voor de orde van matrix G geldt dat O = λ 2 λ k ( α )k = α k. Dan geldt het volge: p p (k) α p p (k ) α 2 p p (k 2)... α k p p (0) En dit is precies wat we wilde bewijzen. 9

21 We zien nu dat de waarde van α ons informatie geeft over de snelheid van convergeren. De waarde van α ligt tussen 0 en. Als we α heel klein nemen, dus heel dicht bij 0, dan convergeert onze methode snel. Dit heeft als nadeel dat de informatie waar we mee begonnen, namelijk de hyperlink matrix H, haast geen invloed meer heeft op het model, terwijl het juist om die matrix gaat. In dit geval zouden we voornamelijk rekenen met teleportie, terwijl de principes van de PageRank gaan over de verwijzingen. We kunnen de waarde van α ook niet heel dicht bij nemen, want dan betekent het dat het heel lang kan duren voordat de methode de gewenste vector heeft gevonden. We moeten dus een compromis vinden tussen deze twee nadelen. Hier behoeven we verder niet naar te zoeken, want dit is door Google zelf al bek gemaakt. Google heeft bericht dat ze voor de waarde van α 0.85 gebruiken [](blz 59). 4 Verschille Methoden In het vorige hoofdstuk is te lezen dat de PageRank methode gebruik maakt van de dekpunt iteratie de Power methode. Hoe deze methode precies werkt zullen we in dit hoofdstuk uitgeleggen. Om de gewenste vector te vinden hebben ze er voor gekozen de Power methode toe te passen, maar er zijn meerdere methoden om dit probleem op te lossen. De Arnoldi methode maakt net als de Power methode gebruik van de eigenwaarden van de matrix. Deze methode zullen we ook beschrijven in dit hoofdstuk. De vergelijking Gp = p kunnen we ook oplossen door een methode te gebruiken die lineaire stelsels oplost. Er zullen hier twee methoden uitgelegd worden, Jacobi en Gauss-Seidel. Deze methoden kunnen ook gecombineerd worden, wat we verder zien in dit hoofdstuk. 4. De Power Methode De Power methode is één van de oudste methoden om van een matrix de grootste eigenwaarde en bijbehore eigenvector te vinden. Bij deze methode vermenigvuldigen we een startvector met de vierkante matrix zodat we een nieuwe vector krijgen. Met de nieuwe vector doen we dezelfde vermenigvuldiging zodat we weer een nieuwe vector krijgen. Het principe hierachter is dat de bijdrage van de eigenvectoren afhangen van de bijbehore eigenwaarden. Hoe groter de eigenwaarde, hoe groter de bijdrage is van de bijbehore eigenvector. Als we deze vermenigvuldiging meerdere keren toepassen, dan zal de eigenvector met de grootste eigenwaarde dominant worden, zodat we deze eigenvector benaderen en zo ook de grootste eigenwaarde. Hieronder het algoritme in R, omdat we hier niet met complexe getallen hebben te maken: De Power Methode p 0 R n is een gegeven startvector. for k =, 2,... z k = Gp k p k = z k / z k 2 normaliseren van de vector λ (k) = p T k z k 20

22 Deze methode benaderd na elke iteratie de grootste eigenwaarde met de bijbehore eigenvector. Als de fout klein genoeg is, is de benaderde grootste eigenwaarde λ (k) en de bijbehore eigenvector p k. De gevonden vector heeft een fout van orde: De power methode convergeert lineair. λ (k) λ = O ( λ 2 ) k λ Het is handig om de start vector p 0 een norm te geven van. Omdat we in ons geval de vector vermenigvuldigen met een stochastische matrix, zal elke vector die uit een volge iteratie volgt weer een norm hebben van. Doordat we dit weten kunnen we de power methode sneller laten werken. 4.2 De Arnoldi Methode Bij de Arnoldi methode [0] (blz 499)zijn we op zoek naar de Hessenberg herleiding Q T GQ = H, waarbij G onze google matrix is en de Hessenberg matrix H k de volge vorm heeft: h h h k h 2 h h 2k H k =. 0 h h k,k h kk met k N. Als Q is gegeven door de matrix Q = [q,..., q n ] en we vergelijken de kolommen van GQ = GH, dan geldt er: k+ Gq k = h ik q i met k n. We halen de laatste term die in de sommatie is verkregen eruit: met h ik = q T i Gq k. Als r k 0, dan: i= h k+,k q k+ = Gq k k h ik q i r k i= q k+ = r k /h k+,k waar geldt dat h k+,k = r k 2. Hieronder het algoritme: De Arnoldi Methode r 0 = q zodat q 2 = h 0 = k = 0 ɛ > 0 2

23 while (h k+,k 0) q k+ = r k /h k+,k k = k + r k = Gq k for i = : k h ik = q T i r k r k = r k h ik q i h k+,k = r k 2 Effectiever is λ (k) λ < ɛ met λ de grootste eigenwaarde van h k Wij bepalen λ (k) = maximale eigenwaarde van H k Hierbij vormen de Arnoldi vectoren, de kolommen van matrix Q k, een orthonormale basis voor de Krylov subspace K(G, q, k): Na de k de iteratie is de Arnoldi fractorizatie span{q,..., q k } = span{q, Gq,..., G k q }. met Q k = [q,..., q k ] en e T k = I k(:, k). GQ k = Q k H k + r k e T k Bij elke iteratie wordt de Hessenberg matrix groter. Laat matrix G een n n-matrix, dan is H k een k k-matrix met k n. Toch kunnen we uit matrix H k de gewenste eigenvector benaderen die hoort bij de grootste eigenwaarde van matrix G(in ons geval eigenwaarde ). Laat r k = 0, dan geldt dat λ(h k ) λ(g). Als y R k een eenheids 2-norm vector voor H k is en H k y = λy, dan: (G λi)x = (e T k y)r k Waar x = Q k y. In andere woorden: we zoeken van de Hessenberg de eigenvector die hoort bij de grootste eigenwaarde, een vector y van lengte k. Deze vector vermenigvuldigen we met de n k-matrix Q om vervolgens onze gewenste vector x te verkrijgen. In ons geval is dit de PageRank vector. Het voordeel van deze methode is dat hij stabiel is, dat we ons geen zorgen hoeven te maken om een break down (dat de methode halverwege niet meer verder kan) en dat hij erg snel convergeert. Het nadeel van deze methode is dat hij gebruik maakt van de Gram Schmidt orthogonalisatie, zodat het hoeveelheid werk kwadratisch toeneemt. Dat houdt in dat elke volge iteratie er steeds langer over doet, dat is bij enorme matrices, zoals de Goolge matrix, een vervele bijkomstigheid. We moeten er rekening mee houden dat het stop criterium (h k+,k 0) niet zo goed is, want in sommige gevallen bereik je deze nooit. Verstandiger is om er voor te kiezen dat het stop criterium is λ (k) λ < ɛ, met λ (k) de maximale eigenwaarde van H k, λ de maximale eigenwaarde van G, we weten dat deze waarde λ = en ɛ > 0. Sowieso is het niet mogelijk dat k > n, want dan zou de basis van de Hessenbergmatrix groter zijn dan de basis van matrix G. 22

24 4.3 Jacobi en Gauss-Seidel Methode Stel G R n,n waar G ii 0 met i =,..., n. Stel een vector b R n. We nemen als voorbeeld n = 3. G u + G 2 u 2 + G 3 u 3 = b () G 2 u + G 22 u 2 + G 23 u 3 = b 2 (2) G 3 u + G 32 u 2 + G 33 u 3 = b 3 (3) Als we deze omschrijven tot een uitdrukking in u, u 2 en u 3 krijgen we u = (b G 2 u 2 G 3 u 3 )/G (4) u 2 = (b 2 G 2 u G 23 u 3 )/G 22 (5) u 3 = (b 3 G 3 u G 23 u 2 )/G (6) Dit kunnen we oplossen met de Jacobi methode en de Gaus-Seidel methode. [] ( blz 43) Bij de Jacobi methode beginnen we met een willekeurige startvector u (0). Vervolgens voeren we herhaaldelijk de volge berekening uit: u i+ m = G mm (b m met m =,..., n. Hieronder volgt het algoritme: n k=,(k m) G mk u i k ) De Jacobi Methode Dit is voor één iteratie for m = : n q m = (b m k m G mku k )/G mm u = q Jacobi gebruikt de waarde van de startvector om vervolgens een nieuwe vector te verkrijgen. Deze nieuwe vector wordt gebruikt voor de volge iteratie. Gauss-Seidel past tijdens de iteratie de startvector aan, waardoor er steeds gebruik wordt gemaakt van de jongste waarden. Gauss-Seidel werkt als volgt: u i+ m = m (b m G mk u i+ G k mm k= met m =,..., n. Hieronder volgt het algoritme: n k=m+ G mk u i k ) 23

25 De Gauss-Seidel Methode Dit is voor één iteratie for m = : n u m = (b m k m G mku k )/G mm Bij beide methoden maken we gebruik van het volge stopcriterium [] (blz 47): b Gu i 2 b 2 ɛ Als we kijken naar onze vergelijking Gp = p, kennen we niet de waarden van de rechterkant van het = -teken, terwijl we deze wel nodig hebben in de methode. Dit kunnen we als volgt oplossen. Gp = p Gp p = 0 (G I)p = 0 met I de n n identiteits matrix en p 0. Laat G = G I en b = 0, dan hebben we de vergelijking G p = 0. Deze vergelijking kunnen we oplossen met Jacobi en met Gauss-Seidel. 4.4 Methoden Combineren De PageRank maakt gebruik van de Power methode om de vergelijking Gp = p op te lossen, dit ondanks het feit dat de Arnoldi methode sneller convergeert. We hebben ook gezien dat de Arnoldi methode bij elke volge iteratie er steeds langer over doet, dit is niet zo bij de Power methode. Omdat we te maken hebben met enorme matrices (de echte Google matrix is een vierkante matrix die meer dan 0 miljard lang is), is de Arnoldi methode op ten duur erg lang bezig met één iteratie. Zowel de Power, Jacobi en Gauss-Seidel methode convergeren lineair. Het is een optie om de Arnoldi methode te combineren met de Power methode. Omdat de Arnoldi methode bij de eerste paar iteratie gebruik maakt van een kleine Hessenberg matrix, is hij waarschijnlijk sneller dan de Power methode. Dit is ook het principe om de twee methoden te combineren. Deze combinatie kunnen we op twee manier toepassen. We kunnen gebruik maken van het feit dat de Arnoldi methode kleiner begint dan de Power methode. Stel dat Google matrix G een n n-matrix is met k < n met n, k N en we hebben een start vector p 0 zodat p 0 2 =. We beginnen met de Arnoldi methode, zodat hij met behulp van kleine berekeningen een start kan maken om de gewenste Google vector p te benaderen. Op het moment dat de Hessenberg matrix zodanig groot wordt dat de Arnoldi methode meer werk is dan dat de Power methode zou zijn, bepalen we de benaderde vector tot zover en gaan we verder met de Power methode. We weten dat de Arnoldi methode sneller convergeert dan de Power methode. Deze eigenschap kunnen we ook gebruiken om de twee methoden te combineren. Laat de Arnoldi methode zijn 24

26 werk doen totdat we onder een aangegeven error ɛ zijn gekomen. Vanaf daar bepalen we de vector p i en gaan we over op de Power methode. 5 Numerieke Experimenten Voordat we kunnen beginnen met het toepassen van de methoden, hebben we een goede dataset nodig. Deze data hebben we gevonden op het internet, met het programma surfer.m. Voordat we beginnen met het maken van de programma s, is het handig om te kijken welke programma s er al bestaan, of er nuttige informatie uit te halen valt. Zo n programma hebben we gevonden, waardoor we een goed beeld kregen hoe de methoden werken in de PageRank methode. In de derde paragraaf geven we de resultaten van onze eigen programma s. we bekijken hoe de vier methoden, die we in hoofdstuk 3 hebben besproken, werken met de PageRank methode. We zullen zien dat de Power methode als beste naar voren komt. Vervolgens bespreken we twee manieren om de Arnoldi methode en de Power methode te combineren, met de bijbehore resultaten. 5. Gebruikte Data Kleine voorbeelden, zoals die in Hoofdstuk 2 zijn gegeven, zijn handig om een beeld te krijgen hoe de methode werkt, maar niet groot genoeg om mee te experimenteren. Hiervoor moesten we testdata vinden van webpagina s hoe deze met elkaar linken, het liefst van bestaande bladzijden. Op het internet is een MATLAB bestand te vinden, surfer.m [2], die deze data kan bieden. Vanaf een willekeurige site wordt zichtbaar hoe linke pagina s weer naar andere pagina s verwijzen. Hierbij kan worden aangegeven tot hoeveel bladzijden we willen gaan. We krijgen vervolgens een matrix V (in het bestand noemen ze deze matrix G, maar dat kan voor verwarring zorgen) die weer geeft welke pagina s er met elkaar linken. Als bladzijde B i een verwijzing krijgt van B j, dan is V ij =. Krijgt bladzijde B i geen verwijzing van B j, dan is V ij = 0. Vanuit deze matrix kan de hyperlink matrix H gecreërd worden. Daarnaast geeft het programma een vector u, die weergeeft wat de naam is van elke pagina. De naam van bladzijde B i is weer gegeven bij u i. Het nadeel van het bestand surfer.m is dat het lastig is om enorme matrices te creëren. Op het moment dat er een pagina voorbij komt die het programma niet goed kan zien, of er klopte iets niet aan de paginia, stopte het programma met het zoeken van de andere linken. Hierdoor hebben we matrices gekregen van maximaal 30 sites, waarmee we hebben kunnen experimenteren. Omdat het experimenteren met grotere matrices een beter beeld geeft van de methode, hebben we naast het programma surfer.m zelf random data laten creëren. Hierbij werd rekening gehouden dat sites maar naar een handje vol pagina s verwijzen en dat er voor ongeveer 80% Dangling nodes aanwezig waren. Hiermee kunnen we een matrix V (net als in de eerste alinea van deze paragraaf) creëren, die vervolgens kan worden omgeschreven naar een hyperlink matrix H. We krijgen ook een vertor u, waarbij de namen worden weergegeven met cijfers van t/m n. 5.2 Internet Programma Het zelf schrijven van eigen programma s zorgt ervoor dat we een goed beeld krijgen hoe de methoden werken, hoe we ze kunnen beïnvloeden en kunnen combineren. Daarnaast is handig 25

27 om bestaande programma s te zoeken die een beeld geven van wat we kunnen verwachten van de gekozen methoden. Zo n programma hebben we gevonden die werkt onder MATLAB, pagerank.m [3]. De data die we hebben verkregen met surfer.m en de data van ons eigen programma, kunnen we toepassen op pagerank.m. Dit programma voert de PageRank methode uit met vijf verschille methoden: Power methode, Gauss-Seidel methode, Arnoldi methode, BiCGSTAB en GMRES8. De eerste drie methoden zijn besproken in hoofdstuk 3. De laatste twee methoden zullen we ons niet in verdiepen, maar dadelijk aan de resultaten is te zien dat deze methoden voor ons probleem niet nodig is om meer van te weten. Wil je hier meer over weten is dit te vinden in het boek van C.W.Oosterlee & C.Vuik []. Zowel de Power methode als de Arnoldi methode maken gebruik van de eigenwaarden van de matrix om zo de vergelijking Gp = λp met λ = op te lossen. De andere drie methoden lossen het stelsel (G I)p = 0 op. Als we kijken naar de uitkomsten van het programma, die hierna volgen, geeft het aan dat hij gebruik maakt van de Arnoldi8. Dit betekent dat één iteratie in het programma gelijk staat met acht iteraties zoals de Arnoldi methode in Hoofdstuk 4 staat beschreven. In sommige situaties geeft het programma aan dat de Arnoldi methode na één iteratie al klaar is, maar dit zijn eigenlijk acht iteraties. We moeten dit meenemen bij het bekijken van de resultaten. We voeren het programma uit op vier verschille grootte matrices. Hiervan geven we van alle vijf de methoden weer hoe lang de methoden erover doen en hoeveel iteraties zij nodig hebben. De methoden stoppen als hun stop criterium ɛ < 0 8 is bereikt. We bekijken een matrix, matrix, matrix en matrix, de gecreërd zijn met de random generator. De resultaten staan hieronder aangegeven in tabel t/m 4. Naam Algoritme Tijd (sec) Aantal Iteraties Power Methode Gauss-Seidel 0.02 Arnoldi BiCGSTAB GMRES Tabel : Toegepast op een matrix Naam Algoritme Tijd (sec) Aantal Iteraties Power Methode Gauss-Seidel Arnoldi BiCGSTAB GMRES Tabel 2: Toegepast op een matrix 26

Google s PageRank Algoritmes

Google s PageRank Algoritmes Technische Universiteit Delft Faculteit Elektrotechniek, Wiskunde en Informatica Bachelor Eind Project BSc Verslag TECHNISCHE WISKUNDE Google s PageRank Algoritmes Auteur: Alice Gianolio Onder begeleiding

Nadere informatie

4 Positieve en niet-negatieve lineaire algebra

4 Positieve en niet-negatieve lineaire algebra 4 Positieve en niet-negatieve lineaire algebra Positieve en niet-negatieve matrices komen veel voor binnen de stochastiek (zoals de PageRank matrix) en de mathematische fysica: temperatuur, dichtheid,

Nadere informatie

VIA PUZZELS GOOGLE LEREN

VIA PUZZELS GOOGLE LEREN GOOZZLES VIA PUZZELS GOOGLE LEREN Goozzles: Puzzles teaching you Google este bezoeker van Lowlands, Welkom in de wiskundetent, en in het bijzonder bij de UvA-workshop over de PageRank van Google. Met behulp

Nadere informatie

Modellen en Simulatie Lesliematrices Markovketens

Modellen en Simulatie Lesliematrices Markovketens Utrecht, 6 april 3 Modellen en Simulatie Lesliematrices Markovketens Program Meerdere leeftijdsklassen Leslie matrices Eigenwaarden en eigenvectoren Dominante eigenvector Irreducibele, a-periodieke matrices

Nadere informatie

Definities, stellingen en methoden uit David Poole s Linear Algebra A Modern Introduction - Second Edtion benodigd voor het tentamen Matrix Algebra 2

Definities, stellingen en methoden uit David Poole s Linear Algebra A Modern Introduction - Second Edtion benodigd voor het tentamen Matrix Algebra 2 Definities, stellingen en methoden uit David Poole s Linear Algebra A Modern Introduction - Second Edtion benodigd voor het tentamen Matrix Algebra 2 Bob Jansen Inhoudsopgave 1 Vectoren 3 2 Stelsels Lineaire

Nadere informatie

Toepassingen op differentievergelijkingen

Toepassingen op differentievergelijkingen Toepassingen op differentievergelijkingen We beschouwen lineaire differentievergelijkingen of lineaire recurrente betrekkingen van de vorm a 0 y k+n + a y k+n + + a n y k+ + a n y k = z k, k = 0,,, Hierbij

Nadere informatie

Over de wiskunde die Google groot maakte

Over de wiskunde die Google groot maakte Over de wiskunde die Google groot maakte Jan Brandts, Universiteit van Amsterdam januari 9 Samenvatting Google vindt in een oogwenk de meest relevante web-bladzijden over een bepaald onderwerp. Omdat het

Nadere informatie

Samenvatting Lineaire Algebra, periode 4

Samenvatting Lineaire Algebra, periode 4 Samenvatting Lineaire Algebra, periode 4 Hoofdstuk 5, Eigenwaarden en eigenvectoren 5.1; Eigenvectoren en eigenwaarden Definitie: Een eigenvector van een n x n matrix A is een niet nulvector x zodat Ax

Nadere informatie

Basiskennis lineaire algebra

Basiskennis lineaire algebra Basiskennis lineaire algebra Lineaire algebra is belangrijk als achtergrond voor lineaire programmering, omdat we het probleem kunnen tekenen in de n-dimensionale ruimte, waarbij n gelijk is aan het aantal

Nadere informatie

Toepassingen op discrete dynamische systemen

Toepassingen op discrete dynamische systemen Toepassingen op discrete dynamische systemen Een discreet dynamisch systeem is een proces van de vorm x k+ Ax k k met A een vierkante matrix Een Markov-proces is een speciaal geval van een discreet dynamisch

Nadere informatie

Google met energie. Michiel Hochstenbach Universitair Docent Scientific Computing Group Wiskunde Faculteit Wiskunde en Informatica

Google met energie. Michiel Hochstenbach Universitair Docent Scientific Computing Group Wiskunde Faculteit Wiskunde en Informatica Google met energie Michiel Hochstenbach Universitair Docent Scientific Computing Group Wiskunde Faculteit Wiskunde en Informatica www.win.tue.nl/ hochsten TU/e publieksdag 5 oktober 8 Google: wist U dat-jes...

Nadere informatie

De dimensie van een deelruimte

De dimensie van een deelruimte De dimensie van een deelruimte Een deelruimte van R n is een deelverzameling die op zichzelf ook een vectorruimte is. Ter herinnering : Definitie. Een deelverzameling H van R n heet een deelruimte van

Nadere informatie

8 De PageRank van Google: de grootste matrixberekening ooit

8 De PageRank van Google: de grootste matrixberekening ooit Googlen, googlede, gegoocheld? Vrijwel iedereen heeft wel eens met verbazing naar het scherm gestaard wanneer Google het voor elkaar kreeg om binnen een paar tellen het hele web te doorzoeken naar, bijvoorbeeld,

Nadere informatie

Tentamen lineaire algebra voor BWI maandag 15 december 2008, uur.

Tentamen lineaire algebra voor BWI maandag 15 december 2008, uur. Vrije Universiteit Amsterdam Faculteit der Exacte Wetenschappen Afdeling Wiskunde Tentamen lineaire algebra voor BWI maandag 5 december 8, 5.5-8. uur. ELK ANTWOORD DIENT TE WORDEN BEARGUMENTEERD. Er mogen

Nadere informatie

FLIPIT 5. (a i,j + a j,i )d i d j = d j + 0 = e d. i<j

FLIPIT 5. (a i,j + a j,i )d i d j = d j + 0 = e d. i<j FLIPIT JAAP TOP Een netwerk bestaat uit een eindig aantal punten, waarbij voor elk tweetal ervan gegeven is of er wel of niet een verbinding is tussen deze twee. De punten waarmee een gegeven punt van

Nadere informatie

Stelsels Vergelijkingen

Stelsels Vergelijkingen Hoofdstuk 5 Stelsels Vergelijkingen Eén van de motiverende toepassingen van de lineaire algebra is het bepalen van oplossingen van stelsels lineaire vergelijkingen. De belangrijkste techniek bestaat uit

Nadere informatie

Aanvullingen bij Hoofdstuk 8

Aanvullingen bij Hoofdstuk 8 Aanvullingen bij Hoofdstuk 8 8.5 Definities voor matrices De begrippen eigenwaarde eigenvector eigenruimte karakteristieke veelterm en diagonaliseerbaar worden ook gebruikt voor vierkante matrices los

Nadere informatie

Lineaire Algebra voor ST

Lineaire Algebra voor ST Lineaire Algebra voor ST docent: Judith Keijsper TUE, HG 9.31 email: J.C.M.Keijsper@tue.nl studiewijzer: http://www.win.tue.nl/wsk/onderwijs/2ds06 Technische Universiteit Eindhoven college 11 J.Keijsper

Nadere informatie

Tentamen lineaire algebra 2 18 januari 2019, 10:00 13:00 Uitwerkingen (schets)

Tentamen lineaire algebra 2 18 januari 2019, 10:00 13:00 Uitwerkingen (schets) Tentamen lineaire algebra 8 januari 9, : : Uitwerkingen (schets) Opgave. ( + punten) Gegeven is de matrix ( ) A =. (a) Bepaal een diagonaliseerbare matrix D en een nilpotente matrix N zodanig dat A = N

Nadere informatie

UITWERKINGEN 1 2 C : 2 =

UITWERKINGEN 1 2 C : 2 = UITWERKINGEN. De punten A, B, C, D in R zijn gegeven door: A : 0, B : Zij V het vlak door de punten A, B, C. C : D : (a) ( pt) Bepaal het oppervlak van de driehoek met hoekpunten A, B, C. Oplossing: De

Nadere informatie

3.2 Vectoren and matrices

3.2 Vectoren and matrices we c = 6 c 2 = 62966 c 3 = 32447966 c 4 = 72966 c 5 = 2632833 c 6 = 4947966 Sectie 32 VECTOREN AND MATRICES Maar het is a priori helemaal niet zeker dat het stelsel vergelijkingen dat opgelost moet worden,

Nadere informatie

Bekijk nog een keer het stelsel van twee vergelijkingen met twee onbekenden x en y: { De tweede vergelijking van de eerste aftrekken geeft:

Bekijk nog een keer het stelsel van twee vergelijkingen met twee onbekenden x en y: { De tweede vergelijking van de eerste aftrekken geeft: Determinanten Invoeren van het begrip determinant Bekijk nog een keer het stelsel van twee vergelijkingen met twee onbekenden x en y: { a x + b y = c a 2 a 2 x + b 2 y = c 2 a Dit levert op: { a a 2 x

Nadere informatie

TENTAMEN LINEAIRE ALGEBRA 1 donderdag 23 december 2004,

TENTAMEN LINEAIRE ALGEBRA 1 donderdag 23 december 2004, TENTAMEN LINEAIRE ALGEBRA donderdag december 004, 0.00-.00 Bij elke vraag dient een berekening of motivering worden opgeschreven. Het tentamen bestaat uit twee gedeelten: de eerste drie opgaven betreffen

Nadere informatie

Blokmatrices. , I 21 = ( 0 0 ) en I 22 = 1.

Blokmatrices. , I 21 = ( 0 0 ) en I 22 = 1. Blokmatrices Soms kan het handig zijn een matrix in zogenaamde blokken op te delen, vooral als sommige van deze blokken uit louter nullen bestaan Berekeningen kunnen hierdoor soms aanzienlijk worden vereenvoudigd

Nadere informatie

Internetwiskunde: over de webgraaf

Internetwiskunde: over de webgraaf Internetwiskunde: over de webgraaf Roel Niessen augustus 200 Bachelorscriptie Begeleider: dr. Jan Brandts KdV Instituut voor Wiskunde Faculteit der Natuurwetenschappen, Wiskunde en Informatica Universiteit

Nadere informatie

Lineaire Algebra (wi2142tn) Les 5: Determinanten. Joost de Groot Les 5. Faculteit EWI, Toegepaste Wiskunde. Technische Universiteit Delft

Lineaire Algebra (wi2142tn) Les 5: Determinanten. Joost de Groot Les 5. Faculteit EWI, Toegepaste Wiskunde. Technische Universiteit Delft Lineaire Algebra (wi2142tn) Les 5: Determinanten Joost de Groot Les 5 1 Technische Universiteit Delft Doel van deze les Determinanten ben je al tegengekomen bij de behandeling van het in en het uitwendig

Nadere informatie

Complexe eigenwaarden

Complexe eigenwaarden Complexe eigenwaarden Tot nu toe hebben we alleen reële getallen toegelaten als eigenwaarden van een matrix Het is echter vrij eenvoudig om de definitie uit te breiden tot de complexe getallen Een consequentie

Nadere informatie

Numerieke aspecten van de vergelijking van Cantor. Opgedragen aan Th. J. Dekker. H. W. Lenstra, Jr.

Numerieke aspecten van de vergelijking van Cantor. Opgedragen aan Th. J. Dekker. H. W. Lenstra, Jr. Numerieke aspecten van de vergelijking van Cantor Opgedragen aan Th. J. Dekker H. W. Lenstra, Jr. Uit de lineaire algebra is bekend dat het aantal oplossingen van een systeem lineaire vergelijkingen gelijk

Nadere informatie

WI1808TH1/CiTG - Lineaire algebra deel 1

WI1808TH1/CiTG - Lineaire algebra deel 1 WI1808TH1/CiTG - Lineaire algebra deel 1 College 10 13 oktober 2016 1 Samenvatting Hoofdstuk 4.1 Een constante λ is een eigenwaarde van een n n matrix A als er een niet-nul vector x bestaat, zodat Ax =

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Lineaire Algebra voor ST (2DS06) op , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Lineaire Algebra voor ST (2DS06) op , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Lineaire Algebra voor ST (DS) op --9,.-7. uur. Aan dit tentamen gaat een MATLAB-toets van een half uur vooraf. Pas als de laptops

Nadere informatie

MARKOV KETENS, OF: WAT IS DE KANS DAT MEVROUW DE VRIES NAT ZAL WORDEN?

MARKOV KETENS, OF: WAT IS DE KANS DAT MEVROUW DE VRIES NAT ZAL WORDEN? MARKOV KETENS, OF: WAT IS DE KANS DAT MEVROUW DE VRIES NAT ZAL WORDEN? KARMA DAJANI In deze lezing gaan we over een bijzonder model in kansrekening spreken Maar eerst een paar woorden vooraf Wat doen we

Nadere informatie

Kies voor i een willekeurige index tussen 1 en r. Neem het inproduct van v i met de relatie. We krijgen

Kies voor i een willekeurige index tussen 1 en r. Neem het inproduct van v i met de relatie. We krijgen Hoofdstuk 95 Orthogonaliteit 95. Orthonormale basis Definitie 95.. Een r-tal niet-triviale vectoren v,..., v r R n heet een orthogonaal stelsel als v i v j = 0 voor elk paar i, j met i j. Het stelsel heet

Nadere informatie

Vectorruimten en deelruimten

Vectorruimten en deelruimten Vectorruimten en deelruimten We hebben al uitgebreid kennis gemaakt met de vectorruimte R n We zullen nu zien dat R n slechts een speciaal geval vormt van het (veel algemenere begrip vectorruimte : Definitie

Nadere informatie

Algoritmes in ons dagelijks leven. Leve de Wiskunde! 7 April 2017 Jacobien Carstens

Algoritmes in ons dagelijks leven. Leve de Wiskunde! 7 April 2017 Jacobien Carstens Algoritmes in ons dagelijks leven Leve de Wiskunde! 7 April 2017 Jacobien Carstens Wat is een algoritme? Een algoritme is een eindige reeks instructies die vanuit een gegeven begintoestand naar een beoogd

Nadere informatie

Tentamen Lineaire Algebra

Tentamen Lineaire Algebra Tentamen Lineaire Algebra 3 januari 214, 8:3-11:3 uur - Bij dit tentamen mogen dictaten en boeken niet gebruikt worden - Een eenvoudige rekenmachine, hoewel niet nodig, is toegestaan, maar geen grafische

Nadere informatie

Eigenwaarden en eigenvectoren in R n

Eigenwaarden en eigenvectoren in R n Eigenwaarden en eigenvectoren in R n Als Ax λx voor zekere x in R n met x 0, dan is λ een eigenwaarde van A en x een eigenvector van A behorende bij λ. Een eigenvector is op een multiplicatieve constante

Nadere informatie

Jordan normaalvorm. Hoofdstuk 7

Jordan normaalvorm. Hoofdstuk 7 Hoofdstuk 7 Jordan normaalvorm Zoals we zagen hangt de matrix die behoort bij een lineaire transformatie af van de keuze van een basis voor de ruimte In dit hoofdstuk buigen we ons over de vraag of er

Nadere informatie

Het oplossen van stelsels lineaire vergelijkingen Wiskunde 2, 2DM60 College 2b

Het oplossen van stelsels lineaire vergelijkingen Wiskunde 2, 2DM60 College 2b Het oplossen van stelsels lineaire vergelijkingen Wiskunde 2, 2DM60 College 2b Ruud Pellikaan g.r.pellikaan@tue.nl /k 2014-2015 Lineaire vergelijking 2/64 DEFINITIE: Een lineaire vergelijking in de variabelen

Nadere informatie

1 Delers 1. 3 Grootste gemene deler en kleinste gemene veelvoud 12

1 Delers 1. 3 Grootste gemene deler en kleinste gemene veelvoud 12 Katern 2 Getaltheorie Inhoudsopgave 1 Delers 1 2 Deelbaarheid door 2, 3, 5, 9 en 11 6 3 Grootste gemene deler en kleinste gemene veelvoud 12 1 Delers In Katern 1 heb je geleerd wat een deler van een getal

Nadere informatie

1 Eigenwaarden en eigenvectoren

1 Eigenwaarden en eigenvectoren Eigenwaarden en eigenvectoren Invoeren van de begrippen eigenwaarde en eigenvector DEFINITIE Een complex (of reëel getal λ heet een eigenwaarde van de n n matrix A als er een vector x is met Ax = λx Dan

Nadere informatie

π* = π*(αs + (1 α)e) Thema Discrete wiskunde aflevering 1

π* = π*(αs + (1 α)e) Thema Discrete wiskunde aflevering 1 Thema Discrete wiskunde aflevering 1 De Top-10.000.000. Het thema van deze nieuwe, 48ste jaargang is discrete wiskunde. Discreet betekent hier dat het over telbare aantallen objecten gaat. Combinatoriek

Nadere informatie

ONBETWIST ONderwijs verbeteren met WISkunde Toetsen Voorbeeldtoetsen Lineaire Algebra Deliverable 3.10 Henk van der Kooij ONBETWIST Deliverable 3.

ONBETWIST ONderwijs verbeteren met WISkunde Toetsen Voorbeeldtoetsen Lineaire Algebra Deliverable 3.10 Henk van der Kooij ONBETWIST Deliverable 3. ONBETWIST ONderwijs verbeteren met WISkunde Toetsen Voorbeeldtoetsen Lineaire Algebra Deliverable 3.10 Henk van der Kooij ONBETWIST Deliverable 3.8 ONBETWIST ONderwijs verbeteren met WISkunde Toetsen Inleiding

Nadere informatie

Uitwerkingen tentamen Lineaire Algebra 2 16 januari, en B =

Uitwerkingen tentamen Lineaire Algebra 2 16 januari, en B = Uitwerkingen tentamen Lineaire Algebra 2 16 januari, 215 Deze uitwerkingen zijn niet volledig, maar geven het idee van elke opgave aan. Voor een volledige oplossing moet alles ook nog duidelijk uitgewerkt

Nadere informatie

Hoofdstuk 3 : Determinanten

Hoofdstuk 3 : Determinanten (A5D) Hoofdstuk 3 : Determinanten Les : Determinanten Definitie 3. De determinant van de [2 x 2]-matrix A = ( a c det(a) = ad bc. b ) is een getal met waarde d a b Notatie : det(a) = = ad bc c d Voorbeeld

Nadere informatie

WI1808TH1/CiTG - Lineaire algebra deel 1

WI1808TH1/CiTG - Lineaire algebra deel 1 WI1808TH1/CiTG - Lineaire algebra deel 1 College 6 26 september 2016 1 Hoofdstuk 3.1 en 3.2 Matrix operaties Optellen van matrices Matrix vermenigvuldigen met een constante Matrices vermenigvuldigen Machten

Nadere informatie

Unitaire en Hermitese transformaties

Unitaire en Hermitese transformaties Hoofdstuk 11 Unitaire en Hermitese transformaties We beschouwen vervolgens lineaire transformaties van reële en complexe inproductruimten die aan extra eigenschappen voldoen die betrekking hebben op het

Nadere informatie

Uitwerkingen Lineaire Algebra I (wiskundigen) 22 januari, 2015

Uitwerkingen Lineaire Algebra I (wiskundigen) 22 januari, 2015 Uitwerkingen Lineaire Algebra I (wiskundigen) januari, 5 In deze uitwerkingen is hier en daar een berekening weggelaten (bijvoorbeeld het bepalen van de kern van een matrix) die uiteraard op het tentamen

Nadere informatie

Determinanten. Definities en eigenschappen

Determinanten. Definities en eigenschappen Determinanten Definities en eigenschappen Definities (korte herhaling) Determinant van een 2x2-matrix: a b ad bc c d S. Mettepenningen Determinanten 2 Definities (korte herhaling) Determinant van een 3x3-matrix:

Nadere informatie

Stelsels lineaire vergelijkingen

Stelsels lineaire vergelijkingen Een matrix heeft een rij-echelon vorm als het de volgende eigenschappen heeft: 1. Alle nulrijen staan als laatste rijen in de matrix. 2. Het eerste element van een rij dat niet nul is, ligt links ten opzichte

Nadere informatie

Geef niet alleen antwoorden, maar bewijs al je beweringen.

Geef niet alleen antwoorden, maar bewijs al je beweringen. Tentamen Lineaire Algebra maandag 3--27, 3.3-6.3 uur Het is niet toegestaan telefoons, computers, grafische rekenmachines (wel een gewone), dictaten, boeken of aantekeningen te gebruiken. Schrijf op elk

Nadere informatie

Matrixoperaties. Definitie. Voorbeelden. Een matrix is een rechthoekig array van getallen, die kentallen of elementen heten.

Matrixoperaties. Definitie. Voorbeelden. Een matrix is een rechthoekig array van getallen, die kentallen of elementen heten. Definitie Een matrix is een rechthoekig array van getallen, die kentallen of elementen heten. Voorbeelden De coëfficiëntenmatrix of aangevulde matrix bij een stelsel lineaire vergelijkingen. Een rij-echelonmatrix

Nadere informatie

Antwoorden op de theoretische vragen in de examen voorbereiding

Antwoorden op de theoretische vragen in de examen voorbereiding Antwoorden op de theoretische vragen in de examen voorbereiding Theorie vraag Zij A een m n-matrix. Geef het verband tussen de formule voor de dimensie d van een niet-strijdig stelsel, d = n rang (A) (zie

Nadere informatie

Wetenschappelijk Rekenen

Wetenschappelijk Rekenen Wetenschappelijk Rekenen Examen - Bacheloropleiding informatica Oefeningen 3 september 204. Beschouw de matrix A = 8 6 3 5 7 4 9 2 Deze matrix heeft 5 als dominante eigenwaarde. We proberen deze eigenwaarde

Nadere informatie

Tentamen Lineaire Algebra B

Tentamen Lineaire Algebra B Tentamen Lineaire Algebra B 29 juni 2012, 9-12 uur OPGAVEN Uitwerkingen volgen na de opgaven 1. Gegeven is de vectorruimte V = R[x] 2 van polynomen met reële coefficienten en graad 2. Op V hebben we een

Nadere informatie

Eindtermen Lineaire Algebra voor E vor VKO (2DE01)

Eindtermen Lineaire Algebra voor E vor VKO (2DE01) Eindtermen Lineaire Algebra voor E vor VKO (2DE01) dr. G.R. Pellikaan 1 Voorkennis Middelbare school stof van wiskunde en natuurkunde. Eerste gedeelte (Blok A) van Lineaire Algebra voor E (2DE04). 2 Globale

Nadere informatie

Uitwerkingen tentamen Lineaire Algebra 2 16 januari, en B =

Uitwerkingen tentamen Lineaire Algebra 2 16 januari, en B = Uitwerkingen tentamen Lineaire Algebra 2 16 januari, 2015 Deze uitwerkingen zijn niet volledig, maar geven het idee van elke opgave aan Voor een volledige oplossing moet alles ook nog duidelijk uitgewerkt

Nadere informatie

Tentamen lineaire algebra voor BWI dinsdag 17 februari 2009, uur.

Tentamen lineaire algebra voor BWI dinsdag 17 februari 2009, uur. Vrije Universiteit Amsterdam Faculteit der Exacte Wetenschappen Afdeling Wiskunde Tentamen lineaire algebra voor BWI dinsdag 7 februari 9, 8.-.5 uur. ELK ANTWOORD DIENT TE WORDEN BEARGUMENTEERD. Er mogen

Nadere informatie

Eigenwaarden en Diagonaliseerbaarheid

Eigenwaarden en Diagonaliseerbaarheid Hoofdstuk 3 Eigenwaarden en Diagonaliseerbaarheid 31 Diagonaliseerbaarheid Zoals we zagen hangt de matrix die behoort bij een lineaire transformatie af van de keuze van een basis voor de ruimte In dit

Nadere informatie

Bilineaire Vormen. Hoofdstuk 9

Bilineaire Vormen. Hoofdstuk 9 Hoofdstuk 9 Bilineaire Vormen In dit hoofdstuk beschouwen we bilineaire vormen op een vectorruimte V nader. Dat doen we onder andere om in het volgende hoofdstuk de begrippen afstand en lengte in een vectorruimte

Nadere informatie

P (X n+1 = j X n = i, X n 1,..., X 0 ) = P (X n+1 = j X n = i). P (X n+1 = j X n = i) MARKOV KETENS. Definitie van Markov keten:

P (X n+1 = j X n = i, X n 1,..., X 0 ) = P (X n+1 = j X n = i). P (X n+1 = j X n = i) MARKOV KETENS. Definitie van Markov keten: Definitie van Markov keten: MARKOV KETENS Een stochastisch proces {X n, n 0} met toestandsruimte S heet een discrete-tijd Markov keten (DTMC) als voor alle i en j in S geldt P (X n+ = j X n = i, X n,...,

Nadere informatie

Lineaire Algebra en Vectorcalculus 2DN60 College 5.a Basis en dimensie

Lineaire Algebra en Vectorcalculus 2DN60 College 5.a Basis en dimensie Lineaire Algebra en Vectorcalculus 2DN60 College 5.a Basis en dimensie Ruud Pellikaan g.r.pellikaan@tue.nl /k 205-206 Definitie opspansel 2/35 Stel S = {v,..., v n } is een deelverzameling van de vectorruimte

Nadere informatie

De inverse van een matrix

De inverse van een matrix De inverse van een matrix Laat A een n n matrix zijn. Veronderstel dat de matrixvergelijking A X = I n de oplossing X = C heeft. Merk op dat [ A I n ] rijoperaties [ I n C ] [ I n A] inverse rijoperaties

Nadere informatie

Examenvragen Hogere Wiskunde I

Examenvragen Hogere Wiskunde I 1 Examenvragen Hogere Wiskunde I Vraag 1. Zij a R willekeurig. Gegeven is dat voor alle r, s Q geldt dat a r+s = a r a s. Bewijs dat voor alle x, y R geldt dat a x+y = a x a y. Vraag 2. Gegeven 2 functies

Nadere informatie

extra sommen bij Numerieke lineaire algebra

extra sommen bij Numerieke lineaire algebra extra sommen bij Numerieke lineaire algebra 31 oktober 2012 1. Stel, we willen met een rekenapparaat (dat arithmetische bewerkingen uitvoert met een relatieve nauwkeurigheid ξ, ξ ξ) voor twee getallen

Nadere informatie

Lineaire Algebra voor W 2Y650

Lineaire Algebra voor W 2Y650 Lineaire Algebra voor W 2Y65 Docent: L Habets HG 89, Tel: 4-247423, Email: lcgjmhabets@tuenl http://wwwwintuenl/wsk/onderwijs/2y65 1 Herhaling: bepaling van eigenwaarden en eigenvectoren (1) Bepaal het

Nadere informatie

Lineaire Algebra voor ST

Lineaire Algebra voor ST Lineaire Algebra voor ST docent: Judith Keijsper TUE, HG 9.3 email: J.C.M.Keijsper@tue.nl studiewijzer: http://www.win.tue.nl/wsk/onderwijs/2ds6 Technische Universiteit Eindhoven college 2 J.Keijsper (TUE)

Nadere informatie

Geadjungeerde en normaliteit

Geadjungeerde en normaliteit Hoofdstuk 12 Geadjungeerde en normaliteit In het vorige hoofdstuk werd bewezen dat het voor het bestaan van een orthonormale basis bestaande uit eigenvectoren voldoende is dat T Hermites is (11.17) of

Nadere informatie

3. Structuren in de taal

3. Structuren in de taal 3. Structuren in de taal In dit hoofdstuk behandelen we de belangrijkst econtrolestructuren die in de algoritmiek gebruikt worden. Dit zijn o.a. de opeenvolging, selectie en lussen (herhaling). Vóór we

Nadere informatie

Lineaire Algebra voor ST

Lineaire Algebra voor ST Lineaire Algebra voor ST docent: Judith Keijsper TUE, HG 9.3 email: J.C.M.Keijsper@tue.nl studiewijzer: http://www.win.tue.nl/wsk/onderwijs/2ds6 Technische Universiteit Eindhoven college 6 J.Keijsper (TUE)

Nadere informatie

Hints en antwoorden bij de vragen van de cursus Lineaire Algebra en Meetkunde

Hints en antwoorden bij de vragen van de cursus Lineaire Algebra en Meetkunde Hints en antwoorden bij de vragen van de cursus Lineaire Algebra en Meetkunde Ik heb de vragen die in de nota s staan en de vragen van de samenvattingen samengebracht in deze tekst en voorzien van hints

Nadere informatie

De wiskunde van computerberekeningen. Jan Brandts Korteweg-de Vries Instituut voor Wiskunde Universiteit van Amsterdam.

De wiskunde van computerberekeningen. Jan Brandts Korteweg-de Vries Instituut voor Wiskunde Universiteit van Amsterdam. De wiskunde van computerberekeningen Jan Brandts Korteweg-de Vries Instituut voor Wiskunde Universiteit van Amsterdam 04 november 2015 Pluto en Charon New Horizons, launch date 19 January, 2006, speed

Nadere informatie

Lineaire vergelijkingen II: Pivotering

Lineaire vergelijkingen II: Pivotering 1/25 Lineaire vergelijkingen II: Pivotering VU Numeriek Programmeren 2.5 Charles Bos Vrije Universiteit Amsterdam c.s.bos@vu.nl, 1A40 15 april 2013 2/25 Overzicht Pivotering: Methodes Norm en conditionering

Nadere informatie

Functies van vectoren

Functies van vectoren Functies van vectoren Alexander Ly Psychological Methods University of Amsterdam 15 September 2014 Overview 1 Notatie 2 Overview 1 Notatie 2 Matrices Een matrix schrijven we vaak met een hoofdletter A.

Nadere informatie

Lineaire Algebra voor ST

Lineaire Algebra voor ST Lineaire Algebra voor ST docent: Judith Keijsper TUE, HG 9.31 email: J.C.M.Keijsper@tue.nl studiewijzer: http://www.win.tue.nl/wsk/onderwijs/2ds06 Technische Universiteit Eindhoven college 3 J.Keijsper

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Lineaire Algebra voor ST (DS6) op -4-, 4.-7. uur. Opgave Gegeven is het volgende stelsel lineaire vergelijkingen met parameters

Nadere informatie

Tentamen Lineaire Algebra UITWERKINGEN

Tentamen Lineaire Algebra UITWERKINGEN Tentamen Lineaire Algebra 29 januari 29, 3:3-6:3 uur UITWERKINGEN Gegeven een drietal lijnen in R 3 in parametervoorstelling, l : 2, m : n : ν (a (/2 pt Laat zien dat l en m elkaar kruisen (dat wil zeggen

Nadere informatie

Grafieken van veeltermfuncties

Grafieken van veeltermfuncties (HOOFDSTUK 43, uit College Mathematics, door Frank Ayres, Jr. and Philip A. Schmidt, Schaum s Series, McGraw-Hill, New York; dit is de voorbereiding voor een uit te geven Nederlandse vertaling). Grafieken

Nadere informatie

Matrices en Grafen (wi1110ee)

Matrices en Grafen (wi1110ee) Matrices en Grafen (wi1110ee) Electrical Engineering TUDelft September 1, 2010 September 1, 2010 Inleiding Mekelweg 4, kamer 4.240 tel : (015 27)86408 e-mail : I.A.M.Goddijn@TUDelft.nl homepage : http:

Nadere informatie

Lineaire algebra I (wiskundigen)

Lineaire algebra I (wiskundigen) Lineaire algebra I (wiskundigen) Toets, donderdag 22 oktober, 2009 Oplossingen (1) Zij V het vlak in R 3 door de punten P 1 = (1, 2, 1), P 2 = (0, 1, 1) en P 3 = ( 1, 1, 3). (a) Geef een parametrisatie

Nadere informatie

Lineaire Algebra voor ST

Lineaire Algebra voor ST Lineaire Algebra voor ST docent: Judith Keijsper TUE, HG 93 email: JCMKeijsper@tuenl studiewijzer: http://wwwwintuenl/wsk/onderwijs/2ds06 Technische Universiteit Eindhoven college 3 JKeijsper (TUE) Lineaire

Nadere informatie

Lineaire Algebra Een Samenvatting

Lineaire Algebra Een Samenvatting Lineaire Algebra Een Samenvatting Definitie: Een (reële) vectorruimte is een verzameling V voorzien van een additieve en multiplicatieve operatie, zodat (a) u V en v V u + v V, (1) u + v = v + u voor alle

Nadere informatie

Lineaire Algebra voor W 2Y650

Lineaire Algebra voor W 2Y650 Lineaire Algebra voor W 2Y650 Docent: L. Habets HG 8.09, Tel: 040-2474230, Email: l.c.g.j.m.habets@tue.nl http://www.win.tue.nl/wsk/onderwijs/2y650 1 Eigenwaarden en eigenvectoren Zij A een n n matrix.

Nadere informatie

Tentamen lineaire algebra 2 17 januari 2014, 10:00 13:00 zalen 174, 312, 412, 401, 402

Tentamen lineaire algebra 2 17 januari 2014, 10:00 13:00 zalen 174, 312, 412, 401, 402 Tentamen lineaire algebra 2 17 januari 214, 1: 13: zalen 174, 312, 412, 41, 42 Dit zijn geen complete uitwerkingen. Er is dus geen garantie dat het overschrijven met andere getallen voldoende is voor huiswerk

Nadere informatie

Determinanten. , dan is det A =

Determinanten. , dan is det A = Determinanten We hebben al gezien : ( a b Definitie Als A c d, dan is det A a c b d ad bc Als A een ( -matrix is, dan geldt : A is inverteerbaar det A 0 Definitie Als A (a ij een (m n-matrix is, dan is

Nadere informatie

Lights Out. 1 Inleiding

Lights Out. 1 Inleiding Lights Out 1 Inleiding Het spel Lights Out is een elektronisch spel dat gelanceerd werd in 1995 door Tiger Electronics. Het originele spel heeft een bord met 25 lampjes in een rooster van 5 rijen en 5

Nadere informatie

Overzicht Fourier-theorie

Overzicht Fourier-theorie B Overzicht Fourier-theorie In dit hoofdstuk geven we een overzicht van de belangrijkste resultaten van de Fourier-theorie. Dit kan als steun dienen ter voorbereiding op het tentamen. Fourier-reeksen van

Nadere informatie

Tentamen Lineaire Algebra 1 (Wiskundigen)

Tentamen Lineaire Algebra 1 (Wiskundigen) Tentamen Lineaire Algebra Wiskundigen Donderdag, 23 januari 24,.-3. Geen rekenmachines. Motiveer elk antwoord.. Voor alle reële getallen a definiëren we de matrix C a als a C a = a 2. a Verder definiëren

Nadere informatie

Uitwerkingen tentamen lineaire algebra 2 13 januari 2017, 10:00 13:00

Uitwerkingen tentamen lineaire algebra 2 13 januari 2017, 10:00 13:00 Uitwerkingen tentamen lineaire algebra 3 januari 07, 0:00 3:00 Hint: Alle karakteristiek polynomen die je nodig zou kunnen hebben, hebben gehele nulpunten. Als dat niet het geval lijkt, dan heb je dus

Nadere informatie

Matrices en Stelsel Lineaire Vergelijkingen

Matrices en Stelsel Lineaire Vergelijkingen Complexe Getallen Wat is de modulus van een complex getal? Hoe deel je twee complexe getallen? Wat is de geconjugeerde van een complex getal? Hoe kan je z z ook schrijven? Wat is de vergelijking van een

Nadere informatie

Nu een leuk stukje wiskunde ter vermaak (hoop ik dan maar). Optellen van oneindig veel getallen

Nu een leuk stukje wiskunde ter vermaak (hoop ik dan maar). Optellen van oneindig veel getallen Nu een leuk stukje wiskunde ter vermaak (hoop ik dan maar). Optellen van oneindig veel getallen Ter inleiding: tellen Turven, maar: onhandig bij grote aantallen. Romeinse cijfers: speciale symbolen voor

Nadere informatie

Monitoraatssessie Wiskunde

Monitoraatssessie Wiskunde Monitoraatssessie Wiskunde 1 Overzicht van de cursus Er zijn drie grote blokken, telkens voorafgegaan door de rekentechnieken die voor dat deel nodig zullen zijn. Exponentiële en logaritmische functies;

Nadere informatie

11.0 Voorkennis V

11.0 Voorkennis V 11.0 Voorkennis V 8 6 4 3 6 3 0 5 W 8 1 1 12 2 1 16 4 3 20 5 4 V is een 2 x 4 matrix. W is een 4 x 3 matrix. Deze twee matrices kunnen met elkaar vermenigvuldigd worden. Want het aantal kolommen van matrix

Nadere informatie

Geef niet alleen antwoorden, maar bewijs al je beweringen.

Geef niet alleen antwoorden, maar bewijs al je beweringen. Tentamen Lineaire Algebra donderdag 29 januari 205, 9.00-2.00 uur Het is niet toegestaan telefoons, computers, grafische rekenmachines (wel een gewone), dictaten, boeken of aantekeningen te gebruiken.

Nadere informatie

FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie

FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie FACULTEIT ECONOMIE EN BEDRIJFSKUNDE Afdeling Kwantitatieve Economie Lineaire Algebra, tentamen Uitwerkingen vrijdag 4 januari 0, 9 uur Gebruik van een formuleblad of rekenmachine is niet toegestaan. De

Nadere informatie

Universiteit Utrecht Faculteit Wiskunde en Informatica. Examen Optimalisering op maandag 18 april 2005, uur.

Universiteit Utrecht Faculteit Wiskunde en Informatica. Examen Optimalisering op maandag 18 april 2005, uur. Universiteit Utrecht Faculteit Wiskunde en Informatica Examen Optimalisering op maandag 18 april 2005, 9.00-12.00 uur. De opgaven dienen duidelijk uitgewerkt te zijn en netjes ingeleverd te worden. Schrijf

Nadere informatie

CTB1002 deel 1 - Lineaire algebra 1

CTB1002 deel 1 - Lineaire algebra 1 CTB100 deel 1 - Lineaire algebra 1 College 5 5 februari 014 1 Opbouw college Vandaag behandelen we hoofdstuk 1.7 en deel van 1.8 Voor de pauze: hoofdstuk 1.7 Na de pauze: hoofdstuk 1.8 Verschillende notaties

Nadere informatie

Overzicht. Lineaire vergelijkingen. Onderwerpen & Planning. Doel. VU Numeriek Programmeren 2.5

Overzicht. Lineaire vergelijkingen. Onderwerpen & Planning. Doel. VU Numeriek Programmeren 2.5 VU Numeriek Programmeren 25 Charles Bos Vrije Universiteit Amsterdam Tinbergen Institute csbos@vunl, A40 Onderwerpen & Planning Practicum Literatuur Taal Terugblik & Huiswerk 2 april 202 /26 2/26 Onderwerpen

Nadere informatie

1.3 Rekenen met pijlen

1.3 Rekenen met pijlen 14 Getallen 1.3 Rekenen met pijlen 1.3.1 Het optellen van pijlen Jeweetnuwatdegetallenlijnisendat0nochpositiefnochnegatiefis. Wezullen nu een soort rekenen met pijlen gaan invoeren. We spreken af dat bij

Nadere informatie

Lineaire Algebra voor ST

Lineaire Algebra voor ST Lineaire Algebra voor ST docent: Judith Keijsper TUE, HG 9.3 email: J.C.M.Keijsper@tue.nl studiewijzer: http://www.win.tue.nl/wsk/onderwijs/2ds06 Technische Universiteit Eindhoven college 8 J.Keijsper

Nadere informatie

Praktische informatie m.b.t. College Lineaire Algebra en Beeldverwerking Bachelor Informatica en Economie 2 e jaar Voorjaar semester 2013 Docent:

Praktische informatie m.b.t. College Lineaire Algebra en Beeldverwerking Bachelor Informatica en Economie 2 e jaar Voorjaar semester 2013 Docent: Praktische informatie m.b.t. College Lineaire Algebra en Beeldverwerking Bachelor Informatica en Economie 2 e jaar Voorjaar semester 2013 Docent: D.P. Huijsmans LIACS Universiteit Leiden College Lineaire

Nadere informatie