VIA PUZZELS GOOGLE LEREN



Vergelijkbare documenten
π* = π*(αs + (1 α)e) Thema Discrete wiskunde aflevering 1

De UvA Webklas Wiskunde: Google s PageRank voor Dummies

Over de wiskunde die Google groot maakte

Memoriseren: Een getal is deelbaar door 10 als het laatste cijfer een 0 is. Of: Een getal is deelbaar door 10 als het eindigt op 0.

Score. Zelfevaluatie. Beoordeling door de leerkracht. Datum: Klas: Nr: Naam:

1. REGELS VAN DEELBAARHEID.

Bij de volgende opgaven vragen we je een kleine opteltabel in te vullen. De eerste hebben we zelf ingevuld om je te laten zien hoe zoiets gaat. 1.

Algoritmes in ons dagelijks leven. Leve de Wiskunde! 7 April 2017 Jacobien Carstens

1 Binaire plaatjes en Japanse puzzels

Wortels met getallen en letters. 2 Voorbeeldenen met de (vierkants)wortel (Tweedemachts wortel)

Deel C. Breuken. vermenigvuldigen en delen

Het grondtal van het decimaal stelsel is 10. Voorbeeld: het getal Poorten De tellereenheid Mevr. Loncke 1

Deel A. Breuken vergelijken

Calcudoku. Vakantie Puzzelboek. door Patrick Min

1.3 Rekenen met pijlen

De huwelijksstelling van Hall

1 Rekenen met gehele getallen

Antwoorden. Magische vierkanten Vierkant voor Wiskunde Doeboek 8

Efficiente benadering van Google s PageRank (Engelse titel: Efficient approximation of Google s PageRank)

Vergelijkingen met wortelvormen

De waarde van een plaats in een getal.

REKENVAARDIGHEID BRUGKLAS

Rekentijger - Groep 6 Tips bij werkboekje A

Uitleg. Welkom bij de Beverwedstrijd Je krijgt 15 vragen, die je in maximaal 45 minuten moet beantwoorden.

Gebruikershandleiding

55 SEO Tips Om Mee Te Scoren!

Sudoku s. Annelies Veen Noud Aldenhoven

Nu een leuk stukje wiskunde ter vermaak (hoop ik dan maar). Optellen van oneindig veel getallen

Hieronder zie je hoe dat gaat. Opgave 3. Tel het aantal routes in de volgende onvolledige roosters van linksboven naar rechtsonder.

4. Zoeken naar informatie

Breukenpizza! Ga je mee om de wonderlijke wereld van de breuken te ontdekken? Bedacht en ontwikkeld door Linda van de Weerd.

Elementaire rekenvaardigheden

Internet Marketing Termen

Rekentijger - Groep 7 Tips bij werkboekje A

Het opstellen van een lineaire formule.

Uitwerkingen Mei Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Combinatoriek en rekenregels

Netwerkdiagram voor een project. AOA: Activities On Arrows - activiteiten op de pijlen.

3 D E Z O E K M A C H I N E G O O G L E

Wiskunde B-dag Lights Out. vrijdag 14 november, 9:00 16:00 uur. Wiskunde B-dag De wiskunde B-dag wordt gesponsord door

Aanvullende tekst bij hoofdstuk 1

Breuken met letters WISNET-HBO. update juli 2013

4.1 Negatieve getallen vermenigvuldigen [1]

D-day Lights Out

Uitgeverij Schoolsupport

: een wiskundige uitdaging

Het Land van Oct. Marte Koning Frans Ballering. Vierkant voor Wiskunde Wiskundeclubs

Wiskunde - MBO Niveau 4. Eerste- en tweedegraads verbanden

3. Zoeken naar informatie Surfen op internet met de app Internet Explorer Werken met

wizkid maart 2013 Veel succes en vooral veel plezier.!! je hebt 50 minuten de tijd rekenmachine is niet toegestaan

2. Optellen en aftrekken van gelijknamige breuken

Breuken. Tel.: Website:

MEER PARKEREN VOOR MINDER. Voorronde opdracht van de 22 e Wiskunde A-lympiade

Vergelijkingen met breuken

De teller geeft hoeveel stukken er zijn en de noemer zegt wat de 5. naam is van die stukken: 6 taart geeft dus aan dat de taart in 6

Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

Netwerkdiagram voor een project. AON: Activities On Nodes - activiteiten op knooppunten

Examen HAVO. wiskunde A1,2

WISKUNDE B-DAG Vrijdag 16 november, 9:00-16:00 uur. Eenvou(w)dig. De Wiskunde B-dag wordt mede mogelijk gemaakt door

Uw website optimaliseren voor zoekmachines

2015 Voorronde Vragenbundel voor het 5 leerjaar

Iedereen online, van 9 tot 99 jaar. Les Google: zoeken op het internet. Deze iconen tonen aan voor wie het document is

Deel B. Breuken. optellen en aftrekken

WISKUNDE B -DAG = 2. maar en hoe nu verder? 29 november 2002

Combinatoriek en rekenregels

Bij de volgende vragen Bij een regelmatige veelhoek kun je het gemakkelijkst eerst de buitenhoeken berekenen en daarna pas de binnenhoeken.

ProefToelatingstoets Wiskunde B

3. Zoeken naar informatie

Uitwerkingen Rekenen met cijfers en letters

FLIPIT 5. (a i,j + a j,i )d i d j = d j + 0 = e d. i<j

DE STAARTDELING (cijferend rekenen) Derde leerjaar (groep 5) Luc Cielen

Google s PageRank Algoritmes

Zoekmachine Optimalisatie Quickscan Rapport

Download gratis de PowerPoint rekenen domein getallen:

In Katern 2 hebben we de volgende rekenregel bewezen, als onderdeel van rekenregel 4:

Kansrekenen. Lesbrief kansexperimenten Havo 4 wiskunde A Maart 2012 Versie 3: Dobbelstenen

Tafels bloemlezing. Inhoud 1

PARADOXEN 2 Dr. Luc Gheysens

Derde domein: gebroken getallen. 1 Kennismaking met breuken. 1.1 De breuk als deel van een geheel. Opdracht 1. Opdracht 2. blaadje 1.

Derde domein: gebroken getallen. 1 Kennismaking met breuken. 1.1 De breuk als deel van een geheel. Opdracht 1. Opdracht 2. blaadje 1.

Ruitjes vertellen de waarheid

Correcties en verbeteringen Wiskunde voor het Hoger Onderwijs, deel A.

Worteltrekken modulo een priemgetal: van klok tot cutting edge. Roland van der Veen

Afspraken hoofdrekenen eerste tot zesde leerjaar

Basiskennis lineaire algebra

Tentamenset A. 2. Welke van de volgende beweringen is waar? c. N R N d. R Z R

SMART-finale Ronde 1: 5-keuzevragen (versie 1)

8.1 Herleiden [1] Herleiden bij vermenigvuldigen: -5 3a 6b 8c = -720abc 1) Vermenigvuldigen cijfers (let op teken) 2) Letters op alfabetische volgorde

6.1 Kwadraten [1] HERHALING: Volgorde bij berekeningen:

Uitwerkingen oefeningen hoofdstuk 2

SYMMETRIEËN VAN RUIMTELIJKE FIGUREN. Prof. dr. Ronald Meester

2 REKENEN MET BREUKEN Optellen van breuken Aftrekken van breuken Vermenigvuldigen van breuken Delen van breuken 13

Een breuk is een getal dat kleiner is dan 1. Als je iets in tweeën, drieën, vieren enz. breekt, dan krijg je een breuk.

WISKUNDE-ESTAFETTE RU 2005 Uitwerkingen

Gemiddelde: Het gemiddelde van een rij getallen is de som van al die getallen gedeeld door het aantal getallen.

Transcriptie:

GOOZZLES VIA PUZZELS GOOGLE LEREN

Goozzles: Puzzles teaching you Google este bezoeker van Lowlands, Welkom in de wiskundetent, en in het bijzonder bij de UvA-workshop over de PageRank van Google. Met behulp van dit boekje willen we je een wiskundig getinte uitleg geven over de werking van de zoekmachine Google. Google rangschikt zijn zoekresultaten aan de hand van het belang van deze bladzijde, genaamd de PageRank. Hoe deze PageRank in 989 door Larry Page en Sergey rin werd bepaald leggen we uit aan de hand van een paar Google-puzzles, Goozzles genaamd. Wiskundige voorkennis is niet vereist. Veel plezier! Jan randts Universiteit van Amsterdam http://staff.science.uva.nl/ brandts

Het woord Googol werd in 90 bedacht door de 9-jarige Milton Sirotta voor het getal 0 00, een één met honderd nullen.. De PageRank vergelijking van Google Een belangrijk onderdeel van Google is de PageRank vergelijking. Dit is de E = mc van het world wide web, en ziet er in wiskundige symbolen als volgt uit: π = π (αs + ( α)e) De uitkomst π van deze vergelijking is een rij van rapportcijfers voor alle acht miljard internet bladzijdes. Toepassing. Als je Google gebruikt om te zoeken naar een bepaalde term, worden deze rapportcijfers gebruikt om de resultaten in volgorde van belangrijkheid weer te geven. Het kost maar liefst drie dagen om deze acht miljard rapportcijfers uit te rekenen met behulp van grote hoeveelheden aan elkaar geschakelde supercomputers. Dat is erg duur, en dus doet Google dit maar één keer per maand. De oplossing π van de PageRank vergelijking stemt vaak verrassend goed overeen met wat mensen echt belangrijk vinden. In dit boekje proberen we daarom in lekentaal uit te leggen waarop deze vergelijking is gebaseerd.

Google wordt soms aangeklaagd door bedrijven die vinden dat hun PageRank te laag is. Ze verdedigen zich dan door te stellen dat de PageRank slechts hun mening voorstelt.. Een raadsel met kabouters en een goede fee Stel, er zijn vijf kabouters die we even,,, 4 en 5 noemen. Ieder van deze kabouters heeft vrienden voor wie hij alles over heeft. In onderstaand plaatje kan je zien wie een vriend van wie is: de pijl van naar betekent dat door als vriend wordt beschouwd. De kabouters wijzen dus in Figuur met pijlen hun vrienden aan. 5 4 Figuur. Niet-wederzijdse vriendschapsrelaties. 4

ehalve kabouters is er ook een goede fee, in het bezit van enorme hoeveelheden knikkers, die ze graag aan de kabouters wil uitdelen. Er is echter een probleem: zodra een kabouter knikkers krijgt, zal hij ze eerlijk verdelen over zijn vrienden. Zo zitten kabouters nu eenmaal in elkaar. Figuur. Typische Lowlands fee met knikkers. De fee besluit daarom elke kabouter een zodanig aantal knikkers te geven (minstens één), dat nadat iedere kabouter zijn knikkers heeft verdeeld over zijn vrienden, ze allemaal weer net zoveel knikkers hadden als ervóór. Maar hoe kan ze dit doen? Omdat dit niet gemakkelijk even snel uit te leggen is, komen we er later op terug. 5

PageRank wordt ook te koop aangeboden. edrijven zorgen dan tegen betaling voor links van hoog genoteerde pagina s naar de jouwe.. Verband tussen raadsel en PageRank Het world wide web kan net als het vrienden-netwerk van de kabouters gezien worden als items met pijlen ertussen. Een pijl van naar geeft dan aan dat bladzijde een hyperlink heeft waarmee je naar kunt surfen. Figuur. Een web-site met hyperlinks. De hoeveelheid knikkers waarmee het raadsel is opgelost, komt overeen met het belang van de web-bladzijde. In die situatie heeft een kabouter veel knikkers als: hij vrienden heeft met veel knikkers, die vrienden niet veel andere vrienden hebben. 6

Dit komt overeen met de heuristiek die Page en rin in hun PageRank model tot uitdrukking wilden laten komen, namelijk, een web-bladzijde is belangrijk als: er naar verwezen wordt door belangrijke bladzijdes, die bladzijdes niet naar veel andere bladzijdes verwijzen. Oftewel, je bent goed af als Koningin eatrix op haar webbladzijde naar de jouwe verwijst, maar al een stuk minder goed als ze naar al haar onderdanen blijkt te verwijzen! 4. Eenvoudigere versies van het raadsel Hieronder volgen drie gemakkelijkere opgaven dan die in Figuur om mee te oefenen. Opgave. epaal de zgn. evenwichts-verdeling die, na het verdelen van de knikkers volgens de pijlen, dezelfde knikker-verdeling oplevert. Figuur 4. Eenvoudigste versie van het raadsel. Controleer dat als je een oplossing hebt gevonden, dit niet de enige oplossing is: als je alle kabouters tweemaal zoveel knikkers had gegeven, had dit ook gewerkt. Sterker nog, ieder veelvoud van een oplossing is weer een oplossing! 7

Opgave. epaal de evenwichts-verdeling van elk van de volgende twee configuraties: Figuur 5. Eenvoudiger en wat moeilijker raadsel. Een alternatieve grafische voostelling van dezelfde twee raadsels als in Figuur 5 zie je rechts in Figuur 6. Hierbij is het idee als volgt. Plaats knikkers in bovenste drie vakjes, Verdeel ze eerlijk over de lege vakjes er verticaal onder, Verplaats ze horizontaal naar de rechter drie vakjes. Als de hoeveelheden knikkers in de rechtervakjes nu hetzelfde zijn als waarmee je bovenin begon, heb je de gevraagde evenwichts-verdelingen gevonden. 8

Opgave. Opgave als Goozzle (Google puzzle). Figuur 6. Figuur 5 in een ander jasje. 9

Opgave 4. Los de volgende Goozzle op. Om je op weg te helpen hebben we één van de drie gezochte getallen al ingevuld! 4 Figuur 7. Deels ingevulde Goozzle. Sommige mensen willen liever niet geholpen worden bij het puzzelen, en hadden de 4 in bovenstaande opgave liever niet kado gekregen. Toch is het niet echt een kado: we hadden immers al gezien dat veelvouden van een oplossing, ook weer oplossingen zijn. Er is dan ook een veelvoud dat inderdaad een 4 op die positie heeft. Mocht dit tijdens het oplossen ergens tot gebroken knikkers -breuken dusleiden, is dat niet erg: na afloop vermenigvuldigen we dan alles met een getal zodanig dat alle breuken verdwijnen. 0

Ongeveer vier vijfde van de documenten in het World Wide Web bevat geen hyperlinks. Denk hierbij aan jpg-, gif-, en pdf-bestanden. Dergelijke documenten heten dangling nodes. 5. Onvolkomenheden in het model De voorgaande Goozzles hebben allemaal een oplossing. Dit is echter niet altijd het geval, zoals blijkt uit het volgende voorbeeld. Figuur 8. Onoplosbare Goozzle. In dit voorbeeld krijgt kabouter knikkers van en, maar geeft zelf niets weg. Hij zal dus altijd meer bezitten dan ervoor, tenzij en geen knikkers hadden. Maar,

de fee gaf iedere kabouter minstens één knikker! Er is dus geen oplossing van deze Goozzle. Page en rin argumenteren dat als een surfer in een dangling node aankomt, hij bij gebrek aan hyperlinks een willekeurig nieuw web-adres in de browserbalk zal intikken. In een plaatje komt dit erop neer dat je vanuit een dangling node pijlen trekt naar ieder van de ander bladzijden, inclusief de dangling node zelf, ondanks dat deze links dus eigenlijk geen van alle echt bestaan. Het reizen naar een andere webpagina zonder daarbij een hyperlink te volgen wordt teleportatie genoemd. Opgave 5. Los de volgende Goozzle op: Figuur 9. Goozzle uit Figuur 8 inclusief teleportatie.

Reden om ook een pijl te trekken naar de dangling node zelf, is dat ieder van de drie bladzijden,, evenveel profiteert van de PageRank die uiteindelijk krijgt. Geen van de bladzijden wordt dus bevoordeeld in deze behandeling van dangling nodes. Ondanks de heuristisch verantwoorde aanpak van dangling nodes zijn nog niet alle problemen de wereld uit. ijvoorbeeld, het world wide web zou kunnen bestaan uit meerdere groepen van bladzijdes die onderling geen links hebben. ladzijdes uit verschillende groepen kunnen dan niet eerlijk met elkaar worden vergeleken, omdat de hoeveelheid knikkers binnen iedere groep met een willekeurig getal vermenigvuldigd kan worden. 6. Uiteindelijke basismodel: meer teleportatie rin en Page merkten terecht op, dat niet alleen als een surfer in een dangling node aankomt, hij een nieuw webadres in de browserbalk kan intikken. Hij doet dit ook op andere momenten. Vraag is wanneer, en hoe vaak. De α-factor. Een surfer zal een deel α (met α een getal tussen de nul en één) van de tijd hyperlinks volgen, en een deel α een nieuw adres in de browserbalk intikken. Het uiteindelijke model bestaat uit een combinatie van het model dat we hadden na het repareren van de problemen

die door dangling nodes worden veroorzaakt, en het volledige teleportatie-model. Dit laatste model gaat er (onterecht) vanuit dat er van iedere bladzijde een link is naar iedere andere bladzijde, inclusief zichzelf. Hoe wordt deze combinatie in de praktijk gemaakt? Door te stellen dat een deel α van de knikkers via de pijlen moet lopen van het oorspronkelijke model, en het resterende deel volgens de pijlen van het volledige teleportatie model. 0 7 0 Figuur 0: Goozzle met teleportatie en α-factor. Middels wiskundig speurwerk valt te beredeneren dat Google in hun model de waarde α = 0.85 = 7 0 gebruikt. Het 4

linkerdeel van de Goozzle in Figuur 0 is het teleportatieblok; het /0-e deel van de knikers dat hierin belandt wordt gelijkelijk verdeeld over alle andere bladzijden. We zien dat het overeenkomstige kabouter-raadsel nu wel heel erg ingewikkeld kan worden. De vraag is nu dus hoe de fee de kabouters knikkers kan geven zodanig, dat als 85% van de knikkers via het rechterblok in Figuur 0 wordt verdeeld, en 5% van de knikkers volgens het linkerblok, de situatie weer is zoals tevoren. En voor het echte world wide web dan ook nog eens met zo n acht miljard kabouters in plaats van de drie die we hier bekijken. Dit verklaart waarom er grote aantallen aan elkaar gekoppelde supercomputers nodig zijn om de oplossing binnen een dag of drie te kunnen berekenen! Opmerking. Door een deel α van de knikkers volgens het teleportatie-model te laten rollen, hebben we het probleem van de groepen bladzijdes zonder onderlinge links opgelost. De toegevoegde teleportatie zorgt ervoor dat alle bladzijdes aan elkaar gerelateerd zijn. Natuurlijk is het tot zover beschreven model nog lang niet de hele waarheid. Google heeft ongetwijfeld nog heel veel kleinere en grotere slimmigheden om efficiënt om te gaan met zoek-opdrachten en pageranking. Deze zijn, begrijpelijkerwijs, voor het grootste deel geheim. 5

Universiteit van Amsterdam