G o o g l e of Hoe maak je een eerlijke tabel voor de eredivisie? Bernd Souvignier Radboud Universiteit Nijmegen
Te veel gevonden? Voor de zoekaanvraag Google tabel eredivisie zijn er liefst 9750 resultaten, waaronder een hele hoop die helemaal geen tabel bevatten. Onder de eerste 10 of 20 willen we er echter graag een (of meerdere) hebben die de actuele tabel wel laat zien. Probleem: Hoe kunnen de zoekresultaten in een gunstige volgorde gebracht worden?
Orde in de grabbelton Sergey Brin en Lawrence Page, de uitvinders van Google, stellen: De relevantie van een document is evenredig met de som der relevanties van de documenten die erop verwijzen. Voorstel (van Brin en Page): Orden de matchende documenten volgens hun relevantie. Dit idee werd in feite al lang voor de opkomst van het internet en zoekmachines voorgesteld om rankings te bepalen, namelijk 1952 door de Engelse wiskundige T.H. Wei in zijn proefschrift en 1955 in een artikel van de Engelse statisticus M.G. Kendall die het werk van Wei oppikte.
Relevantie in formules Noteer de relevantie van document no. 1 met R 1, die van document no. 2 met R 2 enz., dan moeten voor de relevanties vergelijkingen gelden zo als: k R 1 = R 2 + R 4 + R 8 k R 2 = R 3 + R 5 + R 7 + R 11 + R 13 k R 3 = R 1 + R 4 + R 9 + R 16. als bijvoorbeeld documenten no. 2, 4 en 8 op document no. 1 verwijzen, documenten no. 3, 5, 7, 11 en 13 op document no. 2, enz. Hierbij is k de evenredigheidsfactor.
Een kip en ei probleem Om de relevantie R 1 te berekenen, moeten we R 2 al kennen, want k R 1 = R 2 + R 4 + R 8. Om de relevantie R 2 te berekenen, moeten we R 3 al kennen, want k R 2 = R 3 + R 5 + R 7 + R 11 + R 13. Om de relevantie R 3 te berekenen, moeten we R 1 al kennen, want k R 3 = R 1 + R 4 + R 9 + R 16.!?@***?grmph**@ Een vicieuze cirkel: De relevanties moeten blijkbaar in een klap uit het niets berekend worden.
Kip en ei in een klap (deel I) We herschrijven de vergelijkingen voor de relevanties een beetje: k R 1 = R 2 + R 4 + R 8 k R 2 = R 3 + R 5 + R 7 + R 11 + R 13 k R 3 = R 1 + R 4 + R 9 + R 16 wordt (door aftrekken van de linkerzijden). 0 = k R 1 + R 2 + R 4 + R 8 0 = k R 2 + R 3 + R 5 + R 7 + R 11 + R 13 0 = R 1 k R 3 + R 4 + R 9 + R 16. Dit is een stelsel lineaire vergelijkingen in de onbekenden R 1, R 2, R 3,... dat ook nog een parameter k bevat en waarbij alle linkerzijden nul zijn.
Een stelsel vergelijkingen zo als Kip en ei in een klap (deel II) 0 = k R 1 + R 2 + R 4 + R 8 0 = k R 2 + R 3 + R 5 + R 7 + R 11 + R 13 0 = R 1 k R 3 + R 4 + R 9 + R 16. heeft natuurlijk een heel flauwe oplossing, namelijk: R 1 = R 2 = R 3 = R 4 =... = 0. Maar dan zijn alle documenten even weinig relevant :-(. Echter: We kunnen speciale waarden van de parameter k bepalen waarvoor er naast deze flauwe oplossing ook nog interessante oplossingen zijn. Verrast?
Geen verrassing! We kijken naar een iets eenvoudiger stelsel vergelijkingen: kx + y = 0 2x ky = 0 dan volgt uit de eerste vergelijking rechtstreeks dat y = kx en invullen in de tweede vergelijking geeft 2x = ky = k 2 x. We hebben natuurlijk de flauwe oplossing x = y = 0 voor willekeurige k. Echter, voor x 0 moet 2 = k 2 gelden, en in dit geval mogen we x zelfs vrij kiezen. De speciale waarden zijn dus k = 2 en k = 2 en voor deze waarden vinden we (met bijvoorbeeld x = 1) de interessante oplossingen: k = 2 : (x, y) = (1, 2) k = 2 : (x, y) = (1, 2).
Kip en ei in een klap (deel III) De speciale waarden van de parameter k laten zich ook in het algemene geval altijd berekenen. De grootste van deze speciale waarden heeft een bijzondere eigenschap: Voor de interessante oplossing geldt dat alle R i positief zijn. De oplossing voor de grootste speciale waarde kiezen we als relevanties van de documenten. Voor de andere speciale waarden zijn er steeds positieve en negatieve R i. Het bepalen van de speciale waarden leer je in een studie wiskunde of natuurkunde overigens al in het eerste jaar (in het vak Lineaire Algebra).
Een eerlijke tabel voor de eredivisie Het is eerlijk als punten die tegen een sterk team behaald worden meer wegen dan punten die tegen een zwak team behaald worden. Noteer met R i de sterkte van team no. i (analoog met relevantie). Gewogen punten: een overwinning van een team met sterkte R levert R 3 punten op; gelijkspel levert R 1 punten op. De sterkte van een ploeg is evenredig met de som der (gewogen) punten die tegen de andere teams zijn behaald.
Champions League 2005/2006, groepsfase, groep E Schema der behaalde punten en bijhorend stelsel vergelijkingen: team 1) 2) 3) 4) 1) 0 1 4 6 k R 1 = 1 R 2 + 4 R 3 + 6 R 4 2) 4 0 3 3 k R 2 = 4 R 1 + 3 R 3 + 3 R 4 3) 1 3 0 4 k R 3 = 1 R 1 + 3 R 2 + 4 R 4 4) 0 3 1 0 k R 4 = 3 R 2 + 1 R 3 De grootste speciale waarde k = 7.589 geeft de sterktes R 1 = 1.2671, R 2 = 1.3532, R 3 = 1.0561, R 4 = 0.6734. De behaalde eerlijke punten - die we scores gaan noemen - zijn: k R 1 = 9.617, k R 2 = 10.257, k R 3 = 8.015, k R 4 = 5.111. De sterktes zijn juist zo genormeerd dat de som der scores hetzelfde is als de som der daadwerkelijk behaalde punten.
Champions League 2005/2006, groepsfase, groep E Schema der behaalde punten en bijhorend stelsel vergelijkingen: team 1) 2) 3) 4) 1) 0 1 4 6 k R 1 = 1 R 2 + 4 R 3 + 6 R 4 2) 4 0 3 3 k R 2 = 4 R 1 + 3 R 3 + 3 R 4 3) 1 3 0 4 k R 3 = 1 R 1 + 3 R 2 + 4 R 4 4) 0 3 1 0 k R 4 = 3 R 2 + 1 R 3 Tabel met daadwerkelijk behaalde punten en berekende scores: team punten sterkte score 1) AC Milan 11 1.2671 9.617 2) PSV Eindhoven 10 1.3515 10.257 3) Schalke 04 8 1.0561 8.015 4) Fenerbahçe Istanbul 4 0.6734 5.111
Tabel eredivisie op 14 maart 2008 plaats team wedstrijden punten sterkte score 1. PSV Eindhoven 27 59 1.6116 56.898 2. Ajax Amsterdam 27 53 1.5114 53.359 3. Feyenoord Rotterdam 28 51 1.4500 51.192 4. FC Groningen 28 50 1.3735 48.490 5. NAC Breda 28 50 1.3613 48.059 6. SC Heerenveen 28 48 1.3862 48.940 7. FC Twente Enschede 28 46 1.3067 46.133 8. Roda JC Kerkrade 28 42 1.3137 46.379 9. Vitesse Arnhem 28 39 1.0603 37.434 10. FC Utrecht 28 38 1.0971 38.734 11. NEC Nijmegen 28 33 0.9762 34.464 12. AZ Alkmaar 28 31 0.8571 30.259 13. Heracles Almelo 28 30 0.7658 27.037 14. Sparta Rotterdam 28 27 0.8205 28.970 15. De Graafschap Doetinchem 28 26 0.7579 26.759 16. VVV Venlo 28 26 0.7297 25.760 17. Willem II Tilburg 28 24 0.6576 23.217 18. Excelsior Rotterdam 28 23 0.6774 23.917 De wedstrijd PSV - Ajax wordt op woensdag 19 maart ingehaald.
Het effect van de uitslag PSV - Ajax op de scores team vooraf PSV wint gelijkspel Ajax wint PSV Eindhoven 56.898 (59) 61.039 (62) 58.327 (60) 56.922 (59) Ajax Amsterdam 53.359 (53) 53.122 (53) 54.797 (54) 57.812 (56) Feyenoord Rotterdam 51.192 50.947 51.029 50.975 FC Groningen 48.490 48.539 48.457 48.357 NAC Breda 48.059 47.951 48.042 48.128 SC Heerenveen 48.940 49.141 48.911 48.664 FC Twente Enschede 46.133 46.031 46.023 45.926 Roda JC Kerkrade 46.379 46.502 46.447 46.466 Vitesse Arnhem 37.434 37.246 37.336 37.346 FC Utrecht 38.734 38.926 38.721 38.512 NEC Nijmegen 34.464 34.315 34.398 34.429 AZ Alkmaar 30.259 30.226 30.187 30.089 Heracles Almelo 27.037 26.912 26.931 26.862 Sparta Rotterdam 28.970 28.872 28.914 28.912 De Graafschap Doetinchem 26.759 26.660 26.668 26.601 VVV Venlo 25.760 25.719 25.736 25.736 Willem II Tilburg 23.217 23.099 23.139 23.113 Excelsior Rotterdam 23.917 23.752 23.938 24.149 factor k 35.305 35.414 35.392 35.448