Entropie en Huffman-codering
|
|
|
- Bart Brander
- 9 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Entropie en Huffman-codering T. H. Koornwinder Syllabus bestemd voor mastercourse Datacompressie, UvA, 23 januari 2004 Conventies Als we in het vervolg log x schrijven, dan bedoelen we 2 log x, dus de logaritme met grondtal 2. Met desda bedoelen we dan en slechts dan als. Bij het samenstellen van deze syllabus is gebruik gemaakt van referenties [1], [2] en [3]. 1 Het begrip informatie Shannon [4] legde in 1948 de grondslagen van de informatietheorie en hij voerde ook het begrip entropie in verband met informatie in. Stel we hebben een eindige verzameling S = {s 1, s 2,..., s m }, waarin de elementen s i mogelijke gebeurtenissen voorstellen die van elkaar onafhankelijk zijn. Bijvoorbeeld de verschillende karakters (letters, etc.) die in een tekst in een bepaalde taal (zoals Engels of Nederlands) kunnen voorkomen. Of een mogelijk weertype dat op 23 januari 2004 om 10 uur s ochtends in Amsterdam kan voorkomen. We nemen aan dat gebeurtenis s i waarschijnlijkheid p i heeft. Dus 0 p i 1 en m p i = 1. Definitie 1.1. De informatie I(s i ) geleverd door een gebeurtenis s i is gelijk aan I(s i ) = log p i. (1.1) Omdat 0 p i 1 zal 0 I(s i ), waarbij I(s i ) = 0 als p i = 1 en I(s i ) = als p i = 0. Ook is I(s i ) een monotoon dalende functie van p i. Als p i = 1 2 dan I(p i) = 1. Naarmate de kans kleiner is dat een gebeurtenis plaats heeft, zijn we meer verrast als hij plaats heeft en geeft hij ons meer informatie, en zijn we ook meer bereid om er plaats aan te geven in ons informatiekanaal of onze informatiedrager. Dank zij de logaritme in de definitie is informatie een additieve grootheid. Stel bijvoorbeeld dat we twee keer achter elkaar een gebeurtenis uit de verzameling S hebben en dat die twee achtereenvolgende gebeurtenissen onafhankelijk van elkaar zijn. De verzameling van alle mogelijke twee achtereenvolgende gebeurtenissen wordt beschreven door S 2 = S S = {(s i, s j ) i, j = 1,..., m}. De waarschijnlijkheid van de gebeurtenis (s i, s j ) is p i p j en I(s i, s j ) = log(p i p j ) = log p i log p j = I(s i ) + I(s j ). Dus de informatie gegeven door eerst de gebeurtenis s i en dan de gebeurtenis s j is gelijk aan de som van de informaties gegeven door resp. s i en s j. Informatie is dus een meetbare grootheid waarbij het zinvol is om van een eenheid van informatie te spreken. Deze eenheid noemen we bit. Een gebeurtenis met waarschijnlijkheid 1 2 geeft log 1 2 = 1 bit informatie. Een gebeurtenis met waarschijnlijkheid 2 k geeft log 2 k = k bits informatie. Dit is mooi in overeenstemming met het vertrouwde begrip van bit. Als het aantal mogelijke gebeurtenissen gelijk is aan 2 k, elk met kans 2 k, dan kunnen we aan elke mogelijke gebeurtenis een verschillend rijtje van k nullen en enen toekennen. Er zijn dus precies k bits van het vertrouwde type nodig om ons de informatie te geven welke gebeurtenis heeft plaats gevonden. 1
2 2 Entropie We blijven werken met de verzameling S en de kans p i op een gebeurtenis s i uit S. We kunnen dus spreken van een (eindige) kansruimte (S, P ). Omdat de informatie I gedefinieerd is als een functie op S, is het zinvol om van de verwachtingswaarde van I te spreken. Definitie 2.1. De entropie H(S) van de kansruimte (S, P ) is gelijk aan de verwachtingswaarde van de informatie I, i.e., H(S) = p i log p i = p i log p 1 i. (2.1) Hier definiëren we p log p voor p = 0 door continuïteit, dus gelijk aan lim p 0 p log p = 0. Als we H(S) beschouwen op een kansruimte met een vast aantal van m elementen, waarbij de kansen p 1,..., p m nog kunnen variëren, dan is H(S) in feite een functie H(p 1,..., p m ) van m variabelen, waarbij p 1,..., p m beperkt zijn tot de volgende deelverzameling van R m : {(p 1,..., p m ) p p m = 1 en i p i 0} (een simplex). Als m = 2 dan is H(p 1, p 2 ) alleen afhankelijk van p 1 [0, 1] omdat p 2 = 1 p 1. Dan geldt: H(p, 1 p) = p log p (1 p) log(1 p), (2.2) d H(p, 1 p) dp = log(1 p) log p. (2.3) Bekijk de grafiek van p H(p, 1 p). De functie is symmetrisch rond p = 1 2 en bij p = 1 2 neemt hij ook zijn maximumwaarde 1 aan. Bij p = 0 en 1 is de functie 0. Hij stijgt van p = 0 tot 1 2 (loopt verticaal weg van p = 0) en hij daalt van p = 1 2 tot 1. Het gedrag dat we in dit eenvoudige geval zien, keert terug bij willekeurige waarden van m: Stelling 2.2. Er geldt: 0 H(p 1,..., p m ) H(m 1,..., m 1 ) = log m. (2.4) H(p 1,..., p m ) bereikt zijn absolute maximum log m in precies één punt, nl. als alle p i aan elkaar gelijk zijn, dus gelijk zijn aan m 1. H(p 1,..., p m ) bereikt zijn absolute minimum 0 desda p i = 1 voor zekere i, en dus de p j met j i gelijk aan 0 zijn. De entropie van de verzameling S van gebeurtenissen is de gemiddelde hoeveelheid informatie die we krijgen bij een gebeurtenis. Als alle m mogelijke gebeurtenissen ongeveer gelijke kans hebben, dan krijgen we per gebeurtenis gemiddeld informatie die dicht bij log m bits ligt. Dus als m = 2 k dan ontavngn we juist de k bits per gebeurtenis die we nodig hebben om ons logboek bij te houden zo dat elke mogelijke gebeurtenis door zijn eigen rijtje van k nullen en enen wordt voorgesteld. Het is paradoxaal dat we bij zo n kansverdeling nooit echt verrast zullen worden, maar toch erg veel informatie per keer krijgen. Als echter de kansen van de m gebeurtenissen flink uiteenlopen, dan zal de entropie veel lager zijn, dus de gemiddelde informatie per gebeurtenis veel lager. Weliswaar worden we nu soms echt verrast, maar de echte verrassingen kunnen niet vaak genoeg voorkomen om de gemiddelde 2
3 verrassing per gebeurtenis hoog te houden. Voor het logboek ruimen we nu voor de kansrijke gebeurtenissen korte rijtjes nullen en enen in en voor de zeldzame gebeurtenissen langere rijtjes. Het zal blijken dat dit zo slim gedaan kan worden dat de gemiddelde benodigde ruimte per gebeurtenis in ons logboek de hoogte van de entropie redelijk volgt. 3 Entropie als absolute ondergrens voor compressie Voor de natuurlijke logaritme is er de standaardongelijkheid ln x x 1, (x > 0). (3.1) Er geldt gelijkheid desda x = 1. Voor de logarime met grondtal 2 kunnen we de ongelijkheid herschrijven als log x (log e) (x 1), (x > 0). (3.2) Dit leidt tot interessante ongelijkheden voor de entropie. Lemma 3.1. Laat p 1,..., p m > 0, q 1,..., q m > 0, m p i = 1, m q i 1. Dan p i log p i p i log q i, (3.3) waarbij gelijkheid geldt desda p i = q i voor alle i. Bewijs We gaan bewijzen dat het rechter lid minus het linker lid 0 is. p i log(q i p 1 i ) (log e) ( m = (log e) p i p i (q i p 1 i 1) ) ( q i = (log e) 1 ) q i 0. Hier is (3.2) gebruikt. Uit de beschouwing wanneer (3.2) een gelijkheid is, zien we dat de eerste ongelijkheid in de afleiding hierboven een gelijkheid wordt desda p i = q i voor alle i. Dan is vanzelf ook de som van de q i s gelijk aan 1. Stel nu dat we een tekst aangeboden krijgen van lengte L, waarin een verzameling S = {s 1,..., s m } van m karakters gebruikt wordt, en dat het aantal malen dat het karakter s i in de tekst voorkomt, gelijk is aan Lp i. Dus we kunnen H(S) = m p i log p i als de bijbehorende entropie beschouwen. Stel ook dat we een codering hebben van de karakters s 1,..., s m waarbij s i gecodeerd wordt door het binaire woord c i. Hier is een binair woord een eindig en niet-leeg rijtje van nullen en enen. De lengte l(c) van een binair woord c is het aantal nullen en enen in dat woord. Noem C := {c 1,..., c m } de verzameling van de binaire codewoorden. De codewoorden hoeven niet allemaal even lang te zijn. Maar toch willen we dat de code instantaan is, d.w.z. dat we bij het inlezen van een rij nullen en enen gevormd uit achtereenvolgende codewoorden telkens met zekerheid weten wanneer we aan het eind zijn van een codewoord en met een volgend codewoord gaan beginnen. 3
4 Definitie 3.2. Zij C een eindige verzameling van binaire woorden. We noemen C prefixvrij als geen u C een prefix is van een w C, d.w.z., als geen w C te schrijven is als een u C gevolgd door een binair woord v. We zien nu onmiddellijk in dat een code C instantaan is desda C prefixvrij is. Voorbeeld 3.3. De binaire woorden 0, 10, 110, 111 vormen een prefixvrije verzameling C. Als we een aantal binaire woorden uit C achter elkaar zetten, bijv dan kunnen we moeiteloos en ondubbelzinnig de achtereenvolgende woorden uit C hrkennen: Instantane codes hebben een andere belangrijke eigenschap: Stelling 3.4. (Ongelijkheid van Kraft) Zij C = {c 1,..., c m } een instantane binaire code. Schrijf l i := l(c i ). Dan 2 l i 1. (3.4) Bewijs De ongelijkheid geldt als de maximale woordlengte in C gelijk aan 1 is. Want dan 0 < 1 als m = 0, 1 2 < 1 als m = 1 en = 1 als m = 2. Stel nu dat de ongelijkheid geldt als de maximale woordlengte in C kleiner dan n is. Neem nu C met maximale woordlengte gelijk aan n. Bekijk C gevormd door alle c in C te nemen met eerste bit 0, en dan die eerste bit weg te laten. Bekijk evenzo C gevormd door alle c in C te nemen met eerste bit 1, en dan die eerste bit weg te laten. Dan zijn C en C prefixvrije codes met maximale lengte kleiner dan n, waarvoor dus Kraft s ongelijkheid geldt. Dan geldt voor C: 2 l(c) = l(c ) l(c ) = 1. c C c C c C Hiermee is de stelling bewezen op grond van volledige inductie naar de maximale woordlengte in C. Terug nu naar ongelijkheid (3.3), met p i gelijk aan aantal voorkomens van karakter c i in een tekst gedeeld door de lengte van de tekst. Zij C = {c 1,..., c m } een instane binaire code voor de karakterverzameling S = {s 1,..., s m } en neem q i gelijk aan 2 l(ci). De ongelijkheid van Kraft geeft dan dat m q i 1, precies wat in (3.3) geëist wordt. Als we de aangeboden tekst coderen door S om te zetten in C, dan is het rechterlid van (3.3) gelijk aan m p i log q i = m p i l(c i ), dus aan de gemiddelde bitlengte van de gecodeerde karakters in de tekst. Dus we hebben bewezen: Stelling 3.5. Als de karakters van een tekst met een instantane code gecodeerd worden, dan is de gemiddelde bitlengte van de gecodeerde karakters in de tekst groter dan of gelijk aan de uit de karakterfrequenties in de tekst bepaalde entropie. Er geldt gelijkheid dan en slechts dan als voor elk karakter s i met codewoord c i geldt dat 2 l(c i) gelijk is aan het aantal voorkomens van s i gedeeld door de lengte van de tekst. Stelling 3.4 (de ongelijkheid van Kraft) heeft een omgekeerde: 4
5 Stelling 3.6. Als er een rijtje positieve gehele getallen l 1 l 2... l m gegeven is zo dat de ongelijkheid (3.4) geldt, dan bestaat er een instantane binaire code C = {c 1,..., c m } met l(c i ) = l i. Om dit in te zien, en ook voor later gebruik, introduceren we nu binaire bomen. Definitie 3.7. Een binaire boom is een speciaal soort gerichte graaf. Hij bestaat, zoals elke gerichte graaf, uit punten en gerichte lijnen. De volgende eigenschappen karakteriseren een binaire boom: Er is één speciaal punt, de wortel, die we bovenaan tekenen. Bij de wortel komt gen enkele lijn aan. Elke gerichte lijn loopt naar linksonder of naar rechtsonder. Omdat de lijnen dus altijd naar beneden gaan, hoeven we de lijnen niet als pijlen te tekenen. Bij elk punt ongelijk aan de wortel komt precies één lijn aan. Vanuit elk punt vertrekken 2, 1, of 0 lijnen. Elk punt is vanuit de wortel te bereiken. In een binaire boom noemen we de lijnen takken. We noemen de punten vanwaar geen takken vertrekken bladeren. We noemen een punt b een kind van een punt a als er een tak van a naar b loopt. Dan noemen we a ouder van b. Als twee punten b en c kinderen zijn van dezelfde ouder, dan noemen we b en c broers (of zusters) van elkaar. Een tak die naar linksonder loopt, coderen we met 0, en een tak die naar rechtsonder loopt met 1. Elk punt kan op een unieke manier via een aantal opeenvolgende takken bereikt worden. Deze opeenvolgende takken leveren een rijtje nullen en enen, een binair woord, dat het betreffende punt uniek bepaalt. De lengte van dit woord komt overeen met het niveau van het punt in de boom. Hier moeten we ook het lege binaire woord meenemen, dat overeenkomt met de wortel. Met elke prefixvrije verzameling C van binaire woorden kunnen we een unieke binaire boom associëren zo dat de binaire woorden uit C precies de bladeren (eindpunten) van de boom zijn. Omgekeerd geeft elke binaire boom een unieke prefixvrije verzameling C bestaande uit de binaire woorden voor de bladeren van de boom. (Stilzwijgend nemen we hierbij aan dat C niet leeg is en dat de boom niet de wortel als enige punt heeft.) In Voorbeeld 3.3 heeft de wortel twee kinderen 0 en 1, waarvan 0 een blad is en 1 twee kinderen 10 en 11 heeft. 10 is een blad en 11 heeft twee kinderen 110 en 111, die beide bladeren zijn. Bewijs van Stelling 3.6 Als de maximale lengte l m gelijk is aan 1, dan is, gezien de ongelijkheid (3.4), m = 1, l 1 = 1 2 of m = 2, l 1 = l 2 = 1 2. We realiseren dit met c 1 = 0 en (als m = 2) c 2 = 1. Stel nu dat we voor elke gegeven l 1... l m met l m < L al een prefixvrije code gerealiseerd hebben. Laat nu l m = L. Het aantal i s met l i = l m = L kan even of oneven zijn. Er volgt uit (3.4) dat, als het aantal oneven is, dan m 2 l i 1 2 L. Dus dan kunnen we een l m+1 = L toevoegen met behoud van ongelijkheid (3.4). Als we dan l 1... l m+1 kunnen realiseren 5
6 met een prefixvrije code, dan kunnen we dit ook door weglating van c m+1 voor l 1... l m. We mogen dus aannemen dat het aantal i s met l i = l m = L even is, zeg 2k. We vervangen de 2k l i s gelijk aan L door k l i s gelijk aan L 1. Voor de nieuwe rij van m k l i s geldt de ongelijkheid (3.4), dus uit de hypothese volgt dat deze gerealiseerd kunnen worden door een prefixvrije code {c 1,..., c m k }. Hang nu aan elk van de k bladeren c m 2k+1,..., c m k in de bijbehorende binaire boom (alle op niveau L 1) twee kinderen, en vervang c m 2k+1,..., c m k door de zo verkregen 2k bladeren in de boom op niveau L. Dit geeft de gevraagde realisatie door een prefixvrije binaire code. Met volledige inductie naar L hebben we zo de stelling bewezen. Opmerking 3.8. Met essentieel hetzelfde bewijs als hierboven zien we: Als er een rijtje positieve gehele getallen l 1 l 2... l m gegeven is zo dat de gelijkheid 2 l i = 1 (3.5) geldt, dan bestaat er een instantane binaire code C = {c 1,..., c m } met l(c i ) = l i en zo dat in de bijbehorende binaire boom elke ouder twee kinderen heeft. Omgekeerd, als C = {c 1,..., c m } een prefixvrije binaire code is met l(c i ) = l i en zo dat in de bijbehorende binaire boom elke ouder twee kinderen heeft, dan zal gelijkheid (3.5) gelden. 4 Shannon-Fano code Laten we recapituleren waar het ons om ging. We hebben een eindige kansruimte S = {s 1,..., s m } met bijbehorende kansen p i. We zoeken naar een instantane binaire code C = {c 1,..., c m } met l i := l(c i ) (of equivalent naar een rijtje l 1 l 2... l m dat voldoet aan ongelijkheid (3.4)) zo dat l p il i zo klein moeglijk wordt. We weten al dat de entropie een absolute ondergrens is: H(S) = p i log p i l p i l i. (4.1) Ook weten we dat de ondergrens bereikt (en met een instantane binaire code gerealiseerd) kan worden desda p i = 2 l i voor alle i. We kunnen direct al goedkope winst maken in (4.1). Als we een instantane binaire code hebben zo dat er in de bijbehorende binaire boom ouders met 1 kind voorkomen, dan kunnen we die punten in de boom weghalen. Hierdoor zijn er uiteindelijk alleen nog maar ouders met 2 kinderen en zijn sommige bladeren omhoog gekomen. Het effect is dat in sommige binaire codewoorden er een of meer bitplaatsen zijn verdwenen, waardoor de lengte van zo n woord kleiner is geworden. Hierdoor wordt het rechterlid van (4.1) kleiner: de code is efficiënter geworden. Als niet alle p i s negatieve machten van 2 zijn, dan kunnen we wel l i s nemen zo dat 2 l i zo dicht mogelijk onder p i ligt. Dus l i := log p 1 i, (4.2) dit is het kleinste gehele getal log pi 1. Met deze keuze van l i s zal ongelijkheid (3.4) gelden. Dus we kunnen een instantane binaire code C voor de l i s realiseren. Deze code heet de Shannon- Fano code. 6
7 Stelling 4.1. (Shannon s Noiseless Coding Theorem) Voor de Shannon-Fano code geldt: H(S) = p i log p i l p i l i < H(S) + 1. (4.3) Bewijs Uit (4.2) volgt dat l i 1 < log p i < l i. Vermenigvuldig alles met p i, sommeer alles over i en gebruik dat m p i = 1. Dit levert het gewenste resultaat. We kunnen dus zo coderen dat de gemiddelde bitlengte per karakter de entropie met minder dan 1 overschrijdt. Bovendien kunnen we de Shannon-Fano code nog verbeteren door de eenkinder ouders in de binaire boom weg te halen. Hoeveel beter het daardoor wordt, zal er van afhangen hoe we precies de binaire code vaststellen behorend bij gegeven lengtes l i die aan ongelijkheid (3.4) voldoen. Het recursieve voorschrift in het bewijs van Stelling 3.6 zouden we eigenlijk preciezer moeten maken. In plaats daarvan zullen we kijken naar de code die het rechterlid in (4.1) zeker minimaliseert: de Huffman-code. 5 Huffman-codering Normaal worden karakters gecodeerd met een vast aantal bits, bijv. de 7 bits van de ascii-code of de 8 bits van de uitgebreide ascii-code. Dit heeft het voordeel dat men weet na hoeveel bits de code voor het volgende karakter begint, maar het nadeel dat men evenveel bits voor een veel voorkomend als een weinig voorkomend karakter moet gebruiken. Als men karakters codeert in verschillende bitlengtes, en men werkt alleen met nullen en enen, dan moeten er eisen aan de code gesteld worden opdat de ontvanger altijd zeker weet, wanneer een binnenkomende rij nullen en enen de informatie voor een karakter voltooid heeft en aan de informatie voor een volgend karakter begint. Dit wordt gerealiseerd desda de verzameling codewoorden de eigenschap van prefixvrijheid heeft. Stel nu dat een eindige verzameling S gegeven is en dat met elke s S een positief reëel getal f(s) (een gewicht) geassocieerd is. Denk bij S aan de gebruikte karakters in een gegeven tekst, en bij f(s) aan het aantal keren dat s in de tekst voorkomt, of het aantal keren dat s voorkomt gedeeld door de lengte van de tekst. We zoeken nu een een bijectieve afbeelding Φ: S C van S naar een prefixvrije verzameling C van binaire woorden zo dat s S f(s)l(φ(s)) zo klein mogelijk is. Equivalente formulering f 1 f 2... f m. Gegeven is een niet-dalende rij van m positieve reële getallen Vind een prefixvrije verzameling C van m binaire woorden c 1, c 2,..., c m zo dat F (C) := f i l(c i ) minimaal is. Het is eenvoudig in te zien dat de boom voor een C met minimale F (C) in ieder geval de volgende eigenschappen moet hebben (omdat we anders een boom kunnen maken met kleinere F (C)): Er zijn geen punten vanwaar slechts 1 tak vertrekt. Er zijn geen i en j zo dat f i < f j en l(c i ) < l(c j ). 7
8 Dan zien we in dat in een boom met minimale F (C) moet gelden dat l(c 1 ) = l(c 2 ) en dat, na eventuele herordening van de c i s met maximale lengte, c 1 en c 2 dezelfde ouder hebben. Het algoritme van Huffman construeert recursief een C met minimale F (C): Beginstap m = 2. Neem c 1 = 0, c 2 = 1. Recursieve stap Stel dat we voor de rij van m 1 getallen f 1 + f 2, f 3,..., f m een bijpassende verzameling C, dus ook een binaire boom B, met de minimaliteitseigenschap gevonden hebben. Neem in B een blad met gewicht f 1 +f 2. Laat uit dit blad twee takken vertrekken uitkomend in 2 bladeren met gewichten f 1 en f 2. De zo uit B geconstrueerde boom B levert C als gevraagd. Er kan bewezen worden (niet erg moeilijk) dat dit algoritme inderdaad een C oplevert met F (C) minimaal. In bovenstaande beschrijving van het algoritme zijn nog keuzevrijheden. Namelijk, als in de recursieve stap er al andere f i s zijn gelijk aan f 1 + f 2, dan zijn er verschillende mogelijkheden om f 1 en f 2 als bladeren aan een f i in B te hangen. Elke keuze zal echter tot dezelfde minimale F (C) leiden. Ook zal, vanwege de minimaliteitseigenschap de l i s in de gevonden boom moeten voldoen aan de eis l i > l j f i f j. Voorbeeld 5.1. Gegeven is een gewichtenrij 3, 4, 4, 6, 7, 15 De twee kleinste gewichten zijn onderstreept. We vervangen deze door hun som 3 + 4, dus door 7, waarboven we een streep zetten, we brengen de nieuwe rij gewichten weer op volgorde, en we onderstrepen weer de twee eerste (kleinste) gewichten in de rij: 4, 6, 7, 7, 15 Zo gaan we door: 7, 7, 10, 15 10, 14, 15 15, Nu lopen we in omgekeerde volgorde langs de recursie om de boom te tekenen. De laatste regel geeft een boom met alleen een wortel met gewicht 39. Daar hangen we twee bladeren aan met gewichten 15 en 24. Aan het blad met bovenstreept gewicht 24 hangen we twee bladeren met gewichten die onderstreept zijn in de regel erboven, dus 10 en 14. Enzovoorts. Hoe goed is de Huffman-codering, als we deze vergelijken met de entropie? Het antwoord wordt gegeven door (4.3). De gemiddelde bitlengte per karakter bij Huffman-codering is H(S) en < H(S) + 1, maar vanwege de minimaliteit ook de gemiddelde bitlengte per karakter bij Shannon-Fano-codering. Uiteraard moet de (de)coderingstabel ook in de gecodeerde file worden meegegeven. Dit neemt extra ruimte in beslag, die relatief groot kan zijn als C groot is. Maar als C uit hoogstens 128 of 256 elementen bestaat, dan is de decoderingstabel bij een file van enige omvang maar een kleine overhead. Een nadeel van Huffman-codering is dat we de file twee keer moeten doorlopen: eenmaal om de frequenties van de karakters te tellen en eenmaal om de codering uit te voeren. Om hieraan tegemoet te komen is de adaptieve Huffman-codering opgezet. Hier begin je met toekennen van gewicht 1 aan alle mogelijk voorkomende karakters en zet je de bijbehorende Huffman-boom op. Daarna ga je karakters inlezen. Na elk ingelezen karakter wordt het gewicht van dat karakter 8
9 opgehoogd, wat mogelijk aanleiding geeft tot bijstellen van de Huffman-boom. Bij het decoderen moet deze boom evenzo worden bijgehouden om te weten wat de actuele coderingstabel is. Dit lijkt zeer tijdrovend, maar het kan slim en relatief snel gebeuren. Hieraan zijn de namen van Faller, Gallager en Knuth verbonden. Men spreekt ook wel van het FGK-algoritme. Er is een probleem met de adaptieve Huffman-codering als een beperkt aantal karakters een tijd lang vaak zijn voorgekomen, maar dan plotseling niet of weinig, terwijl een ander karakter vaak gaat voorkomen. Dan duurt het lang totdat dit nieuwe karakter voldoende gewicht heeft opgebouwd om met weinig bits gecodeerd te worden. Een remedie werd gesuggereerd door Gallager. Vermenigvuldig periodiek, na inlezen van een vast aantal karakters, alle gewichten 1 van dat moment met een getal < 1, bijv. 16. Hierdoor krijgen recente trendwijzigingen in de file meer nadruk dan wat langer geleden gebeurde. Als er echter geen trendwijziging is, dan blijft de vermenigvuldiging van de gewichten zonder effect, wat ook de bedoeling is. 6 Entropie van hogere orde Deze paragraaf geeft een uitbreiding van wat we in 2 over entropie bespraken. Stel nu dat we twee kansruimtes (S, P ) en (T, Q) hebben, waarbij T = {t 1,..., t n } met kans q j voor de gebeurtenis t j. Met de twee kansruimtes zijn entropiewaarden H(S) en H(T ) geassocieerd. Er zijn diverse samenstellingen van S en T mogelijk waarmee een nieuwe entropie geassocieerd kan worden. 1. Direct product De kansruimte (S T, P Q) bestaat uit de gebeurtenissen (s i, t j ) met kans p i q j, i = 1,..., m, j = 1,..., n (dus de gebeurtenissen s i en t j zijn onafhankelijk van elkaar). We rekenen eenvoudig na dat H(S T ) = H(S) + H(T ). (6.1) We kunnen ons voorstellen dat we eerst een bericht binnenkrijgen van type S, daarna van type T. De gemiddelde informatie die we na die twee berichten hebben binnengekregen is de som van de gemiddelde informatie bij het eerste bericht en bij het tweede bericht. Denk bijvoorbeeld aan het na elkaar ontvangen van twee karakters die onafhankelijk van elkaar zijn. Hier is T = S, Q = P. 2. Fusie (amalgamation) De elementen s i van S worden samengevoegd in groepjes t j, die de elementen van T vormen. De kans q j voor t j is de som van de kansen p i van de s i die samen t j vormen. Dan H(S) H(T ). (6.2) Door de fusie daalt de gemiddelde informatie per gebeurtenis. Bijvoorbeeld, in plaats van een letter door te krijgen, wordt ons alleen bericht of het een klinker of medeklinker is. Dan daalt de entropie. Het bewijs van (6.2) volgt uit (3.3) (met de p i s en q i s verwisseld). 3. Samenvoeging (join) Een ruimte S T met elementen (s i, t j ) met kans r ij, i = 1,..., m, j = 1,..., n zo dat p i = j r ij en q j = i r ij. Dus S en T zijn allebei als fusies van S T op te vatten. Dan kan bewezen worden dat max(h(s), H(T ) H(S T ) H(S) + H(T ). (6.3) 9
10 De eerste ongelijkheid in (6.3) volgt uit (6.2), de tweede uit (3.3). Een direct product S T is een speciaal geval van samenvoeging S T. Er geldt H(S T ) = H(S)+H(T ) desda S T = S T. Denk als voorbeeld van samenvoeging aan het na elkaar ontvangen van twee karakters die niet persé onafhankelijk van elkaar zijn, zoals gebruikelijk in letters van woorden uit een bepaalde taal. Hier is T = S, Q = P. Algemener kunnen we naar de samenvoeging k S = S S... S van k ruimtes S kijken. Dan ( k ) ( k 1 ) H S H S + H(S) kh(s). (6.4) ( k ) Dus voor de entropie per gebeurtenis geldt dat k 1 H S H(S). 4. Voorwaardelijke entropie Neem S en T zoals in de definitie van S T. Dan is de voorwaardelijke entropie van S onder T gedefinieerd door H(T S) = j=1 n r ij log(r ij /p i ). (6.5) We kunnen r ij /p i als de voorwaardelijke kans op gebeurtenis (s i, t j ) opvatten onder gegeven dat gebeurtenis s i heeft plaats gevonden. Dus log(r ij /p i ) is de informatie die gegeven wordt door gebeurtenis t j als gegeven is dat daarvoor gebeurtenis s i heeft plaats gevonden. Dan is H(T S) de verwachtingswaarde van deze voorwaardelijke informaties. Er kan eenvoudig worden nagerekend dat H(T S) = H(S T ) H(S), (6.6) H(T S) H(T ). (6.7) Gelijkheid in (6.7) geldt desda de gebeurtenissen uit T onafhankelijk zijn van de gebeurtenissen uit S. Een ander belangrijk resultaat is het volgende. Stelling 6.1. Laat de kansruimte (Ŝ, P ) een fusie zijn van de kansruimte (S, P ) en zij (T, Q) ook een kansruimte. Dan H(T S) H(T Ŝ). (6.8) Het bewijs kan teruggevoerd worden tot (3.1). We zijn speciaal geïnteresseerd in het volgende speciale geval van (6.8), (6.6) en (6.4): ( H S k ) ( S H S ) k 1 S... H (S S) H(S), (6.9) ( k+1 ) ( k ) ( H S = H S + H S k ) S = H(S) + k H l=1 ( S l ) S, (6.10) ( k+1 ) ( (k + 1)H(S) H S (k + 1) H S k ) S. (6.11) De voorwaardelijke entropie H (k) (S) := H ( S k ) S (6.12) 10
11 wordt de k-de orde entropie van S genoemd. Als we S opvatten als de verzameling van mogelijke karakters, dan is H (k) (S) de voorwaardelijke entropie van het ontvangen van een karakter als de voorgaande k karakters bekend zijn. We kunnen voor de kansverdelingen in S, S S, etc. uitgaan van a priori aangenomen kansverdelingen, maar we kunnen ook benaderingen van deze (hypothetische) kansverdelingen vinden door frequenties van karakters in de gegeven tekst na te gaan, en ook de frequenties van de strings van lengte 2, 3 etc. Als onze tekst lengte L heeft en als het aantal keren dat het karakter s i voorkomt gelijk is aan l i, dan kennen we aan het karakter s i kans p i = l i /L toe. Evenzo, als de string s i s j l ij keer voorkomt, dan kennen we aan deze string kans r ij = l ij /(L 1) toe. Voorts kennen we aan het karakter s j voorwaardelijke kans l ij /l i toe om na een karakter s i te komen. In [1, Ch. 4] wordt een grote verzameling van Engelse teksten besproken, het Brown corpus, aan de hand waarvan veel taalstatistiek is bedreven. Het bestand bevat de meest uiteenlopende Engelse teksten, totaal ongeveer een miljoen woorden. In Engelse teksten wordt met 94 verschillende karakters gewerkt (kleine letters, hoofdletters, de spatie, leestekens,...). De meest voorkomende karakters in het Brown corpus zijn (achter elk karakter wordt de kans gegeven): spatie (0.174), e (0.098), i (0.070), a (0.061), o (0.059), i (0.055), n (0.055), s (0.050), r (0.047), h (0.041), l (0.032), d (0.030), c (0.023), u (0.021), m (0.019), f (0.018), p (0.015), g (0.015), w (0.014), y (0.013), b (0.011), komma (0.01), punt (0.08), v (0.08), k (0.05), T (0.03),.... Dit levert een entropie van H(S) = 4.47 bits. Hier is S de verzameling van de 94 karakters. (Als alle karakters even waarschijnlijk zouden zijn, dan was de entropie 6.55 bits.) De meest voorkomende strings van 2 karakters (digrams) in het Brown corpus zijn: e (0.03), t (0.024), th (0.020), he (2.0),.... Dit levert een eerste orde entropie H (1) (S) = 3.59 bits (wat in overeenstemming is met ongelijkheid (6.7)). Voor de strings van 3 resp. 4 karakters in het Brown corpus worden entropiewaarden gevonden van H (2) (S) = 2.92 resp. H (3) (S) = 2.33 bits. Een andere benadering, ook beschreven in [1, Ch. 4], probeert de entropie van het Engels te bepalen door aan proefpersonen teksten aan te bieden, waarbij men, na een beginstukje van de tekst, telkens het volgende karakter moet voorspellen. Als men niet het goede karakter zegt, dan mag men een nieuwe poging doen, net zo lang tot men het goed heeft. Hieruit krijgt de onderzoeker een idee van de waarde van H (k) (S) voor grote k, waarbij S de verzameling van karakters is, bij dit experiment beperkt tot de 26 letters en de spatie. De rij van deze k-de orde entropieën (k = 0, 1, 2,...) is niet-stijgend dus nadert van boven een limiet, waarvan we veronderstellen dat hij positief is. Men veronderstelt, mede op grond van de experimenten, dat de limiet-entropie ligt tussen 0.6 en 1.3 bits. Referenties [1] T. C. Bell, J. G. Gleary and I. H. Witten, Text compression, Prentice Hall, [2] R.W. Hamming, Coding and information theory, Prentice-Hall, [3] G. A. Harris, P. D. Johnson and D. R. Hankerson, Introduction to information theory and data compression, Chapman & Hall, 2nd edition, 2003 (or 1st edition, 1998). [4] 11
11 Informatie en entropie.
1 11 Informatie en entropie. 11.1 Discrete kansverdelingen. Als we een experiment doen levert dat informatie op. Als de uitkomst van het experiment vrijwel zeker is, dan is dat weinig informatie. Als de
EXAMEN INFORMATIETHEORIE I (5JJ40 / 5K020) 25 maart 2004, 9u00 12u00-1 -
EXAMEN INFORMATIETHEORIE I (5JJ40 / 5K020) 25 maart 2004, 9u00 12u00-1 - Zet de antwoorden in de daarvoor bestemde vakjes en lever alleen deze bladen in! LET OP: Dit werk bevat zowel de opgaven voor het
Combinatoriek groep 1 & 2: Recursie
Combinatoriek groep 1 & : Recursie Trainingsweek juni 008 Inleiding Bij een recursieve definitie van een rij wordt elke volgende term berekend uit de vorige. Een voorbeeld van zo n recursieve definitie
Machten, exponenten en logaritmen
Machten, eponenten en logaritmen Machten, eponenten en logaritmen Macht, eponent en grondtal Eponenten en logaritmen hebben alles met machtsverheffen te maken. Een macht als 4 is niets anders dan de herhaalde
III.2 De ordening op R en ongelijkheden
III.2 De ordening op R en ongelijkheden In de vorige paragraaf hebben we axioma s gegeven voor de optelling en vermenigvuldiging in R, maar om R vast te leggen moeten we ook ongelijkheden in R beschouwen.
Inleiding Analyse 2009
Inleiding Analyse 2009 Inleveropgaven A). Stel f(, y) = In (0, 0) is f niet gedefinieerd. We bestuderen y2 2 + y 4. lim f(, y). (,y) (0,0) 1. Bepaal de waarde van f(, y) op een willekeurige rechte lijn
Grafen. Indien de uitgraad van ieder punt 1 is, dan bevat de graaf een cykel. Indien de ingraad van ieder punt 1 is, dan bevat de graaf een cykel.
Grafen Grafen Een graaf bestaat uit een verzameling punten (ook wel knopen, of in het engels vertices genoemd) en een verzameling kanten (edges) of pijlen (arcs), waarbij de kanten en pijlen tussen twee
Tentamen Grondslagen van de Wiskunde A Met beknopte uitwerking
Tentamen Grondslagen van de Wiskunde A Met beknopte uitwerking 10 december 2013, 09:30 12:30 Dit tentamen bevat 5 opgaven; zie ook de ommezijde. Alle opgaven tellen even zwaar (10 punten); je cijfer is
1 Rekenen in eindige precisie
Rekenen in eindige precisie Een computer rekent per definitie met een eindige deelverzameling van getallen. In dit hoofdstuk bekijken we hoe dit binnen een computer is ingericht, en wat daarvan de gevolgen
V.2 Limieten van functies
V.2 Limieten van functies Beschouw een deelverzameling D R, een functie f: D R en zij c R. We willen het gedrag van f in de buurt van c bestuderen. De functiewaarde in c is daarvoor niet belangrijk, de
Een combinatorische oplossing voor vraag 10 van de LIMO 2010
Een combinatorische oplossing voor vraag 10 van de LIMO 2010 Stijn Vermeeren (University of Leeds) 16 juni 2010 Samenvatting Probleem 10 van de Landelijke Interuniversitaire Mathematische Olympiade 2010vraagt
Projectieve Vlakken en Codes
Projectieve Vlakken en Codes 1. De Fanocode Foutdetecterende en foutverbeterende codes. Anna en Bart doen mee aan een spelprogramma voor koppels. De ene helft van de deelnemers krijgt elk een kaart waarop
RSA. F.A. Grootjen. 8 maart 2002
RSA F.A. Grootjen 8 maart 2002 1 Delers Eerst wat terminologie over gehele getallen. We zeggen a deelt b (of a is een deler van b) als b = qa voor een of ander geheel getal q. In plaats van a deelt b schrijven
We beginnen met de eigenschappen van de gehele getallen.
II.2 Gehele getallen We beginnen met de eigenschappen van de gehele getallen. Axioma s voor Z De gegevens zijn: (a) een verzameling Z; (b) elementen 0 en 1 in Z; (c) een afbeelding +: Z Z Z, de optelling;
2 n 1. OPGAVEN 1 Hoeveel cijfers heeft het grootste bekende Mersenne-priemgetal? Met dit getal vult men 320 krantenpagina s.
Hoofdstuk 1 Getallenleer 1.1 Priemgetallen 1.1.1 Definitie en eigenschappen Een priemgetal is een natuurlijk getal groter dan 1 dat slechts deelbaar is door 1 en door zichzelf. Om technische redenen wordt
Getallenleer Inleiding op codeertheorie. Cursus voor de vrije ruimte
Getallenleer Inleiding op codeertheorie Liliane Van Maldeghem Hendrik Van Maldeghem Cursus voor de vrije ruimte 2 Hoofdstuk 1 Getallenleer 1.1 Priemgetallen 1.1.1 Definitie en eigenschappen Een priemgetal
opgaven formele structuren tellen Opgave 1. Zij A een oneindige verzameling en B een eindige. Dat wil zeggen (zie pagina 6 van het dictaat): 2 a 2.
opgaven formele structuren tellen Opgave 1. Zij A een oneindige verzameling en B een eindige. Dat wil zeggen (zie pagina 6 van het dictaat): ℵ 0 #A, B = {b 0,..., b n 1 } voor een zeker natuurlijk getal
Kettingbreuken. 20 april 2010 1 K + 1 E + 1 T + 1 T + 1 I + 1 N + 1 G + 1 B + 1 R + 1 E + 1 U + 1 K + E + 1 N 1 2 + 1 0 + 1 A + 1 P + 1 R + 1 I + 1
Kettingbreuken Frédéric Guffens 0 april 00 K + E + T + T + I + N + G + B + R + E + U + K + E + N 0 + A + P + R + I + L + 0 + + 0 Wat zijn Kettingbreuken? Een kettingbreuk is een wiskundige uitdrukking
Bijzondere kettingbreuken
Hoofdstuk 15 Bijzondere kettingbreuken 15.1 Kwadratische getallen In het vorige hoofdstuk hebben we gezien dat 2 = 1, 2, 2, 2, 2, 2, 2,.... Men kan zich afvragen waarom we vanaf zeker moment alleen maar
Examen G0U13 Bewijzen en Redeneren Bachelor 1ste fase Wiskunde. vrijdag 31 januari 2014, 8:30 12:30. Auditorium L.00.07
Examen G0U13 Bewijzen en Redeneren Bachelor 1ste fase Wiskunde vrijdag 31 januari 2014, 8:30 12:30 Auditorium L.00.07 Geef uw antwoorden in volledige, goed lopende zinnen. Het examen bestaat uit 5 vragen.
Geldwisselprobleem van Frobenius
Geldwisselprobleem van Frobenius Karin van de Meeberg en Dieuwertje Ewalts 12 december 2001 1 Inhoudsopgave 1 Inleiding 3 2 Afspraken 3 3 Is er wel zo n g? 3 4 Eén waarde 4 5 Twee waarden 4 6 Lampenalgoritme
1. Orthogonale Hyperbolen
. Orthogonale Hyperbolen a + b In dit hoofdstuk wordt de grafiek van functies van de vorm y besproken. Functies c + d van deze vorm noemen we gebroken lineaire functies. De grafieken van dit soort functies
Deel II. Probabilistische Modellen
Deel II Probabilistische Modellen Les 10 Entropie, informatie en afstanden van kansverdelingen Het algemeen probleem in de patroonherkenning is, gegeven een aantal klassen K 1,..., K n van mogelijke patronen,
Discrete Structuren. Piter Dykstra Sietse Achterop Opleidingsinstituut Informatica en Cognitie
Discrete Structuren Piter Dykstra Sietse Achterop Opleidingsinstituut Informatica en Cognitie www.math.rug.nl/~piter [email protected] 3 maart 2008 GRAFEN & BOMEN Paragrafen 6.1-6.4 Discrete Structuren
Combinatoriek groep 2
Combinatoriek groep 2 Recursie Trainingsdag 3, 2 april 2009 Homogene lineaire recurrente betrekkingen We kunnen een rij getallen a 0, a 1, a 2,... op twee manieren definiëren: direct of recursief. Een
Combinatoriek groep 1
Combinatoriek groep 1 Recursie Trainingsdag 3, 2 april 2009 Getallenrijen We kunnen een rij getallen a 0, a 1, a 2,... op twee manieren definiëren: direct of recursief. Een directe formule geeft a n in
1 Kettingbreuken van rationale getallen
Kettingbreuken van rationale getallen Laten we eens starten met een breuk bijvoorbeeld 37/3 Laten we hier ons kettingbreuk algoritme op los, We concluderen hieruit dat 37 3 3 + 3 + + 37 3 + + + hetgeen
Uitgebreide uitwerking Tentamen Complexiteit, juni 2017
Uitgebreide uitwerking Tentamen Complexiteit, juni 017 Opgave 1. a. Een pad van de wortel naar een blad stelt de serie achtereenvolgende arrayvergelijkingen voor die het algoritme doet op zekere invoer.
OPLOSSINGEN VAN DE OEFENINGEN
OPLOSSINGEN VAN DE OEFENINGEN 1.3.1. Er zijn 42 mogelijke vercijferingen. 2.3.4. De uitkomsten zijn 0, 4 en 4 1 = 4. 2.3.6. Omdat 10 = 1 in Z 9 vinden we dat x = c 0 +... + c m = c 0 +... + c m. Het getal
Examen Datastructuren en Algoritmen II
Tweede bachelor Informatica Academiejaar 2012 2013, tweede zittijd Examen Datastructuren en Algoritmen II Naam :.............................................................................. Lees de hele
Discrete Structuren. Piter Dykstra Opleidingsinstituut Informatica en Cognitie
Discrete Structuren Piter Dykstra Opleidingsinstituut Informatica en Cognitie www.math.rug.nl/~piter [email protected] 23 februari 2009 GRAFEN & BOMEN Paragrafen 6.1-6.4 Discrete Structuren Week 3 en 4:
Uitwerking tentamen Algoritmiek 10 juni :00 13:00
Uitwerking tentamen Algoritmiek 10 juni 2014 10:00 13:00 1. Dominono s a. Toestanden: n x n bord met in elk hokje een O, een X of een -. Hierbij is het aantal X gelijk aan het aantal O of hooguit één hoger.
Tentamen Discrete Wiskunde 1 10 april 2012, 14:00 17:00 uur
Tentamen Discrete Wiskunde 0 april 0, :00 7:00 uur Schrijf je naam op ieder blad dat je inlevert. Onderbouw je antwoorden, met een goede argumentatie zijn ook punten te verdienen. Veel succes! Opgave.
Hoofdstuk 3. Equivalentierelaties. 3.1 Modulo Rekenen
Hoofdstuk 3 Equivalentierelaties SCHAUM 2.8: Equivalence Relations Twee belangrijke voorbeelden van equivalentierelaties in de informatica: resten (modulo rekenen) en cardinaliteit (aftelbaarheid). 3.1
Tentamen Discrete Wiskunde
Discrete Wiskunde (WB011C) 22 januari 2016 Tentamen Discrete Wiskunde Schrijf op ieder ingeleverd blad duidelijk leesbaar je naam en studentnummer. De opgaven 1 t/m 6 tellen alle even zwaar. Je hoeft slechts
1 Delers 1. 3 Grootste gemene deler en kleinste gemene veelvoud 12
Katern 2 Getaltheorie Inhoudsopgave 1 Delers 1 2 Deelbaarheid door 2, 3, 5, 9 en 11 6 3 Grootste gemene deler en kleinste gemene veelvoud 12 1 Delers In Katern 1 heb je geleerd wat een deler van een getal
Voorbereiding toelatingsexamen arts/tandarts. Wiskunde: Logaritmen en getal e. 23 juli 2015. dr. Brenda Casteleyn
Voorbereiding toelatingsexamen arts/tandarts Wiskunde: Logaritmen en getal e 23 juli 2015 dr. Brenda Casteleyn Met dank aan: Atheneum van Veurne (http://www.natuurdigitaal.be/geneeskunde/fysica/wiskunde/wiskunde.htm),
TW2020 Optimalisering
TW2020 Optimalisering Hoorcollege 8 Leo van Iersel Technische Universiteit Delft 28 oktober 2015 Leo van Iersel (TUD) TW2020 Optimalisering 28 oktober 2015 1 / 25 Definitie Een boom is een samenhangende
V.4 Eigenschappen van continue functies
V.4 Eigenschappen van continue functies We bestuderen een paar belangrijke stellingen over continue functies. Maxima en minima De stelling over continue functies die we in deze paragraaf bewijzen zegt
Greedy algoritmes. Algoritmiek
Greedy algoritmes Algoritmiek Algoritmische technieken Trucs, methoden, paradigma s voor het ontwerpen van algoritmen Dynamisch Programmeren Divide & Conquer Greedy 2 Greedy algoritme Bouwt de oplossing
Voorbereiding toelatingsexamen arts/tandarts. Wiskunde: Logaritmen en getal e 1/3/2017. dr. Brenda Casteleyn
Voorbereiding toelatingsexamen arts/tandarts Wiskunde: Logaritmen en getal e 1/3/2017 dr. Brenda Casteleyn Met dank aan: Atheneum van Veurne, Leen Goyens (http://users.telenet.be/toelating) 1. Inleiding
Onafhankelijke verzamelingen en Gewogen Oplossingen, door Donald E. Knuth, The Art of Computer Programming, Volume 4, Combinatorial Algorithms
Onafhankelijke verzamelingen en Gewogen Oplossingen, door Donald E. Knuth, The Art of Computer Programming, Volume 4, Combinatorial Algorithms Giso Dal (0752975) Pagina s 5 7 1 Deelverzameling Representatie
TW2020 Optimalisering
TW2020 Optimalisering Hoorcollege 8 Leo van Iersel Technische Universiteit Delft 2 november 2016 Leo van Iersel (TUD) TW2020 Optimalisering 2 november 2016 1 / 28 Minimum Opspannende Boom (Minimum Spanning
Opgaven Inleiding Analyse
Opgaven Inleiding Analyse E.P. van den Ban Limieten en continuïteit Opgave. (a) Bewijs direct uit de definitie van iet dat y 0 y = 0. (b) Bewijs y 0 y 3 = 0 uit de definitie van iet. (c) Bewijs y 0 y 3
3. Structuren in de taal
3. Structuren in de taal In dit hoofdstuk behandelen we de belangrijkst econtrolestructuren die in de algoritmiek gebruikt worden. Dit zijn o.a. de opeenvolging, selectie en lussen (herhaling). Vóór we
Opgave 1b: Toon ook aan dat meer algemeen geldt: Als het lukt met n = a munten in w keer wegen, dan lukt het voor a < n 2a in w + 1 keer wegen.
Uitwerking Puzzel 92-7 Allemaal gelijk? Wobien Doyer Lieke de Rooij Er zijn veel puzzels over het opsporen van één valse munt tussen een aantal goede munten met hulp van een balans. Bij deze puzzel is
Combinatorische Algoritmen: Binary Decision Diagrams, Deel III
Combinatorische Algoritmen: Binary Decision Diagrams, Deel III Sjoerd van Egmond LIACS, Leiden University, The Netherlands [email protected] 2 juni 2010 Samenvatting Deze notitie beschrijft een nederlandse
Tweede huiswerkopdracht Lineaire algebra 1 Uitwerking en opmerkingen
Tweede huiswerkopdracht Lineaire algebra 1 en opmerkingen November 10, 2009 Opgave 1 Gegeven een vectorruimte V met deelruimtes U 1 en U 2. Als er geldt dim U 1 = 7, dimu 2 = 9, en dim(u 1 U 2 ) = 4, wat
Rekenen aan wortels Werkblad =
Rekenen aan wortels Werkblad 546121 = Vooraf De vragen en opdrachten in dit werkblad die vooraf gegaan worden door, moeten schriftelijk worden beantwoord. Daarbij moet altijd duidelijk zijn hoe de antwoorden
Radboud Universiteit Nijmegen Tentamen Analyse 1 WP001B 26 augustus 2010, , Examenzaal
Radboud Universiteit Nijmegen Tentamen Analyse 1 WP001B 26 augustus 2010, 14.00 17.00, Examenzaal Het gebruik van een rekenmachine en/of telefoon is niet toegestaan. U mag geen gebruik maken van het boek
Tweede college algoritmiek. 12 februari Grafen en bomen
College 2 Tweede college algoritmiek 12 februari 2016 Grafen en bomen 1 Grafen (herhaling) Een graaf G wordt gedefinieerd als een paar (V,E), waarbij V een eindige verzameling is van knopen (vertices)
1 Limiet van een rij Het begrip rij Bepaling van een rij Expliciet voorschrift Recursief voorschrift 3
HOOFDSTUK 6: RIJEN 1 Limiet van een rij 2 1.1 Het begrip rij 2 1.2 Bepaling van een rij 2 1.2.1 Expliciet voorschrift 2 1.2.2 Recursief voorschrift 3 1.2.3 Andere gevallen 3 1.2.4 Rijen met de grafische
Praktisch bestaan er enkele eenvoudige methoden om een decimaal getal om te zetten naar een binair getal. We bespreken hier de twee technieken.
Talstelsels 1 Algemeenheden Digitale systemen werken met nullen en enen omdat dit elektronisch gemakkelijke te verwezenlijken is. De transistor kent enkel twee toestanden (geleiden of sperren) Hierdoor
V Kegelsneden en Kwadratische Vormen in R. IV.0 Inleiding
V Kegelsneden en Kwadratische Vormen in R IV.0 Inleiding V. Homogene kwadratische vormen Een vorm als H (, ) = 5 4 + 8 heet een homogene kwadratische vorm naar de twee variabelen en. Een vorm als K (,
(b) Formuleer het verband tussen f en U(P, f), en tussen f en L(P, f). Bewijs de eerste. (c) Geef de definitie van Riemann integreerbaarheid van f.
Radboud Universiteit Nijmegen Tentamen Analyse 1 WP001B 2 juli 2015, 08:30 11:30 (12:30) Het gebruik van een rekenmachine, telefoon of tablet is niet toegestaan. U mag geen gebruik maken van het boek Analysis
Ter Leering ende Vermaeck
Ter Leering ende Vermaeck 15 december 2011 1 Caleidoscoop 1. Geef een relatie op Z die niet reflexief of symmetrisch is, maar wel transitief. 2. Geef een relatie op Z die niet symmetrisch is, maar wel
Numerieke aspecten van de vergelijking van Cantor. Opgedragen aan Th. J. Dekker. H. W. Lenstra, Jr.
Numerieke aspecten van de vergelijking van Cantor Opgedragen aan Th. J. Dekker H. W. Lenstra, Jr. Uit de lineaire algebra is bekend dat het aantal oplossingen van een systeem lineaire vergelijkingen gelijk
TW2020 Optimalisering
TW2020 Optimalisering Hoorcollege 11 Leo van Iersel Technische Universiteit Delft 25 november 2015 Leo van Iersel (TUD) TW2020 Optimalisering 25 november 2015 1 / 28 Vandaag Vraag Voor welke problemen
De partitieformule van Euler
De partitieformule van Euler Een kennismaking met zuivere wiskunde J.H. Aalberts-Bakker 29 augustus 2008 Doctoraalscriptie wiskunde, variant Communicatie en Educatie Afstudeerdocent: Dr. H. Finkelnberg
II.3 Equivalentierelaties en quotiënten
II.3 Equivalentierelaties en quotiënten Een belangrijk begrip in de wiskunde is het begrip relatie. Een relatie op een verzameling is een verband tussen twee elementen uit die verzameling waarbij de volgorde
Uitleg. Welkom bij de Beverwedstrijd 2006. Je krijgt 15 vragen, die je in maximaal 45 minuten moet beantwoorden.
Uitleg Welkom bij de Beverwedstrijd 2006 Je krijgt 15 vragen, die je in maximaal 45 minuten moet beantwoorden. Je krijgt 5 vragen van niveau A, 5 vragen van niveau B en 5 vragen van niveau C. Wij denken
Elementaire rekenvaardigheden
Hoofdstuk 1 Elementaire rekenvaardigheden De dingen die je niet durft te vragen, maar toch echt moet weten Je moet kunnen optellen en aftrekken om de gegevens van de patiënt nauwkeurig bij te kunnen houden.
Uitwerking Puzzel 93-1, Doelloos
Uitwerking Puzzel 93-1, Doelloos Wobien Doyer Lieke de Rooij Volgens de titel is deze puzzel zonder doel, dus zonder bekende toepassing. Het doel is echter nul en dat is zeker in de wiskunde niet niks.
Volledige inductie. Hoofdstuk 7. Van een deelverzameling V van de verzameling N van alle natuurlijke getallen veronderstellen.
Hoofdstuk 7 Volledige inductie Van een deelverzameling V van de verzameling N van alle natuurlijke getallen veronderstellen we het volgende: (i) 0 V (ii) k N k V k + 1 V Dan is V = N. Men ziet dit als
DATA COMPRESSIE DATASTRUCTUREN
1 DATA COMPRESSIE DATASTRUCTUREN Dr. D.P. Huijsmans 28 november 2012 Universiteit Leiden LIACS DATA COMPRESSIE WAAROM? Data opslaan kost ruimte (bits/bytes/words) Hoe minder ruimte hoe efficienter geheugen
Week 1 20-02-2013. Hier vind je uitwerkingen van enkele opgaven uit het dictaat Grafen: Kleuren en Routeren.
Combinatorische Optimalisatie, 2013 Week 1 20-02-2013 Hier vind je uitwerkingen van enkele opgaven uit het dictaat Grafen: Kleuren en Routeren. Opgave 1.16 Bewijs dat elke graaf een even aantal punten
Toegepaste Wiskunde 2: Het Kalman-filter
Toegepaste Wiskunde 2: Het Kalman-filter 25 februari, 2008 Hans Maassen 1. Inleiding Het Kalman filter schat de toestand van een systeem op basis van een reeks, door ruis verstoorde waarnemingen. Een meer
3 De stelling van Kleene
18 3 De stelling van Kleene Definitie 3.1 Een formele taal heet regulier als hij wordt herkend door een deterministische eindige automaat. Talen van de vorm L(r) met r een reguliere expressie noemen we
Modulewijzer InfPbs00DT
Modulewijzer InfPbs00DT W. Oele 0 juli 008 Inhoudsopgave Inleiding 3 Waarom wiskunde? 3. Efficiëntie van computerprogramma s............... 3. 3D-engines en vectoranalyse................... 3.3 Bewijsvoering
Examen Datastructuren en Algoritmen II
Tweede bachelor Informatica Academiejaar 2016 2017, eerste zittijd Examen Datastructuren en Algoritmen II Naam :.............................................................................. Lees de hele
Vierde college complexiteit. 14 februari Beslissingsbomen
College 4 Vierde college complexiteit 14 februari 2017 Restant zoeken Beslissingsbomen 1 Binair zoeken Links := 1; Rechts := n; while Links Rechts do Midden := Links + Rechts 2 ; if X = A[Midden] then
Grafieken van veeltermfuncties
(HOOFDSTUK 43, uit College Mathematics, door Frank Ayres, Jr. and Philip A. Schmidt, Schaum s Series, McGraw-Hill, New York; dit is de voorbereiding voor een uit te geven Nederlandse vertaling). Grafieken
Vierde college complexiteit. 26 februari Beslissingsbomen en selectie Toernooimethode Adversary argument
Complexiteit 2019/04 College 4 Vierde college complexiteit 26 februari 2019 Beslissingsbomen en selectie Toernooimethode Adversary argument 1 Complexiteit 2019/04 Zoeken: samengevat Ongeordend lineair
Examen G0U13 Bewijzen en Redeneren Bachelor of Science Fysica en Wiskunde. vrijdag 3 februari 2012, 8:30 12:30
Examen G0U13 Bewijzen en Redeneren Bachelor of Science Fysica en Wiskunde vrijdag 3 februari 2012, 8:30 12:30 Naam: Geef uw antwoorden in volledige, goed lopende zinnen. Het examen bestaat uit 5 vragen.
Inleiding Digitale Techniek
Inleiding Digitale Techniek Week 2 Binaire getallen, BCD, Gray, ASCII, 7-segment Jesse op den Brouw INLDIG/205-206 Decimaal talstelsel Ons talstelsel is een zogenaamd positioneel talstelsel. Een getal
Binair Binair = tweewaardig Beperkt aantal mogelijke waarden (discreet aantal in amplitude) Wij zijn gewoon aan decimaal (tiendelig)
Binair Binair = tweewaardig Beperkt aantal mogelijke waarden (discreet aantal in amplitude) Wij zijn gewoon aan decimaal (tiendelig) In elektronische realisatie zijn 10 verschillende toestanden moeilijk
Getaltheorie I. c = c 1 = 1 c (1)
Lesbrief 1 Getaltheorie I De getaltheorie houdt zich bezig met het onderzoek van eigenschappen van gehele getallen, en meer in het bijzonder, van natuurlijke getallen. In de getaltheorie is het gebruikelijk
Over binaire beslissingsdiagrammen naar Donald E. Knuth s The Art of Computer Programming, Volume 4
Over binaire beslissingsdiagrammen naar Donald E. Knuth s The Art of Computer Programming, Volume 4 Jonathan K. Vis 1 Inleiding (blz. 70 72) In dit essay behandelen we bladzijden 70 75 van Donald E. Knuth
Het oplossen van stelsels lineaire vergelijkingen Wiskunde 2, 2DM60 College 2b
Het oplossen van stelsels lineaire vergelijkingen Wiskunde 2, 2DM60 College 2b Ruud Pellikaan [email protected] /k 2014-2015 Lineaire vergelijking 2/64 DEFINITIE: Een lineaire vergelijking in de variabelen
FLIPIT 5. (a i,j + a j,i )d i d j = d j + 0 = e d. i<j
FLIPIT JAAP TOP Een netwerk bestaat uit een eindig aantal punten, waarbij voor elk tweetal ervan gegeven is of er wel of niet een verbinding is tussen deze twee. De punten waarmee een gegeven punt van
Oneindige spelen. Dion Coumans. Begeleider: dr. W. Veldman
Oneindige spelen ion Coumans Begeleider: dr. W. Veldman Inhoudsopgave 1 Voorwoord 3 2 efinities 4 3 A is aftelbaar 6 4 Gale-Stewart-stelling 7 5 Stelling van Wolfe 11 2 1 Voorwoord Banach, Mazur en Ulam
I.3 Functies. I.3.2 Voorbeeld. De afbeeldingen f: R R, x x 2 en g: R R, x x 2 zijn dus gelijk, ook al zijn ze gegeven door verschillende formules.
I.3 Functies Iedereen is ongetwijfeld in veel situaties het begrip functie tegengekomen; vaak als een voorschrift dat aan elk getal een ander getal toevoegt, bijvoorbeeld de functie fx = x die aan elk
Je hebt twee uur de tijd voor het oplossen van de vraagstukken. µkw uitwerkingen. 12 juni 2015
Je hebt twee uur de tijd voor het oplossen van de vraagstukken. Elk vraagstuk is maximaal 10 punten waard. Begin elke opgave op een nieuw vel papier. µkw uitwerkingen 12 juni 2015 Vraagstuk 1. We kunnen
TW2040: Complexe Functietheorie
TW2040: Complexe Functietheorie week 4.1, donderdag K. P. Hart Faculteit EWI TU Delft Delft, 21 april, 2016 K. P. Hart TW2040: Complexe Functietheorie 1 / 32 Outline 1 K. P. Hart TW2040: Complexe Functietheorie
Voorbereiding toelatingsexamen arts/tandarts. Wiskunde: gemiddelden, ongelijkheden enz 23/5/2015. dr. Brenda Casteleyn
Voorbereiding toelatingsexamen arts/tandarts Wiskunde: gemiddelden, ongelijkheden enz 23/5/2015 dr. Brenda Casteleyn Met dank aan: Atheneum van Veurne (http://www.natuurdigitaal.be/geneeskunde/fysica/wiskunde/wiskunde.htm),
Begrenzing van het aantal iteraties in het max-flow algoritme
Begrenzing van het aantal iteraties in het max-flow algoritme Het oplossen van het maximum stroom probleem met behulp van stroomvermeerderende paden werkt, maar het aantal iteraties kan aardig de spuigaten
Radboud Universiteit Nijmegen
Radboud Universiteit Nijmegen Faculteit der Natuurwetenschappen, Wiskunde en Informatica L(,1)-labeling van grafen Naam: Studentnummer: Studie: Begeleider: Myrte klein Brink 4166140 Bachelor Wiskunde Dr.
Oefenopgaven Grondslagen van de Wiskunde A
Oefenopgaven Grondslagen van de Wiskunde A Jaap van Oosten 2007-2008 1 Kardinaliteiten Opgave 1.1. Bewijs, dat R N = R. Opgave 1.2. Laat Cont de verzameling continue functies R R zijn. a) Laat zien dat
Lineaire programmering
Lineaire programmering Hans Maassen kort naar Inleiding Besliskunde van J. Potters [Pot]. en Methods of Mathematical Economics van J. Franklin [Fra]. Lineaire programmering is het bepalen van het maximum
Discrete Wiskunde, College 12. Han Hoogeveen, Utrecht University
Discrete Wiskunde, College 12 Han Hoogeveen, Utrecht University Dynamische programmering Het basisidee is dat je het probleem stap voor stap oplost Het probleem moet voldoen aan het optimaliteitsprincipe
De Minimax-Stelling en Nash-Evenwichten
De Minima-Stelling en Nash-Evenwichten Sebastiaan A. Terwijn Radboud Universiteit Nijmegen Afdeling Wiskunde 20 september 2010 Dit is een bijlage bij het eerstejaars keuzevak Wiskunde, Politiek, en Economie.
Wanneer zijn veelvouden van proniks proniks?
1 Uitwerking puzzel 92-1 Wanneer zijn veelvouden van proniks proniks? Harm Bakker noemde het: pro-niks voor-niks De puzzel was voor een groot deel afkomstig van Frits Göbel. Een pronik is een getal dat
