Geografische invloed op taalvariatie

Maat: px
Weergave met pagina beginnen:

Download "Geografische invloed op taalvariatie"

Transcriptie

1 Geografische invloed op taalvariatie J. Wouda juni Inleiding Rijksuniversiteit Groningen Informatiekunde Een dialectologisch axioma is, dat geografische informatie tot op zekere hoogte ligt besloten in fonetische afstanden[11]. In dit onderzoek wordt ingegaan op de vraag in hoeverre de geografische afstanden van invloed zijn op de variatie binnen Duitse dialecten. We zijn hier in geïnteresseerd, omdat we graag willen voorspellen op grond waarvan er binnen de Duitse gebieden dialectveranderingen optreden. In dit onderzoek is gebruik gemaakt van de gedigitaliseerde versie van de Phonetischer Atlas von Deutschland. Dit is een in de jaren 60 en 70 van de vorige eeuw verzameld dialectcorpus, waar voor 147 woorden uit 186 Duitse plaatsen uitspraken zijn verzameld. Al deze uitspraken zijn vastgelegd in fonetisch schrift en vervolgens gedigitaliseerd naar X-SAMPA. Dit relatief oude corpus is van een dusdanige kwaliteit en omvang, dat het voor hedendaags onderzoek nog steeds zeer bruikbaar is. In dit onderzoek wordt gebruik gemaakt van een relatief nieuwe methode om dialectverschillen in kaart te brengen. Bij deze indeling wordt gebruik gemaakt van Monmonier s maximum verschil algoritme. Het doel van het gebruik van dit algoritme is om dialectgrenzen, barrières genaamd, op basis van positieve residuen in kaart te brengen. De residuen worden verkregen door toepassing van regressieanalyse. 2 Dialectometrie Dialectometrie is het meten van dialectverschillen. Bij de verschillende toepassingen van dialectometrie wordt verondersteld dat afstanden tussen 1

2 dialecten voornamelijk zijn gebaseerd op geografische afstanden[11]. De taalkundige verschillen tussen dialecten worden gemeten door te kijken naar verschillen in uitspraak. Om achter deze verschillen te komen, zullen er verschillende uitspraken met elkaar vergeleken moeten worden. Het eerste dialectometrisch onderzoek was er op gericht om te zoeken naar overlap in bepaalde uitspraken voor hetzelfde object. Simpel gezegd: als een uitspraak voor een object in twee plaatsen gelijk is en er een bepaalde drempelwaarde wordt overschreden van hoeveel overeenkomstige woorden er moeten zijn, horen de dialecten bij elkaar. Hedendaags onderzoek is gericht op fijnere verschillen tussen twee dialecten. Dit om tot nauwkeuriger conclusies te komen. Zo worden niet alleen hele woorden vergeleken, maar onderzoekt men woorden op het kleinst mogelijke niveau; dat van de klanken. Binnen onderzoek naar klankverschillen tussen woorden bestaan er meerdere methoden. 2.1 Toepassingen Dialectometrie Jean Séguy was de eerste persoon die zich bezighield met dialectometrie. Dit vond plaats in de begin jaren 70 van de vorige eeuw. Door de komst van computers kon men gedetailleerd dialectometrisch onderzoek verrichten. Bij een dialectometrisch onderzoek zijn, door de hoeveelheid data die zo n onderzoek met zich meebrengt, voor de opslag, verwerking en manipulatie van de data, computers onontbeerlijk[13]. Een probleem van het eerste dialectometrisch onderzoek was, dat data categorisch werd benaderd, waardoor er geen nadruk werd gelegd op kleine verschillen tussen dialecten. Oud onderzoek was voornamelijk gericht op het gebruik van verschillende woorden die werden gebruikt voor hetzelfde object. Dit leverde een heel grof beeld op van dialectverschillen in een bepaald gebied. De volgende stap in dialectometrie werd gezet door Goebl, die ontevreden was over de grofheid die de methode van Séguy met zich meebracht. De belangrijkste aanpassing die hij maakte, was door aan bepaalde woorden die niet veel voorkwamen een zwaarder gewicht toe te kennen. Hierdoor kregen deze woorden bij de analyse meer invloed op de dialectverschillen. Alhoewel de stap van Goebl al een verfijning was van de methode van Séguy, was de aanpak nog steeds categorisch. Onderzoekers waren er van overtuigd dat ze een nauwkeuriger indeling van dialecten zouden kunnen maken, als ze dieper zouden gaan dan de methodes van Séguy en Goebl. Er moest een stap van meta- naar micro-niveau worden gemaakt, waarbij het meta-niveau wordt voorgesteld door hele woorden en het micro-niveau door klanksegmenten. 2

3 Binnen de dialectometrie wordt elke klank een foneem genoemd. Ieder woord is opgebouwd uit een set fonemen. Voor het onderzoek naar foneemverschillen tussen dialecten, zijn er verschillende methoden ontwikkeld Frequentiemethode Door de broers Hoppenbrouwers is er in 1988 een methode ontwikkeld waarbij er fonetische kenmerken uit dialectteksten, omgezet in fonetisch schrift, worden geteld. Het aantal voorkomens van een fonetisch kenmerk of feature wordt geteld en opgeslagen. Zo wordt voor ieder dialect een profiel van onderscheidende kenmerken gemaakt. Deze methode wordt Feature Frequentiemethode (FFM) genoemd[2][10]. Een andere methode, die ook gebruikt maakt van frequenties, is de foonfrequentiemethode. Hierbij worden de frequenties van de verschillende fonemen voor twee corpora vergeleken. Hoe hoger het aantal overeenkomende klanken tussen twee corpora, hoe dichter ze binnen een classificatie bij elkaar horen. Een probleem van deze twee methoden is, dat ze beide geen rekening houden met de plaats van een klank binnen een woord Frequentie-per-woord-methode Bij deze methode worden steeds woordparen uit twee corpora vergeleken, waarbij wordt gelet op de frequentie van overeenkomstige klanken. Daarbij wordt niet gelet of de volgorde van de klanken overeenkomt. Het verschil met de frequentiemethodes is, dat er hele woorden vergeleken worden en niet één massa aan klanken met een andere massa aan klanken[10][16] Levenshteinmethode Omdat de drie bovengenoemde methoden geen rekening houden met de positie van een klank binnen een woord, is er een methode ontwikkeld die hier wel rekening mee houdt. Brett Kessler was in 1995 de eerste die het Levenshteinalgoritme toepaste in de dialectometrie en in 1996 is John Nerbonne[12][14] een serie onderzoeken begonnen naar de toepassing van dit algoritme. Bij de toepassing van het Levenshteinalgoritme worden voor twee dialecten de woordparen vergeleken. Daarbij wordt voor ieder woordpaar een berekening gemaakt hoeveel het kost om het ene woord om te zetten naar het andere. De totale kosten voor een heel corpus worden opgeteld en gedeeld door het totaal aantal woorden. Later in dit stuk zal er in meer detail uitgelegd worden wat het Levenshteinalgoritme inhoudt. 3

4 Het verschil tussen de frequentie-per-woord-methode en de Levenshteinmethode is, dat de frequentie-per-woord-methode geen rekening houdt met de volgorde van de klanken binnen een woord[10]. 2.2 Dialectgebieden of Dialectcontinuüm Binnen de dialectometrie bestonden aanvankelijk twee zienswijzen over de verdeling van dialecten. De ene zienswijze gaat er vanuit dat dialecten in gebieden met duidelijk aanwijsbare grenzen kunnen worden ingedeeld. De andere zienswijze gaat er vanuit dat de verdeling van dialecten geen scherpe grenzen laat zien, maar zicht uitstrekt over een continuüm. John Nerbonne en Wilbert Heeringa hebben in 2001 onderzoek gedaan naar dit dilemma. Zij voerden in dit onderzoek een derde zienswijze aan, namelijk dat van een aggregaat, wat betekent dat alle dialecten binnen het te onderzoeken gebied losjes verbonden zijn, maar toch allemaal deel uitmaken van dezelfde vereniging[11]. Deze methode heeft als voordeel, dat voorspeld kan worden hoeveel procent van de afstand tussen de dialecten kan worden verklaard door de geografische afstand. Binnen deze nieuwe zienswijze bestaan weer verschillende methoden om een verdeling te maken van gelieerde dialecten. Deze verdelingen worden indelingsmethoden genoemd. 2.3 Indelingsmethoden Er bestaan verschillende indelingsmethoden, waarvan een aantal voor ons interessant zijn. Niet alle indelingsmethoden zijn interessant om te vermelden, omdat niet alle methoden geschikt zijn voor de verwerking van een grote hoeveelheid numerieke data Clustering Bij clustering wordt tussen alle plaatsen, bijvoorbeeld op basis van de Levenshteinafstanden, een hiërarchie in de dialectafstanden gegenereerd. Hierbij worden clusters gecreëerd, waarbij eerst wordt gekeken naar de twee plaatsen die de kleinste afstand tot elkaar hebben. Deze twee plaatsen worden samengevoegd en vervolgens wordt de kleinste afstand bepaald tot de plaats die weer de kleinste afstand heeft tot deze samenvoeging. Dit proces wordt herhaald totdat er geen samenvoegingen meer mogelijk zijn[16]. Van de gemaakte indeling kan vervolgens een dendogram worden gemaakt. In figuur 1 wordt een deel van een dendogram afgebeeld. 4

5 Figure 1: Een deel van een dendogram Multidimensionele Herschaling Bij multidimensionele herschaling worden numerieke waarden met elkaar vergeleken en vervolgens grafisch weergegeven op een kaart. De afstandsverhoudingen uit de oorspronkelijke tabel, worden vertaald naar de kaart, zodat de verschillen zo getrouw mogelijk worden weergegeven. Door aan elk gebied ook nog een kleur mee te geven, worden de verhoudingen extra benadrukt[3][16]. Aan de multidimensionele herschaling kleeft een aantal nadelen. Een vrij banaal probleem is, dat vrijwel alle wetenschappelijke publicaties in zwart wit worden uitgegeven, omdat kleur te duur is. Van de duidelijke contrasten blijft dan weinig over. Een ander probleem is dat de kleuren niet altijd duidelijk de grenzen aangeven, of dat bij het printen van een kaart de kleuren worden veranderd. Een handicap die vooral bij mannen voorkomt, kleurenblindheid, kan ook voor problemen zorgen. Bij het maken van kaarten zijn we al snel op meerdere kleuren aangewezen, waaronder rood en groen; de kleuren die voor kleurenblinden de grootste problemen opleveren. Als deze kleuren toch gebruikt worden, kan dit leiden tot misinterpretaties[3]. 5

6 3 Het Onderzoek 3.1 Monmonieralgoritme Een relatief nieuwe methode om dialectverschillen in kaart te brengen, is de toepassing van Monmonier s maximum verschil algoritme (1973). Hoewel het algoritme al vrij oud is en het al een tijd gebruikt wordt om genetische verschillen in kaart te brengen, wordt het pas sinds kort toegepast in dialectometrie. In 2004 is het algoritme door Franz Manni, Wilbert Heeringa en John Nerbonne[6][7] voor het eerst toegepast, om dialectverschillen in Nederland in kaart te brengen. Zoals aan het begin van dit verslag werd gesteld, dat geografische informatie tot op zekere hoogte besloten ligt in de fonetische afstanden, verwachten we een zeker verband tussen de twee variabelen. Om dit verband aan te tonen, moeten we gebruik maken van statistische methoden. Het maken van een spreidingsdiagram is een geschikte methode om te onderzoeken of er een verband bestaat tussen twee variabelen. Aan de hand van de richting, vorm en sterkte van de puntenwolk kunnen we afleiden of er een verband bestaat tussen de twee variabelen. Het doel van het onderzoeken van dit verband is, dat we graag willen voorspellen op grond waarvan er tussen dialecten verschillen optreden. Voor het toetsen van de hypothese, of er een relatie bestaat tussen de variabele op de y-as en de variabele op de x-as, hebben we een numerieke maat nodig. Deze numerieke maat voorkomt interpretatiefouten. Interpretatiefouten kunnen ontstaan doordat een gekozen schaal voor het spreidingsdiagram gezichtsbedrog kan veroorzaken. De numerieke maat vinden we in de correlatie r. De correlatie meet de richting en de sterkte van de lineaire relatie tussen twee kwantitatieve variabelen[9]. Als de correlatie tussen de twee variabelen positief is, betekent dat in ons geval dat de fonetische afstand toeneemt, naarmate ook de geografische afstand toeneemt. Hoe dichter de correlatie -1 of 1 nadert, des te sterker de relatie tussen de twee variabelen. Alleen het maken van een spreidingsdiagram en het berekenen van de correlatie is niet voldoende voor het voorspellen van een waarde voor de fonetische afstand bij een gegeven geografische afstand. Omdat we weten, aansluitend op onze stelling dat geografische informatie tot op zekere hoogte besloten ligt in de fonetische afstanden, dat we beschikken over een verklarende en een te verklaren variabele, kunnen we regressieanalyse toepassen. Een vereiste voor het toepassen van regressieanalyse is namelijk, dat we beschikken over een verklarende en een te verklaren variabele. De geografische afstand is de verklarende en de fonetische afstand is de te verklaren vari- 6

7 abele. Dit wetende, is het mogelijk om door de puntenwolk uit het spreidingsdiagram een regressielijn te trekken. De correlatie en regressie zijn sterk verbonden. Zo bepaalt de correlatie r de helling van de regressielijn. Een ander verband tussen de correlatie en regressie is voor ons nog belangrijker. Het kwadraat van de correlatie, r 2, is die fractie van de variatie in de y-waarden die verklaard wordt door de kleinste-kwadratenregressie van y op x[9]. Voor ons onderzoek betekent dit, dat de hoogte van het kwadraat van de correlatie r 2 het percentage oplevert dat het verschil tussen de fonetische afstanden op basis van de geografische afstand verklaart. Een voorbeeld in getallen: stel dat er bij de regressieanalyse een r berekend wordt van Dan is r Dit zou betekenen dat 50.4% van de fonetische verschillen wordt verklaard door de geografische afstand. Het doel van het toepassen van het Monmonieralgoritme op dialectverschillen in combinatie met geografische afstanden is, om dialectbarrières in kaart te brengen. Zoals hierboven aangegeven kunnen we, op basis van een gegeven set plaatsen, aan de hand van dialectverschillen en de geografische afstanden tussen deze plaatsen, door middel van regressie, een correlatie berekenen. Het berekenen van de residuen is de volgende stap in het proces om de dialectbarrières in kaart te brengen. Dit wordt gedaan omdat residuen een voorspellende waarde hebben. De regressielijn is zo getekend dat de verticale afstanden van de punten tot de regressielijn, de kleinste waarde voor de sommatie over de kwadraten oplevert. Dit betekent dat de residuen de overgebleven variatie tussen de voorspelde waarden voor y en de waargenomen waarden van y voorstellen. We zijn nu geïnteresseerd in de positieve residuen. Positieve residuen laten namelijk zien dat de afstand tussen twee dialecten groter is dan we op grond van de geografische afstand hadden verwacht. De positieve residuen vormen de basis voor het Monmonieralgoritme en de te tekenen dialectbarrières. In het stuk van René van der Ark wordt verder ingegaan op hoe de residuen precies gebruikt worden voor het tekenen van de dialectbarrières. Een groot voordeel van het Monmonieralgoritme zit in de robuustheid van de barrières. Wanneer het eerste lijnstuk van een barrière is gezet, berust de voortzetting van de barrière op een drempelwaarde. Wordt de drempelwaarde overschreden, dan wordt de barrière doorgetrokken. De barrières worden getekend over de lijnen van de polygonen. Bij iedere voortzetting van een barrière wordt een links-rechtsbeslissing gemaakt, omdat er bepaald moet worden tussen welke twee dialecten de barrière verder loopt. We kunnen een differentiatie aanbrengen in de barrières door een sterkere barrière aan te geven met een dikkere lijn op de kaart. 7

8 3.2 Het Maken Van De Kaart Het maken van een kaart met barrières gebeurt in een aantal stappen. Als eerste hebben we een kaart nodig met daarop alle plaatsen. In dit onderzoek gaat het om 186 Duitse plaatsen. Figure 2: De basiskaart met daarop alle 186 plaatsen 8

9 Vervolgens wordt er een berekening gemaakt die alle buren door middel van driehoeken met elkaar verbindt. Deze methode heet Delaunay triangulation. De berekening houdt in, dat de kleinst mogelijke driehoeken worden getekend. Figure 3: De kaart na toevoeging van de Delaunaydriehoeken 9

10 Daarna worden door alle zwaartepunten van de gemaakte driehoeken nieuwe lijnen getrokken. Op deze manier ontstaat er rond elke plaats een polygoon. Deze procedure wordt Voronoi tesselation genoemd. Over deze lijnen worden de barrières getekend. Hieruit wordt ook duidelijk waarom bij het voortzetten van de barrière een links-rechtsbeslissing moet worden gemaakt. Figure 4: De kaart na toepassing van Voronoi tesselation 10

11 3.3 Dialectometrisch Onderzoek De eerste stap in dialectometrisch onderzoek bestaat uit ouderwets veldwerk. Een onderzoeker zal naar iedere plaats, die hij of zij wil gebruiken, toe moeten gaan om uitspraken op te nemen. Deze uitspraken bestaan uit een door de onderzoeker vooraf samengestelde woordenlijst of uit te spreken zinnen. Elke uitspraak wordt vervolgens omgezet naar een speciaal schrift; het fonetisch schrift. Dit is een schrift dat is vastgelegd in een alfabet; het zogenaamde International Phonetic Alphabet (IPA) waarmee zeer nauwkeurig elke klank in een uitspraak kan worden vastgelegd. Het deel van de naam International geeft aan, dat het fonetisch schrift van toepassing is op elke gesproken taal. Omdat het fonetisch schrift uit tekens bestaat die veelal niet voorkomen op een normaal toetsenbord, is er een versie van het fonetisch schrift gemaakt waarbij de tekens zijn vervangen door tekens uit de US-ASCII set, die op elk toetsenbord voorkomen. De oorspronkelijke naam van dit gedigitaliseerde fonetische schrift was SAMPA, maar is later uitgebreid en vervolgens X- SAMPA genoemd, wat staat voor: Extended SAM Phonetic Alphabet[15]. Hieronder volgt een afbeelding van twee uitspraken voor het woord Apfel met links de fonetische schrijfwijze zoals die wordt voorgeschreven door het IPA, met daarachter de X-SAMPA transcriptie Figure 5: Links het fonetisch schrift volgens IPA, rechts X-SAMPA Vervolgens willen we de verschillen tussen alle gemeten dialecten bepalen. Om dit te bereiken meten we steeds voor twee dialecten de fonetische verschillen, dat is het verschil in uitspraak. Het verschil tussen twee dialecten bepalen we door van alle losse woorden de uitspraak met elkaar te vergelijken. Hiervoor maken we gebruik van de Levenshteinafstand. De Levenshteinafstand wordt bepaald door twee woorden te vergelijken en te berekenen hoeveel het kost om het ene woord om te zetten naar het andere. Hierbij zijn er drie acties mogelijk: er moet een karakter worden toegevoegd, verwijderd of veranderd. Het toevoegen of verwijderen van een karakter kost één punt en het veranderen van een karakter kost twee punten. Het Levenshteinalgoritme berekent voor elke omzetting de goedkoopste route[4]. Tenslotte wordt de absolute berekende afstand tussen twee woorden gedeeld 11

12 door de gemiddelde lengte van de twee woorden. Dit wordt gedaan omdat anders de langere woorden, die door hun lengte een grotere kans hebben op meerdere klankverschillen, het dialectverschil in een richting kunnen trekken die niet noodzakelijkerwijs het ware dialectverschil weerspiegeld[10]. Hieronder volgt een voorbeeld voor het bepalen van de Levenshteinafstand: Figure 6: Levenshteinafstand voor geografie naar fonologie 4 Fonetische en Geografische Afstanden 4.1 Fonetische Afstand Tot nu toe is er in dit verslag vooral gesproken over dialectverschillen. Fonetische afstand is een andere naam die voor dit verschijnsel vaak gebruikt wordt. De fonetische afstanden worden in dit onderzoek bepaald door gebruik van de Levenshteinmethode, die hierboven is uitgelegd. De Levenshteinafstand blijkt consistent te zijn voor woordensets van 100 of meer (Cronbach α > 0.96, woordenset van 100)[7] en in dit onderzoek is er gebruik gemaakt van een woordenset van 147, dus het gebruik van de Levenshteinafstand is daarmee gerechtvaardigd. Uit het pakket L04[5] is met het programma Leven, een matrix gemaakt 12

13 voor de fonetische afstanden tussen alle 186 plaatsen; wat neer komt op: De Levenshteinafstanden worden berekend voor alle plaatsen onderling, omdat dit zorgt voor een betere spreiding van de data. Van de fonetische afstanden zijn de absolute verschillen berekend omdat er niet zoiets bestaat als een negatieve fonetische afstand. 4.2 Geografische Afstand Uit andere onderzoeken is gebleken[7][11], dat de geografische afstand tussen twee plaatsen, tot op zekere hoogte, een voorspellende waarde heeft wat betreft de fonetische afstand tussen deze twee plaatsen. In de data van de Phonetischer Atlas von Deutschland is een coördinatenbestand opgeslagen in de UTM32 projectie, waarvoor elk van de 186 plaatsen een lengte- en breedtegraad is meegegeven. De plaatsen met coördinaten zijn ingelezen met het programma ArcGis 9 en van daaruit omgezet naar de WSG1972 projectie, die rekening houdt met de bolling van de aarde. Voor de geografische afstand is de euclidische afstand tussen elke plaats berekend. We krijgen dan een matrix van afstanden. Ilse van Gemert heeft in haar doctoraalscriptie(2002) onderzoek gedaan naar de berekende euclidische afstand, omdat dit misschien een verdraaiing van de onderzoeksresultaten tot gevolg zou kunnen hebben[16]. Dit omdat de euclidische afstand in feite niet de werkelijke afstand tussen twee plaatsen weergeeft, omdat verbindingen tussen twee plaatsen nooit loodrecht lopen en daarmee de directe euclidische afstand altijd korter is dan de sommatie van de indirecte afstanden van alle tussenliggende plaatsen die op een zo recht mogelijke lijn worden gezocht. Uit het stuk van Van Gemert blijkt dat met de geteste data, de directe euclidische afstand een net zo goed resultaat geeft als met de sommatie van de indirecte afstanden[16]. 5 Resultaten & Discussie Uit het onderzoek van Nerbonne en Heeringa (2001)[11] blijkt, dat de fonetische afstanden niet cumulatief zijn. Dit betekent dat, hoe verder we van een startpunt verwijderd zijn, hoe minder snel de fonetische afstand zal oplopen in verhouding tot de geografische afstand. Als we naar het spreidingsdiagram in figuur 7 kijken zien we dat de puntenwolk niet recht loopt, maar naarmate de geografische afstand toeneemt, de 13

14 Figure 7: De fonetische afstanden uitgezet tegen de geografische afstanden. De regressielijncoëffieciënten van f(x): a= , b= e-08, c= wolk minder snel stijgt en wat wordt afgeplat. Dit bevestigt de conclusie van Nerbonne en Heeringa. Dit betekent dat er geen lineair verband is tussen de geografische en de fonetische afstand, maar een logaritmisch verband. Dit logaritmische verband wordt gegeven door de functie f : f(x) = a log(x) + bx + c Dit verantwoordt het gebruik van de logaritmische waarden voor de geografische afstand in plaats van de normale waarden. Op de logaritmische waarden van de geografische afstanden en de fonetische afstanden is lineaire regressie toegepast. Hierbij is de geografische afstand de verklarende variabele en de fonetische afstand de te verklaren variabele. Aan de hand van deze gegevens zijn de correlatie en de residuen berekend. Voor de correlatie werd een waarde berekend van r = 0.61 en r 2 = Hieruit volgt dat 37.2% van de fonetische verschillen verklaard kan worden door de variabele geografische afstand. Bij de regressie zijn ook de residuen berekend. We zijn geïnteresseerd 14

15 in de residuen omdat positieve residuen laten zien dat de fonetische afstand groter is dan we op grond van de geografische afstand hadden verwacht. Voor de residuen werd een maximumwaarde van 4.053, een minimumwaarde van en een standaarddeviatie van waargenomen. Figuur 8 laat het normaal-kwantiel-plot zien van de residuen. De grafiek laat zien dat de residuen normaal verdeeld zijn en dat betekent dat de correlatie geschikt is om onze bevindingen mee te toetsen[9]. Figure 8: normaal-kwantiel-plot van de residuen Hoewel de gebruikte methode werkt, kan er nog wel netter worden gewerkt. Er is gewerkt met een tabel met regels. Dit kan efficiënter door de redundante data te verwijderen. We krijgen dan niet een tabel met regels, maar een tabel met regels. Hierdoor wordt de rekentijd voor de computer verkort en zullen de grafieken duidelijker worden. 15

16 6 Conclusie In dit onderzoek is ingegaan op de vraag, wat de invloed is van geografie op taalvariatie binnen de Duitse dialecten. We hebben onderzocht in hoeverre de geografische afstand tussen twee plaatsen een voorspellende waarde heeft wat betreft het verschil in dialecten tussen twee plaatsen. Er is een correlatie gevonden van r = 0.61 en daaruit volgend r 2 = Hieruit blijkt dat 37.2% van de fonetische verschillen binnen de Duitse dialecten verklaard kan worden door de geografische afstand. Dit betekent dat 62.8% van de fonetische verschillen in andere oorzaken gezocht moeten worden. We moeten dus op zoek naar andere oorzaken, om een vollediger voorspelling te kunnen doen voor op grond waarvan er binnen de Duitse dialecten dialectveranderingen optreden. Uit een opmerking van Nerbonne en Heeringa blijkt dat, hoewel ze voor hun kleinere dataset van Nederlandse dialecten met 125 woorden, een resultaat behaalden waarbij 65% van de fonetische afstanden verklaard kon worden door de geografische afstanden, ze bij het gebruik van een dataset van 350 woorden, nog maar 43% van de fonetische afstanden verklaard kon worden door de geografische afstanden[11]. Misschien heeft in dit onderzoek de grote variatie aan mogelijke uitspraken voor een woord invloed gehad op de lager uitvallende correlatie. Uit het stuk van René van der Ark zal moeten blijken of de toepassing van het Monmonieralgoritme een geschikte methode is om dialectbarrières in kaart te brengen. 7 Aanbevelingen Misschien moet er dieper gegraven worden naar de oude bestuurssystemen die in de Duitse deelgebieden zijn geweest en dan met name daar waar de barrières het sterkst zijn. Het is een idee om te onderzoeken welke invloeden deze bestuurssystemen hebben gehad op de gemeenschappen die ten tijde van de invoering van het Hoogduits in deze gebieden leefden en dan vooral wat redenen zouden kunnen zijn waarom bepaalde gemeenschappen minder contact met elkaar lijken te hebben gehad dan we op basis van de fonetische en geografische afstand zouden verwachten. Wellicht hadden bepaalde groepen weinig of geen contact met elkaar door conflicten, die in die tijd vaker voorkwamen en vaak extremere vormen aannamen. Het probleem kan ook van de andere kant worden benaderd; er kan onderzocht worden waarom bepaalde gebieden juist meer contact lijken te hebben gehad dan 16

17 we op grond van de fonetische en geografische afstanden zouden verwachten. Een oorzaak kan liggen in nauwe handelsbetrekkingen tussen twee gebieden. Het is ook mogelijk om een combinatie te maken tussen onderzoek naar de invloed van bestuurssystemen en de invloed van geografische barrières. 8 Dankwoord Bij deze wil ik John Nerbonne en Elwin Koster hartelijk bedanken voor de goede begeleiding tijdens de totstandkoming van deze bachelorscriptie en het gehele project als zodanig. References [1] Peter A. Burrough and Rachael A. McDonnell. Principles of Geographical Information Systems. Oxford University Press, [2] Cor Hoppenbrouwers and Geer Hoppenbrouwers. De indeling van de Nederlandse streektalen. Koninklijke Van Gorcum, [3] Peter Kleiweg. Hoe breng je verschillen tussen geografische gebieden in kaart? Website: Rug/L04, kleiweg/kaarten/afstanden.html.nl#minmds, date visited: [4] Peter Kleiweg. Levenshtein demo. Website: Peter Kleiweg, kleiweg/lev/, date visited: [5] Peter Kleiweg. Rug/l04 - dialectometrics & cartography. Website: Rug/L04, kleiweg/l04, date visited: [6] F. Manni, E. Guérard, and E. Heyer. Geographic patterns of (genetic, morphologic, linguistic) variation: how barriers can be detected by monmonier s algorithm. Human Biology, 76(2): , date visited: [7] Franz Manni, Wilbert Heeringa, and John Nerbonne. To what extent are surnames words? comparing geographic patterns of surnames and dialect variation in the netherlands. to appear in:. Literary and Linguistic Computing, 21(4),

18 [8] Taylor Mitchel. Webmapping illustrated. O Reilly, [9] David S. Moore and George P. McCabe. Statistiek in de praktijk. Academic Service, third edition, [10] John Nerbonne and Wilbert Heeringa. Computational comparison and classification of dialects. Dialectologia et Geolinguistica, 9:69 83, [11] John Nerbonne and Wilbert Heeringa. Dialect areas and dialect continua. Language Variation and Change, 13: , [12] John Nerbonne, Wilbert Heeringa, Erik van den Hout, Peter van der Kooi, Simone Otten, and Willem van de Vis. Phonetic distance between dutch dialects. In G.Durieux, and W.Daelemans, and S.Gillis (eds.) CLIN VI: Proc. of the Sixth CLIN Meeting. Antwerp, Centre for Dutch Language and Speech (UIA), pages , [13] John Nerbonne and William Kretzschmar. Introducing computational techniques in dialectometry. Special issue of Computers and the Humanities, 37(3): , [14] Remco Takken. De veelkleurige wereld van het dialect in kaart. GiSmagazine, september kleiweg/papers/takken2005.pdf, date visited: [15] Unknown. X-sampa-wikipedia. Website: Wikipedia, date visited: [16] Ilse van Gemert. Het geografisch verklaren van dialectafstanden met een gis. Master s thesis, Rijksuniversiteit Groningen,

HET GEOGRAFISCH VERKLAREN VAN DIALECTAFSTANDEN MET EEN GIS

HET GEOGRAFISCH VERKLAREN VAN DIALECTAFSTANDEN MET EEN GIS HET GEOGRAFISCH VERKLAREN VAN DIALECTAFSTANDEN MET EEN GIS Scriptie Ilse van Gemert Alfa-Informatica Rijksuniversiteit Groningen Augustus 2002 2 Inhoudsopgave 1 Inleiding... 3 2 Theorie en methoden...

Nadere informatie

Geografie en inwoneraantallen als verklarende factoren voor variatie in het Nederlandse dialectgebied

Geografie en inwoneraantallen als verklarende factoren voor variatie in het Nederlandse dialectgebied Geografie en inwoneraantallen als verklarende factoren voor variatie in het Nederlandse dialectgebied Wilbert Heeringa John Nerbonne Renée van Bezooijen Marco René Spruit Rijksuniversiteit Rijksuniversiteit

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen Lesbrief: Correlatie en Regressie Leerlingmateriaal Je leert nu: -een correlatiecoëfficient gebruiken als maat voor het statistische verband tussen beide variabelen -een regressielijn te tekenen die een

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Vendorrating: statistische presentatiemiddelen

Vendorrating: statistische presentatiemiddelen pag.: 1 van 6 Vendorrating: statistische presentatiemiddelen Hieronder bespreken we in het kort een aantal verschillende presentatievormen waarmee we vendorratingresultaten op een duidelijke manier kunnen

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Hoofdstuk 2: Verbanden

Hoofdstuk 2: Verbanden Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

1 Basisbegrippen, W / O voor waar/onwaar

1 Basisbegrippen, W / O voor waar/onwaar Naam - Toetsende Statistiek Rijksuniversiteit Groningen Lente Docent: John Nerbonne Tentamen di. 22 juni om 14 uur tentamenhal Belangrijke instructies 1. Schrijf uw naam & studentnummer hierboven, schrijf

Nadere informatie

Klantonderzoek: statistiek!

Klantonderzoek: statistiek! Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van

Nadere informatie

De analyse van uitspraakverschillen in Nederlandse en Friese taalvariëteiten

De analyse van uitspraakverschillen in Nederlandse en Friese taalvariëteiten De analyse van uitspraakverschillen in Nederlandse en Friese taalvariëteiten Wilbert Heeringa, John Nerbonne, Peter Kleiweg 1. Inleiding Schibbolets verraden de geografische herkomst van dialectsprekers.

Nadere informatie

Tellen met Taal. Het meten van variatie in zinsbouw in Nederlandse dialecten. Marco René Spruit

Tellen met Taal. Het meten van variatie in zinsbouw in Nederlandse dialecten. Marco René Spruit Tellen met Taal Het meten van variatie in zinsbouw in Nederlandse dialecten Marco René Spruit Taalkundige afstand Iedereen weet dat de afstand tussen Amsterdam en Utrecht kleiner is dan de afstand tussen

Nadere informatie

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO Leerlingmateriaal 1. Doel van de praktische opdracht Het doel van deze praktische opdracht is om de theorie uit je boek te verbinden met de data

Nadere informatie

Measuring Dialect Pronunciation Differences using Levenshtein Distance Heeringa, Wilbert Jan

Measuring Dialect Pronunciation Differences using Levenshtein Distance Heeringa, Wilbert Jan Measuring Dialect Pronunciation Differences using Levenshtein Distance Heeringa, Wilbert Jan IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from

Nadere informatie

Kenmerk ontheffing in de Bijstands Uitkeringen Statistiek

Kenmerk ontheffing in de Bijstands Uitkeringen Statistiek Centraal Bureau voor de Statistiek Divisie sociale en regionale statistieken (SRS) Sector statistische analyse voorburg (SAV) Postbus 24500 2490 HA Den Haag Kenmerk ontheffing in de Bijstands Uitkeringen

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 6 mei 2010 1 1 Introductie De Energiekamer

Nadere informatie

Samenvatting. A. van Leeuwenhoeklaan MA Bilthoven Postbus BA Bilthoven KvK Utrecht T

Samenvatting. A. van Leeuwenhoeklaan MA Bilthoven Postbus BA Bilthoven   KvK Utrecht T A. van Leeuwenhoeklaan 9 3721 MA Bilthoven Postbus 1 3720 BA Bilthoven www.rivm.nl KvK Utrecht 30276683 T 030 274 91 11 info@rivm.nl Uw kenmerk Gevoeligheid van de gesommeerde depositiebijdrage onder 0,05

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke

Nadere informatie

Percentage afwijkingen groter dan vijf decibel

Percentage afwijkingen groter dan vijf decibel Om beter op zoek te kunnen gaan waar er verbeteringen kunnen toegevoegd worden aan de algoritmes heb ik een hulpfunctie gemaakt die in plaats van het interpoleren tussen fingerprints slechts de positie

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation

Cover Page. The handle  holds various files of this Leiden University dissertation Cover Page The handle http://hdl.handle.net/1887/22286 holds various files of this Leiden University dissertation Author: Nezhinsky, A.E. Title: Pattern recognition in high-throughput zebrafish imaging

Nadere informatie

Examen VWO. wiskunde C (pilot) tijdvak 1 woensdag 22 mei uur. Bij dit examen hoort een uitwerkbijlage.

Examen VWO. wiskunde C (pilot) tijdvak 1 woensdag 22 mei uur. Bij dit examen hoort een uitwerkbijlage. Examen VWO 2013 tijdvak 1 woensdag 22 mei 13.30-16.30 uur wiskunde C (pilot) Bij dit examen hoort een uitwerkbijlage. Dit examen bestaat uit 22 vragen. Voor dit examen zijn maximaal 78 punten te behalen.

Nadere informatie

Project: Kennisdocument Onderwerp: p90 Datum: 23 november 2009 Referentie: p90 onzekerheid Wat betekent de p90 (on)zekerheid?

Project: Kennisdocument Onderwerp: p90 Datum: 23 november 2009 Referentie: p90 onzekerheid Wat betekent de p90 (on)zekerheid? Project: Kennisdocument Onderwerp: p90 Datum: 23 november 2009 Referentie: p90 onzekerheid Wat betekent de p90 (on)zekerheid? De p90 onzekerheid staat in het kader van de garantieregeling voor aardwarmte

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

Korte uitleg van twee veelvoorkomende statistische toetsen Veel wetenschappelijke hypothesen kunnen statistisch worden getoetst. Aan de hand van een

Korte uitleg van twee veelvoorkomende statistische toetsen Veel wetenschappelijke hypothesen kunnen statistisch worden getoetst. Aan de hand van een Korte uitleg van twee veelvoorkomende statistische toetsen Veel wetenschappelijke hypothesen kunnen statistisch worden getoetst. Aan de hand van een statistische toets beslis je of een hypothese waar is.

Nadere informatie

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. 3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. Absolute verandering = Aantal 2004 Aantal 1994 = 1625 3070 = -1445 Relatieve verandering = Nieuw Oud Aantal

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

Invloed van IT uitbesteding op bedrijfsvoering & IT aansluiting

Invloed van IT uitbesteding op bedrijfsvoering & IT aansluiting xvii Invloed van IT uitbesteding op bedrijfsvoering & IT aansluiting Samenvatting IT uitbesteding doet er niet toe vanuit het perspectief aansluiting tussen bedrijfsvoering en IT Dit proefschrift is het

Nadere informatie

Practicum algemeen. 1 Diagrammen maken 2 Lineair verband en evenredig verband 3 Het schrijven van een verslag

Practicum algemeen. 1 Diagrammen maken 2 Lineair verband en evenredig verband 3 Het schrijven van een verslag Practicum algemeen 1 Diagrammen maken 2 Lineair verband en evenredig verband 3 Het schrijven van een verslag 1 Diagrammen maken Onafhankelijke grootheid en afhankelijke grootheid In veel experimenten wordt

Nadere informatie

Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode.

Het blijkt dat dit eigenlijk alleen lukt met de exponentiële methode. Verificatie Shen en Carpenter RDEC methodiek voor de karakterisering van asfaltvermoeiing; vergelijking van verschillende methoden voor het berekenen van de parameters. Jan Telman, Q-Consult Bedrijfskundig

Nadere informatie

11. Deelopdracht 8: Invloed stress op gezondheid

11. Deelopdracht 8: Invloed stress op gezondheid 11. Deelopdracht 8: Invloed stress op gezondheid Om te kijken naar een verband tussen stress en een ander gezondheidsaspect is er een vragenlijst afgenomen bij de mensen die de stresstest gedaan hebben.

Nadere informatie

2 Data en datasets verwerken

2 Data en datasets verwerken Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 1 Data presenteren 1.4 Oefenen In opdracht van: Commissie Toekomst Wiskunde Onderwijs 1.4 Oefenen Opgave 9 Bekijk de genoemde dataset

Nadere informatie

Voorbereidend Wetenschappelijk Onderwijs Tijdvak 2 Woensdag 18 juni uur

Voorbereidend Wetenschappelijk Onderwijs Tijdvak 2 Woensdag 18 juni uur Wiskunde A (oude stijl) Examen VWO Voorbereidend Wetenschappelijk Onderwijs Tijdvak 2 Woensdag 18 juni 13.3 16.3 uur 2 3 Voor dit examen zijn maximaal 9 punten te behalen; het examen bestaat uit 2 vragen.

Nadere informatie

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4 statviewtoetsen 18/12/2000 Contents............................................................ 1 1 Statview toets, 2K WE, 30 mei 1995 2 1.1 Fitness-campagne................................................

Nadere informatie

Effectief Rapporteren

Effectief Rapporteren Effectief Rapporteren van rapporteren naar inzicht Michel Dekker michel.dekker@novasilva.com Bron: http://www.orrplumbing.com/plumbing-problems/plumbing-a-bathroom/ Bron:http://www.telegraph.co.uk/news/picturegalleries/howaboutthat/2689914/The-upside-down-house.html?image=6

Nadere informatie

2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht?

2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht? 2.1.4 Oefenen Opgave 9 Bekijk de genoemde dataset GEGEVENS154LEERLINGEN. a. Hoe lang is het grootste meisje? En de grootste jongen? b. Welke lengtes komen het meeste voor? c. Is het berekenen van gemiddelden

Nadere informatie

aard zijn. De techniek kan ook gebruikt worden bij het onderzoeken van de taalkundige variatie tussen sociale klassen, sexe, en andere dimensies.

aard zijn. De techniek kan ook gebruikt worden bij het onderzoeken van de taalkundige variatie tussen sociale klassen, sexe, en andere dimensies. Samenvatting Dit proefschrift onderzoekt synchrone en diachrone aspecten van de Engelse fonetiek en fonologie door middel van de eerste systematische toepassing van een uitgebreide set van kwantitatieve

Nadere informatie

Operationaliseren van variabelen (abstracte begrippen)

Operationaliseren van variabelen (abstracte begrippen) Operationaliseren van variabelen (abstracte begrippen) Tabel 1, schematisch overzicht van abstracte begrippen, variabelen, dimensies, indicatoren en items. (Voorbeeld is ontleend aan de masterscriptie

Nadere informatie

Factor = het getal waarmee je de oude hoeveelheid moet vermenigvuldigen om een nieuwe hoeveelheid te krijgen.

Factor = het getal waarmee je de oude hoeveelheid moet vermenigvuldigen om een nieuwe hoeveelheid te krijgen. Samenvatting door een scholier 1569 woorden 23 juni 2017 5,8 6 keer beoordeeld Vak Methode Wiskunde Moderne wiskunde Wiskunde H1 t/m H5 Hoofdstuk 1 Factor = het getal waarmee je de oude hoeveelheid moet

Nadere informatie

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren Hoofdstuk 18 Verbanden tussen variabelen vaststellen en interpreteren Analyse van verbanden Analyse van verbanden: bij de analyse van verbanden stel je vast of er een stabiel verband bestaat tussen twee

Nadere informatie

Examen HAVO. wiskunde B1. tijdvak 1 dinsdag 20 mei 13.30-16.30 uur

Examen HAVO. wiskunde B1. tijdvak 1 dinsdag 20 mei 13.30-16.30 uur Examen HAVO 2008 tijdvak 1 dinsdag 20 mei 13.30-16.30 uur wiskunde B1 Dit examen bestaat uit 20 vragen. Voor dit examen zijn maximaal 84 punten te behalen. Voor elk vraagnummer staat hoeveel punten met

Nadere informatie

Buiging van een belaste balk

Buiging van een belaste balk Buiging van een belaste balk (Modelbouw III) G. van Delft Studienummer: 0480 E-mail: gerardvandelft@email.com Tel.: 06-49608704 4 juli 005 Doorbuigen van een balk Wanneer een men een balk op het uiteinde

Nadere informatie

DOEN! - Praktische Opdracht Statistiek 4 Havo Wiskunde A

DOEN! - Praktische Opdracht Statistiek 4 Havo Wiskunde A DOEN! - Praktische Opdracht Statistiek 4 Havo Wiskunde A Docentenhandleiding 1. Voorwoord Doel van de praktische opdracht bij het hoofdstuk over statistiek 1 : Het doel van de praktische opdracht (PO)

Nadere informatie

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek Hoofdstuk 19 Voorspellende analyse bij marktonderzoek Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden

Nadere informatie

Rapportage Ervaringsonderzoek WOT's

Rapportage Ervaringsonderzoek WOT's Rapportage Ervaringsonderzoek WOT's Versie 5.0.0 Drs. J.J. Laninga December 2015 www.triqs.nl Voorwoord Met genoegen bieden wij u hierbij de rapportage aan over het uitgevoerde ervaringsonderzoek naar

Nadere informatie

A. Week 1: Introductie in de statistiek.

A. Week 1: Introductie in de statistiek. A. Week 1: Introductie in de statistiek. Populatie en steekproef. In dit vak leren we de basis van de statistiek. In de statistiek probeert men erachter te komen hoe we de populatie het beste kunnen observeren.

Nadere informatie

Eindexamen wiskunde B 1 havo 2009 - I

Eindexamen wiskunde B 1 havo 2009 - I Vetpercentage Al heel lang onderzoekt men het verband tussen enerzijds het gewicht en de lengte van volwassen mensen en anderzijds hun gezondheid. Hierbij gebruikt men vaak de Body Mass Index (BMI). De

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient Opdracht 4a ----------- Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient In 1738 werd in de haven van Stockholm voor een aantal landen voor elk land geregistreerd hoeveel schepen

Nadere informatie

De statespace van Small World Networks

De statespace van Small World Networks De statespace van Small World Networks Emiel Suilen, Daan van den Berg, Frank van Harmelen epsuilen@few.vu.nl, daanvandenberg1976@gmail.com, Frank.van.Harmelen@cs.vu.nl VRIJE UNIVERSITEIT AMSTERDAM 2 juli

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Examen HAVO. Wiskunde B1,2 (nieuwe stijl)

Examen HAVO. Wiskunde B1,2 (nieuwe stijl) Wiskunde B1,2 (nieuwe stijl) Examen HAVO Hoger Algemeen Voortgezet Onderwijs Tijdvak 1 Maandag 27 mei 1.0 16.0 uur 20 02 Voor dit examen zijn maximaal 88 punten te behalen; het examen bestaat uit 19 vragen.

Nadere informatie

Eindexamen wiskunde A1 vwo 2004-I

Eindexamen wiskunde A1 vwo 2004-I Bevolkingsgroei Begin jaren negentig verscheen in NRC Handelsblad een artikel over de bevolkingsgroei en de gevolgen van deze groei. Bij dit artikel werden onder andere de onderstaande figuren 1A, 1B,

Nadere informatie

Examen VWO. Wiskunde A1,2 (nieuwe stijl)

Examen VWO. Wiskunde A1,2 (nieuwe stijl) Wiskunde A1,2 (nieuwe stijl) Examen VWO Voorbereidend Wetenschappelijk Onderwijs Tijdvak 2 Woensdag 20 juni 13.30 16.30 uur 20 01 Voor dit examen zijn maximaal 90 punten te behalen; het examen bestaat

Nadere informatie

2 Data en datasets verwerken

2 Data en datasets verwerken Domein Statistiek en kansrekening havo A 2 Data en datasets verwerken 1 Data presenteren 1.3 Representaties In opdracht van: Commissie Toekomst Wiskunde Onderwijs 1 Data presenteren 1.1 Introductie In

Nadere informatie

Folkert Buiter 2 oktober 2015

Folkert Buiter 2 oktober 2015 1 Nuchter kijken naar feiten en trends van aardbevingen in Groningen. Een versneld stijgende lijn van het aantal en de kracht van aardbevingen in Groningen. Hoe je ook naar de feitelijke metingen van de

Nadere informatie

4 Optimale weegschema s

4 Optimale weegschema s 20 Proceedings of the 52 nd European Study Group with Industry 4 Optimale weegschema s Sandjai Bhulai, Thomas Breuer, Eric Cator en Fieke Dekkers Inleiding De kilogram is de laatste fysische grootheid

Nadere informatie

Informatica: C# WPO 7

Informatica: C# WPO 7 Informatica: C# WPO 7 1. Inhoud 1D-arrays, Lijsten 2. Oefeningen Demo 1: Vul de 1D-array Demo 2: Stringreplace Demo 3: Vul de lijst Demo 4: Debug oplossingen demo s 1, 2 en 3 A: Array reversal A: Gemiddelde

Nadere informatie

Combinatorische Algoritmen: Binary Decision Diagrams, Deel III

Combinatorische Algoritmen: Binary Decision Diagrams, Deel III Combinatorische Algoritmen: Binary Decision Diagrams, Deel III Sjoerd van Egmond LIACS, Leiden University, The Netherlands svegmond@liacs.nl 2 juni 2010 Samenvatting Deze notitie beschrijft een nederlandse

Nadere informatie

Voor de beoordeling zijn de volgende passages van de artikelen 41, 41a en 42 van het Eindexamenbesluit van belang:

Voor de beoordeling zijn de volgende passages van de artikelen 41, 41a en 42 van het Eindexamenbesluit van belang: wiskunde A, Correctievoorschrift VWO Voorbereidend Wetenschappelijk Onderwijs Het correctievoorschrift bestaat uit: Regels voor de beoordeling Algemene regels 3 Vakspecifieke regels 4 Beoordelingsmodel

Nadere informatie

Kerstvakantiecursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven HAVO kan niet korter

Kerstvakantiecursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven HAVO kan niet korter Voorbereidende opgaven HAVO Kerstvakantiecursus wiskunde A Tips: Maak de voorbereidende opgaven voorin in een van de A4-schriften die je gaat gebruiken tijdens de cursus. Als een opdracht niet lukt, werk

Nadere informatie

Eindexamen wiskunde A1-2 vwo 2005-I

Eindexamen wiskunde A1-2 vwo 2005-I Eindexamen wiskunde A- vwo 005-I 4 Beoordelingsmodel Meer neerslag de opmerking dat de gemiddelde jaarlijkse neerslag in beide plaatsen gelijk is De standaardafwijking in Winterswijk is groter (en dus

Nadere informatie

Geografie en inwoneraantallen als verklarende factoren voor variatie in het Nederlandse dialectgebied *

Geografie en inwoneraantallen als verklarende factoren voor variatie in het Nederlandse dialectgebied * TNTL 123 (2007) 70-82 Wilbert Heeringa, John Nerbonne, Renée van Bezooijen en Marco René Spruit Geografie en inwoneraantallen als verklarende factoren voor variatie in het Nederlandse dialectgebied * Abstract

Nadere informatie

Informatie over de deelnemers

Informatie over de deelnemers Tot eind mei 2015 hebben in totaal 45558 mensen deelgenomen aan de twee Impliciete Associatie Testen (IATs) op Onderhuids.nl. Een enorm aantal dat nog steeds groeit. Ook via deze weg willen we jullie nogmaals

Nadere informatie

Het belangrijkste doel van de studie in hoofdstuk 3 was om onafhankelijke effecten van visuele preview en spellinguitspraak op het leren spellen van

Het belangrijkste doel van de studie in hoofdstuk 3 was om onafhankelijke effecten van visuele preview en spellinguitspraak op het leren spellen van Samenvatting Het is niet eenvoudig om te leren spellen. Om een woord te kunnen spellen moet een ingewikkeld proces worden doorlopen. Als een kind een bepaald woord nooit eerder gelezen of gespeld heeft,

Nadere informatie

Rekenen: Meten groep 4 en hoger. Het leren van simpele weegopdrachten.

Rekenen: Meten groep 4 en hoger. Het leren van simpele weegopdrachten. Activiteit 7 Lichtste en zwaarste Sorteer algoritmes Samenvatting Computers worden vaak gebruikt om lijsten in een bepaalde volgorde te zetten, bijvoorbeeld namen in alfabetische volgorde, e-mails of afspraken

Nadere informatie

Orde in de Chaos Een efficiënte manier van opslaan van de data die gebruikt wordt bij het visualiseren van geografische invloed op taalvariatie

Orde in de Chaos Een efficiënte manier van opslaan van de data die gebruikt wordt bij het visualiseren van geografische invloed op taalvariatie Orde in de Chaos Een efficiënte manier van opslaan van de data die gebruikt wordt bij het visualiseren van geografische invloed op taalvariatie E. Pieters S1054996 Eelse pieters@hotmail.com Versie 1.2

Nadere informatie

Modelleren C Appels. Christian Vleugels Sander Verkerk Richard Both. 2 april 2010. 1 Inleiding 2. 3 Data 3. 4 Aanpak 3

Modelleren C Appels. Christian Vleugels Sander Verkerk Richard Both. 2 april 2010. 1 Inleiding 2. 3 Data 3. 4 Aanpak 3 Modelleren C Appels Christian Vleugels Sander Verkerk Richard Both 2 april 2010 Inhoudsopgave 1 Inleiding 2 2 Probleembeschrijving 2 3 Data 3 4 Aanpak 3 5 Data-analyse 4 5.1 Data-analyse: per product.............................

Nadere informatie

Examen HAVO. Wiskunde B1 (nieuwe stijl)

Examen HAVO. Wiskunde B1 (nieuwe stijl) Wiskunde B1 (nieuwe stijl) Examen HAVO Hoger Algemeen Voortgezet Onderwijs Tijdvak 1 Maandag 27 mei 13.30 16.30 uur 20 02 Voor dit examen zijn maximaal 83 punten te behalen; het examen bestaat uit 21 vragen.

Nadere informatie

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit College 6 Samenhang tussen variabelen Inleiding M&T 2012 2013 Hemmo Smit Overzicht van deze cursus 1. Grondprincipes van de wetenschap 2. Observeren en meten 3. Interne consistentie; Beschrijvend onderzoek

Nadere informatie

voorbeeldexamenopgaven statistiek wiskunde A havo

voorbeeldexamenopgaven statistiek wiskunde A havo voorbeeldexamenopgaven statistiek wiskunde A havo FORMULEBLAD Vuistregels voor de grootte van het verschil van twee groepen 2 2 kruistabel a c b d, met phi = ad bc ( a+ b)( a+ c)( b+ d)( c+ d) als phi

Nadere informatie

Examen HAVO. Wiskunde B (oude stijl)

Examen HAVO. Wiskunde B (oude stijl) Wiskunde B (oude stijl) Examen HAVO Hoger Algemeen Voortgezet Onderwijs Tijdvak 1 Maandag 27 mei 1330 1630 uur 20 02 Voor dit examen zijn maximaal 90 punten te behalen; het examen bestaat uit 18 vragen

Nadere informatie

Licht in de Duisternis Online visualisatie van geografische data en analyse met behulp van mapserver

Licht in de Duisternis Online visualisatie van geografische data en analyse met behulp van mapserver Licht in de Duisternis Online visualisatie van geografische data en analyse met behulp van mapserver René van der Ark S1331639 R.van.der.Ark@student.rug.nl Versie 1.2 september 2006 Rijksuniversiteit Groningen

Nadere informatie

Eindexamen wiskunde A havo 2011 - I

Eindexamen wiskunde A havo 2011 - I Zuinig rijden Tijdens rijlessen leer je om in de auto bij foto 20 km per uur van de eerste naar de tweede versnelling te schakelen. Daarna ga je bij 40 km per uur naar de derde versnelling, bij 60 km per

Nadere informatie

Examen VWO-Compex. Wiskunde A1 (nieuwe stijl)

Examen VWO-Compex. Wiskunde A1 (nieuwe stijl) Wiskunde A1 (nieuwe stijl) Examen VWO-Compex Voorbereidend Wetenschappelijk Onderwijs Tijdvak 1 Dinsdag 27 mei 13.30 16.30 uur 20 03 Voor dit examen zijn maximaal 86 punten te behalen; het examen bestaat

Nadere informatie

TIP 10: ANALYSE VAN DE CIJFERS

TIP 10: ANALYSE VAN DE CIJFERS TOETSTIP 10 oktober 2011 Bepaling wat en waarom je wilt meten Toetsopzet Materiaal Betrouw- baarheid Beoordeling Interpretatie resultaten TIP 10: ANALYSE VAN DE CIJFERS Wie les geeft, botst automatisch

Nadere informatie

Paragraaf 5.1 : Frequentieverdelingen

Paragraaf 5.1 : Frequentieverdelingen Hoofdstuk 5 Beschrijvende statistiek (V4 Wis A) Pagina 1 van 7 Paragraaf 5.1 : verdelingen Les 1 Allerlei diagrammen = { Hoe vaak iets voorkomt } Relatief = { In procenten } Absoluut = { Echte getallen

Nadere informatie

Samenvatting (Summary in Dutch)

Samenvatting (Summary in Dutch) In dit proefschrift worden een aantal psychometrische methoden beschreven waarmee de accuratesse en efficientie van psychodiagnostiek in de klinische praktijk verbeterd kan worden. Psychodiagnostiek wordt

Nadere informatie

Algemene informatie over het IQ Binet

Algemene informatie over het IQ Binet Praktische-opdracht door een scholier 1597 woorden 23 juni 2004 5,4 32 keer beoordeeld Vak Wiskunde A Algemene informatie over het IQ Binet De Fransman Alfred Binet ontwikkelde aan het begin van deze eeuw

Nadere informatie

Eindexamen wiskunde B1 havo 2002-I

Eindexamen wiskunde B1 havo 2002-I Functies In figuur 1 zijn de grafieken getekend van de functies f ( x) = 2x + 12 en g(x) = x 1. figuur 1 y f g O x 4p 1 Los op: f(x) g(x). Rond de getallen in je antwoord die niet geheel zijn af op twee

Nadere informatie

Tussendoelen wiskunde onderbouw vo vmbo

Tussendoelen wiskunde onderbouw vo vmbo Tussendoelen wiskunde onderbouw vo vmbo Domein A: Inzicht en handelen Subdomein A1: Vaktaal wiskunde 1. vmbo passende vaktaal voor wiskunde herkennen en gebruiken voor het ordenen van het eigen denken

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

Summary in Dutch 179

Summary in Dutch 179 Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse

Nadere informatie

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn Statistiek: Spreiding en dispersie 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Met spreiding willen we in één getal uitdrukken hoe verspreid de gegevens zijn: in hoeveel

Nadere informatie

Eindexamen wiskunde B1 havo 2003-II

Eindexamen wiskunde B1 havo 2003-II Kalveren In de veeteelt gebruikt men voor rundvee reeds lang de methode van kunstmatige inseminatie (afgekort KI). De laatste jaren is daarnaast de reageerbuisbevruchting ofwel invitrofertilisatie (afgekort

Nadere informatie

Exponentiële Functie: Toepassingen

Exponentiële Functie: Toepassingen Exponentiële Functie: Toepassingen 1 Overgang tussen exponentiële functies en lineaire functies Wanneer we werken met de exponentiële functie is deze niet altijd gemakkelijk te herkennen. Daarom proberen

Nadere informatie

Kenmerk ontheffing in de Bijstands Uitkeringen Statistiek 2009 Versie 2

Kenmerk ontheffing in de Bijstands Uitkeringen Statistiek 2009 Versie 2 Centraal Bureau voor de Statistiek Divisie sociale en regionale statistieken (SRS) Sector statistische analyse voorburg (SAV) Postbus 24500 2490 HA Den Haag Kenmerk ontheffing in de Bijstands Uitkeringen

Nadere informatie

Examen VWO. wiskunde B1. tijdvak 2 woensdag 24 juni uur

Examen VWO. wiskunde B1. tijdvak 2 woensdag 24 juni uur Examen VWO 2009 tijdvak 2 woensdag 24 juni 3.30-6.30 uur wiskunde B Dit examen bestaat uit 8 vragen. Voor dit examen zijn maximaal 80 punten te behalen. Voor elk vraagnummer staat hoeveel punten met een

Nadere informatie

1BK2 1BK6 1BK7 1BK9 2BK1

1BK2 1BK6 1BK7 1BK9 2BK1 Kern Subkern Leerdoel niveau BK begrippen vmbo waar in bettermarks 1.1.1. Je gebruikt positieve en negatieve getallen, breuken en decimale getallen in hun onderlinge samenhang en je ligt deze toe binnen

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle  holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/29716 holds various files of this Leiden University dissertation. Author: Schraagen, Marijn Paul Title: Aspects of record linkage Issue Date: 2014-11-11

Nadere informatie