- DEN HAAG. Technische Hogeschool. ZESTIENDE VAKANTIECURSUS 16 en 17 januari Gebruik van moderne statistische methoden

Maat: px
Weergave met pagina beginnen:

Download "- DEN HAAG. Technische Hogeschool. ZESTIENDE VAKANTIECURSUS 16 en 17 januari 1964. Gebruik van moderne statistische methoden"

Transcriptie

1 Technische Hogeschool Afdeling der Weg- en Waterbouwkunde Gebruik van moderne statistische methoden ZESTIENDE VAKANTIECURSUS 16 en 17 januari 1964 MOORMANS PERIODIEKE PERS N.V. - DEN HAAG

2 Reeds zijn in onderstaande volgorde in boekvorm verschenen de voordrachten van de volgende cursussen: l. Filtratie, 2. Vervaardiging van buizen voor transport- en distributieleidingen. 3. Winning van mondwater. 4. waterzuivering: 5. Hygiënische aspectei van de m-wate&ooniening; 6. Het transmrt en de distributie van leidinmater, 7. Keuze. aantasting en bescherm& van materialen voor koud- en wa&nwaterleiciin~en. 8. g en 10. Enige ketenschappelijke grondslagen der waterleidingtec&ek I, II en Iii. 11. Radioactiviteit, 12. Het mondwater, 13. De Riin Nieuwe - ontwikk;lingen in de waterleidingtechniek op f&sch, chemisch en biole gisch gebied, 15. De watervoorziening en de industrie.

3 Technische Hogeschool Afdeling der Weg- en Waterbouwkunde Zestiende Vakantiecursus in drinkwatervoorziening gehouden op 16 en 17 januari 1964 te Delft Gebruik van moderne statistische methoden MOORMANS PERIODIEKE PERS N.V. - DEN HAAG

4

5 WOORD VOORAF Gaarne geef ik gevolg aan het verzoek van de Voorzitter van de Commissie inzake Vakantiecursussen in Drinkwatervoorziening hier een enkel woord te zeggen. Het was voor de Afdeling der Weg- en Waterbouwkunde van de Technische Hogeschool Delft steeds een genoegen gastvrijheid te verlenen aan de Vakantiecursussen in Drinkwatervoorziening, omdat het streven van genoemde Commissie de volle instemming heeft van de Afdeling en omdat elke nascholingscursus kan leiden tot een beperkte verkorting van de studieduur aan de T.H. Bij het streven naar verkorting van de studieduur staat de Technische Hogeschool Delft, evenals alle instellingen voor wetenschappelijk onderwijs, voor de moeilijke taak: 1. een ald doend hoog wetenschappelijk peil voor het onderwijs te handhaven; 2. de snelle vorderingen van wetenschap en techniek zo goed mogelijk te volgen; 3. een voor de diverse onderdelen bv. voor de opleiding tot civielingenieur, voldoend brede basis te handhaven; 4. een behoorlijke studievrijheid te eerbiedigen; 5. een studieduurverkorting te bereiken. Reeds mijn voorganger, prof. ir. A. A. van Douwen, heeft in vorige cursussen verteld van de plannen van de Afdeling m.b.t. een onderwijsherziening, waarbij voortdurend aan genoemde punten aandacht werd geschonken. Maar het zal niet lukken, een schaap met vijf poten ter wereld

6 te brengen. De minister van Onderwijs, Kunsten en Wetenschappen heeft gewaarschuwd, dat hij zelf de nodige maatregelen zal treffen om studieduurverkorting te bereiken als de instellingen van wetenschappelijk onderwijs daarvoor geen middelen weten te vinden. De Rector Magnificus van de Technische Hogeschool Delft heeft tijdens het bezoek van de minister aan deze Technische Hogeschool op de dag van deze Vakantiecursus erop gewezen, dat het bereiken van een studieduurverkorting niet alleen afhangt van de maatregelen, te treffen door de Technische Hogeschool, of door het ministerie van Onderwijs, Kunsten en Wetenschappen, maar altijd ook van de studenten zelf. Nu is er natuurlijk wel een methode om een - zij het ook beperkte - studieduurverkorting te verkrijgen, bv. door veel aandacht *te schenken aan de (basis- en hulpwetenschappen (wiskunde, natuurkunde, de mechanica's, inclusief de hydraulica, de constructievakken, enz.), en bij de zuiver technische vakken niet teveel tot beschrijving over te gaan maar te volstaan met het wijzen op de beginselen die bij het coiistrueren moeten gelden en op de achtergronden van de constructies. Aldus behandelt men de hoofdlijnen en laat veel details onbehandeld, overwegende, da+ de pas afgestudeerde ingenieur in zijn praktijk de details, waarmee hij te maken krijgt, zelf zal moeten leren. Hierin schuilt het gevaar, dat hij de werkwijzen en details leert kennen zoals ze tot nu toe geweest zijn en gebruikelijk waren, maar niet die, welke volgens de nieuwste inzichten de meest wenselijke zijn. Om nu na beëindiging van de studie tijdens de werkzaamheid in de praktijd op de hoogte te komen en te blijven van de inmiddels verbeterde zienswijzen is bezoek aan post-academiale cursussen zo nuttig. Aan de Commissie inzake Vakantiecursussen in Drinkwatervoorziening komt de eer toe, naar ik meen, de eerste te zijn geweest, die een onderwerp, dat aan de Technische Hogeschool wordt behandeld, heeft gekozen als onderwerp voor de door haar in het leven geroepen telkenjare terugkerende vakantiecursus, op-

7 dat mensen uit de praktijk op de hoogte kunnen blijven van de laatste stand van wetenschap en techniek. Ditmaal is het de laatste keer, dat de huidige Voorzitter, prof. W. F. J. M. Krul, als hoogleraar een inleiding voor deze cursus zal houden. Hij was het die zestien jaar geleden de stoot tot het organiseren van deze vakantiecursussen heeft gegeven en die al die jaren een stuwende kracht van de Commissie is geweest. Ik hoop voor prof. Krul en voor de Commissie dat prof. Krul niet zonder meer van het toneel zal verdwijnen als hij volgend jaar geen hoogleraar in deze Afdeling meer zal zijn, maar dat de Commissie ook voor volgende jaren van zijn kennis en ervarhg zal kunnen profiteren. Ik zou willen besluiten met een wens en een woord van dank. Ik wens de Commissie met deze 16e cursus een even groot succes toe als zij met alle voorgaande heeft gehad en ik dank prof. Krul namens de Afdeling van harte voor wat hij deze zestien jaar als hoogleraar voor deze Commissie en voor deze cursussen heeft gedaan. Delft, januari 1964 De Voorzitter van de Afdeling der Weg- en Waterbouwkunde, prof. ir. F. M. C. Berkhout

8

9 Algemene inleiding door prof. W. F. J. M. Krul Bij de aanvang van deze 16e Vakantiecursus past het, onze op 13 juni 1963 overleden vriend ir. Andrew F. Meyer te herdenken, die op zo voortreffelijke wijze als lid van de Commissie van Voorbereiding de eerste 15 cursussen hielp tot stand brengen. Hij vervulde een zéér bijzondere plaats in de Nederlandse waterleidingkring, als bekwaam en vooruitstrevend bedrijfsdirecteur, als leider van commissies en vergaderingen, als toegewijd medewerker ook aan menige studie. Maar vooral leeft hij voort in de gedachten van zijn vele vrienden door zijn begaafdheid met uitzonderlijke karakterdeugden. Nooit kwamen die treffender uit dan tijdens zijn langdurige ziekte, die hij met volle bewustzijn en in volledige berusting aanvaardde. * Reeds gedurende vele decennia plegen onze waterleidingbedrijven jaarlijks gegevens van technische en fiancïele aard omtrent produktie, distributie en consumptie beschikbaar te stellen aan een centrale instantie die voor geordende publikatie zorgt. Aanvankelijk was die instantie de Vereniging voor Waterleidingsbelangen, thans is het de Vereniging van Exploitanten van Waterleidingbedrijven in Nederland. Die statistische overzichten zijn uitermate belangrijk en in weinig andere landen zó volledig, voor zover ze daar al bestaan. De leiding van een bedrijf kan er vergelijkingsmateriaal, trots of jaloezie aan ontlenen, de overheid grondslagen voor doelmatig en rechtvaardig beleid, de bedrijfsadviseur voorlopig inzicht, de buitenlander bewondering, de hoogleraar stof voor collegebeschouwingen. Toch is deze statistische activiteit niet de statistiek, die de Commissie van Voorbereiding zich als onderwerp voor deze 16e Vakantiecursus voor ogen stelde: de overzichten van de VEWIN geven immers cijfermateriaal, waarop wellicht statistische methoden kunnen worden toegepast, de cursus echter zal de statistische methodiek met haar beginselen en doelstellingen behandelen.

10 Men dient zich ervan bewust te zijn of te maken, dat in de moderne industriële samenleving het individu steeds meer afhankelijk is van wat de collectiviteit voor hem verricht. In het agrarische milieu bedient de mens zich van eenvoudige, deels door hemzelf vervaardigde, werktuigen, die hij kent, begrijpt en kan herstellen; hij beheerst zijn omgeving, voorzover die niet door hogere natuurmacht wordt bepaald. In het industriële milieu is de enkeling nagenoeg geheel afhankelijk van een onnoemelijk aantal specialisten die in een ingewikkeld samenstel zijn voortbeweging, zijn voeding, zijn gezondheid verzorgen. Steeds groter wordt daardoor de invloed en de verantwoordelijkheid van collectieve ondernemingen en de overheid; het besturen van die collectiviteiten is een nieuwe specialiteit geworden die om wetenschappelijke beoefening vraagt. Zeer merkwaardig is daarbij, dat de mens in het huidige stadium van zijn evolutie, nu hij - naar Teilhard de Chardin ons leert - van de biosfeer in de noösfeer, de sfeer van de geest, is getreden, de hoogst merkwaardige automatische interne regeling van zijn eigen lichaam heeft ontdekt. Door een wonderbaarlijk mechanisme van inwendige chemische processen, beheerst door interne secretie van velerlei aard, adapteert de mens zich of hij tracht zich te adapteren aan veranderingen in zijn milieu. Dat mechanisme wordt bestuurd door elektrische prikkels, door een informatiesysteem en een keuzesysteem. Men is nu tot het inzicht gekomen dat in wezen dezelfde wetten de basis vormen voor de elektronische regeltechniek en dat aldus de studie van de biologische verschijnselen de ontwikkeling van de regeltechniek kan bevorderen. In 1960 heeft men aan deze nieuwe wetenschap de naam,,bionicay' gegeven. De grondslagen voor de technische stuurmechanismen en de automatische rekenmachines of computers zijn vervat in de cybernetica, zoals de thermodynamica de grondslag vormt van de warmtemachines. Ik vermeld deze bijzonderheden omdat zij aanvankelijk meer of minder vaag rondwaarden in het ondeskundig brein van de leden van de Voorbereidingscornmissie van deze Vakantiecursus. Voorgelicht door prof. ir. L. J. Mostertman, die aan onze Delftse internationale cursussen de,,engineering operation" doceert, kregen wij de deskundige medewerking van de docenten van deze cursus. Daarbij werd het ons aldra duidelijk dat noch de cybernetica, noch de werking van computers een onderwerp van

11 bespreking moesten zijn, maar wel de mathematisch-statistische methoden die aan informatie en beslissing ten grondslag liggen. Het gaat hierbij niet om de,,definiete9' wiskunde, die stellingen uit bepaalde axioma's afleidt, maar om de waarschijnlijkheidsrekening, waarmee op grond van bepaalde gegevens bepaalde consequenties met een zekere mate van nauwkeurigheid kunnen worden voorspeld, om een benadering volgens zg.,,stochastische methoden". In mijn Grieks woordenboek vind ik voor,,stochazoma?' de vertaling:,,op iets mikken, maar iets gissen". Het woord,,stochasis" wordt vertaald met,,gissingw. De heer De Jonge zal als eerste inleider ons een algemene begripsomschrijving van moderne statistische methoden geven en voorbeelden van toepassing in zijn rijke ervaring als statisticus bij het Nederlands Instituut voor Praeventieve Geneeskunde. Dit is onontbeerlijk voor het hoofddoel van deze cursus, dat kan worden omschreven als: het aantonen van het nut van deze methoden in de moderne techniek en bedrijfsvoering. Tot nu toe is in het waterleidingbedrijf de toepassing vrijwel beperkt gebleven tot het bacteriologisch wateronderzoek, waarin ir. Leeflang ons een inzicht zal geven. Steeds méér echter, vooral tijdens en na de Tweede Wereldoorlog, is het belang van de stochastische methoden voor het nemen van beslissingen en het ontwerpen van technische constructies op velerlei gebied aan het licht getreden. Daaraan zullen de lessen van prof. Cohen en prof. Monhemius zijn gewijd. Zij zullen ongetwijfeld laten uitkomen, dat het de moeite loont, de toepassing ook in de waterleidingtechniek en de bedrijfsvoering van de waterleidingbedrijven te overwegen en te bevorderen. Men mag van deze cursus geenszins pasklare voorschriften verwachten, maar wel een prikkel voor de waterleidingdeskundigen om te gaan denken. Het zal niet mogelijk zijn, tenzij misschien bij de grootste bedrijven, om eigen statistische deskundigheid in de staforganisatie in te bouwen. Wel acht de Commissie van Voorbereiding het mogelijk, dat in samenwerking tussen verschiiiende bedrijven, wellicht door inschakeling van het KIWA, voorlichting wordt gezocht bij deskundigen op het gebied van statistische methoden als hulpmiddel bij,,operationeel onderzoek" (een goede vertaling van,,operational research"). Dat zou een fraai resultaat van deze ongetwijfeld niet gemakkelijke studiedagen zijn.

12 Aan het einde van deze inleiding wil ik aan onze deskundigen en overige aanwezigen het volgende vraagstuk voorleggen. Twee hoogleraren zijn betrokken bij de voorbereiding van een cursus in statistische methoden op geheel verschillende gebieden van de techniek, waarbij zij geen enkele voeling met elkaar houden. Hoe groot is de kans, dat hun cursus op dezelfde dag zal aanvangen? Dit probleem is actueel, want op deze zelfde dag opent mijn collega prof. ir. J. Volmuller aan deze zelfde Hogeschool een cursus in,,statistiek en waarschijnlijkheidsleer met betrekking tot de verkeerskunde", waarin ook prof. Cohen als docent optreedt. Ik kan er als leek slechts deze verklaring voor vinden:,,it is in the air". Ten slotte een waarschuwing inzake het gebruik van de statistiek, die ik in een Franse publikatie vond:,,la statistique est le bikini des grandes entreprises: elle cache ce qui est intéressant".

13 Statistiek en proefopzet door H. de Jonge 1. Statistiek Bij het woord statistiek plegen velen in de eerste plaats te denken aan methoden, die kunnen worden gebruikt als men beschikt over een uitgebreid waamemingsmateriaal, dat moet worden omgezet in tabellen en grafieken, of dat tot een reeks kengetallen (zoals gemiddelden of correlatiecoëfficiënten) moet worden gereduceerd. Anderen denken wellicht aan min of meer ingewikkelde rekenmethoden, die tenslotte tot een conclusie leiden waarin het woord,,significanty' voorkomt. Deze opvattingen omtrent de statistiek zijn echter verouderd en zodoende misleidend. Het is mijn taak u een indruk te geven van de rol, die de moderne statistische methoden - zoals deze in de afgelopen 50 jaar zijn ontwikkeld - kunnen spelen bij de opzet van onderzoekingen en bij de analyse van hun uitkomsten. Het is, zoals wij later zullen zien, niet toevallig dat ik in de voorgaande zin eerst spreek over de rol van de statistiek bij de opzet van een onderzoek en pas daarna haar gebruik bij de analyse van de onderzoekuitkomsten noem. In de laatste decennia is namelijk een samenspel van experiment en analyse tot stand gekomen, waarbij, zoals Hamaker (4) opmerkt:,,... uit de gedachtenwereld van de statistiek tal van nieuwe ideeën zijn voortgesproten over de wijze waarop experimenten het best h e n worden genomeny'. voordat wij echter over de proefopzetten op statistische basis kunnen gaan spreken, dien ik enige aandacht te wijden aan enkele essentiële elementen van de,,taal" van de statistiek. Ik wil daarbij uitgaan van een eenvoudige definitie, nl.: statistiek is een hulpwetenschap, die kan worden gebruikt bij het bestuderen van de variatie die optreedt in kenmerken van de elementen van een populatie. Een (statistische) populatie is de nauwkeurig omschreven verzameling van elementen, waarop een onderzoek betrekking heeft. De elementen van zo'n populatie kunnen materiële objecten, zoals mensen, dieren of voorwerpen, zijn. Zij kunnen echter ook be-

14 staan uit gebeurtenissen (zoals ongevallen), getallen, of uit denkbeeldige elementen (zoals waarnemingsuitkomsten die zouden kunnen worden, maar niet zijn verkregen). Laat ik enkele voorbeelden van dergelijke populaties geven. 1. De arbeiders die op 1 januari 1964 in een bepaald bedrijf werkzaam zijn. 2. De geregistreerde verkeersongevallen op de openbare weg in Nederland in Alle metingen die waarnemer A aan een bepaald voorwerp op voorgeschreven wijze zou kunnen verrichten. 4. De gehele getallen van 1 t/m 100. Wanneer men t.b.v. een onderzoek een populatie heeft gedefinieerd, gaat men over tot het verrichten van waarnemingen aan de elementen van deze populatie. Deze waarnemingen betreffen min of meer gedifferentieerde reeksen van kenmerken, die kwalitatief of kwantitatief kunnen zijn. Een kwalitatief kenmerk wordt met een omschrijving (soms met een niet-numeriek symbool) aangeduid. Het eenvoudigste systeem van kwalitatieve kenmerken is de dichotomie (tweedeling), bestaande uit twee kenmerken (positief/negatief, geslaagdlgezakt). Hierop volgt een systeem van k (3 of meer) kenmerken; bij zo'n categorisch systeem kan men onderscheid maken tussen: a. een systeem waarbij de kenmerken een intrinsieke volgorde bezitten (zoals de reeks: goed/voldoende/matig/onvoldoende/slecht), en b. een systeem waarbij dit niet het geval is (zoals: de reeks bestaande uit alle in Nederland voorkomende godsdiensten; de verschillende soorten defecten die een produkt kan vertonen, plus het kenmerk,,niet defect").' Een kwantitatief kenmerk wordt verkregen door tellen, meten of wegen en het bestaat uit een getal (waarde, score). Bij kwantitatieve kenmerken krijgt men te doen met categorische systemen van waarden van grootheden (zoals lichaamslengte, verzuimduur, hoeveelheid neerslag). Bestudeert men de elementen van een populatie t.a.v. een bepaald categorisch systeem, dan blijkt variatie op te treden: niet alle elementen bezitten hetzelfde kenmerk of dezelfde waarde. Men kan vaststellen hoe frequent elk kenmerk, resp. elke waarde, voorkomt en de reeks van bij een categorisch systeem behorende frequenties, de frequentieverdeìing, geeft een beeld van het variatiepatroon. Tabel 1 geeft een voorbeeld, waarbij de frequen- -- l Deze kwalitatieve kenmerken komen vooral op psychologisch, sociologisch en medisch gebied veel voor.

15 TABEL I Geregistreerde verkeersongevallen op de openbare weg in Nederland Ernst van het ongeval Frequentieverdelingen naar ernst Dodelijke afloop Ten hoogste ernstig letsel Ten hoogste licht letsel Uitsluitend materiële schade Totaal ~elatieve frequentieverdelingen ( i %) Dodelijke afloop 1,6 2,4 1s 12 1,o T.h. ernstig letsel 16,7 15,4 14,9 14, T.h. licht letsel 12,9 11,2 93 8,4 Uitsl. mat. schade 68,6 68,O 71,9 74,l 76,3 tieverdelingen naar ernst zijn gegeven van de geregistreerde verkeersongevallen op de openbare weg in Nederland in de jaren 1938, 1947, 1951, 1956 en Voor het vergelijken van de verdelingen onderling zijn ook de relatieve frequentieverdelingen berekend, die voor elk jaar laten zien welk procentueel aandeel elke categorie in het totaal aantal ongevallen bezit. Een onderzoek wordt vaak verricht om: 1. het variatiepatroon (in de vorm van frequentieverdelingen) van één of meer categorische systemen van een populatie te leren kennen; voorbeeld:' een onderzoek naar aantal en aard van defecten bij de vervaardiging van een bepaald produkt; 2. na te gaan of de variatie van twee of meer categorische systemen binnen één populatie een samenhang vertoont enlof om deze samenhang te bestuderen; voorbeeld: een onderzoek naar de relatie tussen de afvoer van de Rijn te Lobith en het chloorgehalte te Rhenen (zie tabel 2); 3. de frequentieverdelingen van een categorisch systeem van twee of meer populaties te vergelijken; voorbeelden: onderzoek, waarbij per machine een frequentieverdeling wordt opgesteld; onderzoek naar de verdeling van chloorgehalten in een rivier in de zomer- en winterperioden (zie tabel 3); 4. de fluctuatie, d.i. de variatie in de tijd, van één of meer categorische systemen, al dan niet in hun onderlinge samenhang, te bestuderen.

16 TABEL 2 Correlatie tussen de afvoer van de Rj'n te Lobith (m3/sec) en het chloorgehalte te Rhenen (mgtl) in de wintermaanden van (1 nov.- 1 mei). Perioden met zware ijsgang of ijsbedekking zijn buiten besehouwing gelaten. Gegevens uit,,rapport 1940, de watervoorziening van Amsterdam" Log (chloorgehalte) Log Totaal (afvoer) ,OO-4, ,90-3, ,80-3, ,70-3, ,60-3, ,50-3, ,40-3, ,30-3, ,20-3, ,lO-3, ,OO-3, Totaal TABEL 3 Verdelingen van de (logaritmen van de) chloorgehalten te Rhenen, , in de zomermaanden (1 mei-l nov.) en de wintermaanden (1 nov.- 1 mei). Gegevens uit,,rapport 1940 enz." Absolute frequenties Relatieve frequenties Log (chloor- Zomer Winter 100.fzlnz 100.f wlnw gehalte) fz f rv Totaal ,l 100,O nz n n7 Bij deze en dergelijke (en vanzelfsprekend meestal meer gecompliceerde onderzoekingen) kan men in de eerste plaats gebruik maken van de beschrijvende statistiek. Ik moet afkien van een behandeling van deze tak van de statistiek en volsta met de vermelding, dat hij methoden verschaft voor: a. de ordening van waarnemingen, bv. door het opstellen van frequentie en conelatietabellen, b. het tekenen van grafieken, bv. voor het verge-

17 lijken van frequentieverdelingen, c. het karakteriseren van frequentieverdelingen d.m.v. kengetallen zoals gemiddelden, spreidingsmaten, correlatiematen. Indien men steeds alle tot de onderzoekpopulatie behorende elementen in het onderzoek zou kunnen betrekken, zou men met de beschrijvende statistiek kunnen volstaan. Gewoonlijk is dit echter niet mogelijk. Vele populaties bezitten een zo grote omvang en/of geogra ische spreiding, dat een volledig onderzoek te tijdrovend of te kostbaar is. Op industrieel gebied is vaak de moeilijkheid, dat de elementen door het onderzoek zelf worden beschadigd of verloren gaan (een fabrikant van lucifers kan niet van elk geproduceerd exemplaar onderzoeken of het bevredigend ontvlamt en brandt). Op medisch terrein dient men bij vele onderzoekingen, bv. bij die naar de werking van geneesmiddelen, de omvang van het onderzoek om ethische redenen zoveel mogelijk te beperken. Verder zijn er vele situaties, waarin men op grond van een betrekkelijk klein, nu ter beschikking staand aantal elementen, conclusies moet trekken omtrent een populatie die (wellicht) slechts in de toekomst zal gaan bestaan; zo zal men bv. in de industrie, op grond van proeven met een aantal prototypen, willen uitmaken of een nieuw produkt ook inderdaad in fabricage zal worden genomen. Tenslotte noem ik de mogelijkheid dat het economisch niet verantwoord is de onderzoekpopulatie volledig te bestuderen, omdat een betrekkelijk klein deelonderzoek voldoend betrouwbare informatie kan verschaffen (zoals bij marktonderzoek). In de praktijk zal men dus meestal (moeten) volstaan met het onderzoeken van een deel van de populatie, een steekproef (of monster). Hierbij doet zich onmiddellijk een aantal vragen voor, nl. hoe groot moet de steekproef zijn, hoe moet deze worden samengesteld en welke uitspraken omtrent de populatie laat zij toe? Het is duidelijk dat deze vragen een samenhang bezitten: een,,verkeerdy7 samengestelde steekproef zal onherroepelijk tot verkeerde conclusies omtrent de populatie leiden; een op juiste wijze samengestelde steekproef zal meer informatie (omtrent de populatie) bevatten, naarmate zij groter is. Ik laat de (belangrijke) vraag omtrent de steekproefomvang buiten beschouwing en neem aan, dat zij,,zo groot mogelijk" wordt gekozea2 Veronderstel nu dat een populatie volledig bekend is en uit N Onder bepaalde voorwaarden kan de voor een verantwoord onderzoek noodzakelijke steekproefomvang echter van te voren worden aangegeven, of er kan een zg. sequent onderzoek worden uitgevoerd.

18 TABEL 4 Aantal mogelijke verschilleude steekproeven, C t = (t ), bij trekking zonder teruglegging Steekproefomvang I1 Aantal steekproeven TABEL 5 Alle mogelijke, verschillende steekproeven van n-3 elementen uit een populatie van N = 6 elementen met de waarden 1,2,... 6 elementen bestaat, waarvan er n in de steekproef worden opgenomen. Er kunnen echter vele verschillende steekproeven van n elementen worden gevormd. Tabel 4 geeft een overzicht waaruit blijkt dat zelfs bij een kleine omvang van de populatie het aantal mogelijke verschillende steekproeven (d.i. het aantal steekproeven dat tenminste één verschillend element bevat) reeds (zeer) groot is. Tabel 5 geeft een overzicht van alle mogelijk verschillende steekproeven van n = 3 elementen die kunnen worden getrokken uit een populatie van N = 6 elementen, die de waarden 1, 2, 3, 4, 5 en 6 dragen. De tweede tak van de statistiek, de mathematische statistiek (statistica) verschaft technieken voor het doen van uitspraken omtrent de populatie op basis van een steekproef. De mathematische statistiek kan echter slechts worden gebruikt als de steekproef aselect wordt samengesteld (getrokken) d.w.z. als de trek-

19 king zó plaatsvindt dat elke mogelijke steekproef dezelfde kans heeft om als de te bestuderen steekproef te worden aangewezen. Indien de tot de populatie behorende elementen van 1 t/m N kunnen worden genummerd, kan men deze aselecte trekking uitvoeren d.m.v. een lotingsprocedure. Men laat door het toeval n nummers tussen O en N + 1 aanwijzen en neemt de elementen van de populatie, die deze nummers dragen in de steekproef op. Men kan hierbij gebruik maken van tabellen met aselecte getallen (zie De Jonge (7), O ). Bij het uitvoeren van experimenten gaat men vaak uit van een steekproef van n elementen uit de onderzoekpopulatie, die in twee of meer groepen wordt gesplitst, die verschillende,,behandelingen" ondergaan. Deze groepen dienen eveneens aselect te worden samengesteld (men noemt dit aselecteren) en men kan hierbij het beste gebruik maken van tabellen met aselecte permutaties (zie De Jonge (7) ). De zojuist genoemde procedures gaan uit van een zg. volledige aselecte trekking, resp. aselectering. Indien echter omtrent de samenstelling van de populatie (resp. steekproef) relevante informatie ter beschikking staat kan men tot laagsgewijze trekking (resp. aselectering) overgaan. Als de populatie bestaat uit een groot aantal betrekkelijk kleine deelpopulaties (,,clusters"), staat de methode van de groepssteekproeven (,,cluster sampling") ter beschikking (zie voor deze en andere speciale steekproeftechnieken: De Jonge (7), O en ). Vaak kan men bij het steekproeftrekken geen loterijprocedure toepassen, bv. omdat het inventariseren en/of nummeren van de elementen van de populatie vrijwel onmogelijk is. In deze gevallen moet men zoeken naar een trekkingsmethode, waarvan redelijkerwijze mag worden aangenomen dat zij een aselecte steekproef zal opleveren. Dit is niet altijd eenvoudig, maar bijzonder belangrijk. Is de steekproef immers niet als aselect te beschouwen (,,biassed", onzuiver), dan is de betrouwbaarheid van de conclusies, die zij omtrent de populatie oplevert, onbekend. Men dient zich te realiseren dat de mens een bijzonder slecht instrument is voor het maken van een aselecte keuze. Yule en Kendall (9) merken hierover op:,,wherever there is any scope for personal choice or judgement on the part of the observer, bias is almost certain to creep in. Nor is this a quality which can be removed by conscious effort or training. Nearly every human being has, as part of his psychological make-up, a tendency away from true randomness in his choices". Om deze reden is dan ook het zg. doelbewust steekproeftrekken niet aan te bevelen. Deze

20 methode van uitzoeken van wat typerend voor de populatie wordt geacht is immers juist in sterke mate gevoelig voor (vaak onbewuste) vooroordelen van de onderzoeker. Een algemeen verbreide misvatting is, dat een,,lukrakev keuze van de elementen wel tot een aselecte steekproef zal leiden. Gewoonlijk is dit juist niet het geval, omdat allerlei niet vermoede of qua invloed moeilijk waardeerbare factoren selectief blijken te werken. Trekt men bv. uit een kooi met 25 ratten lukraak een steekproef van 5 ratten, dan verkrijgt men - zoals vele proeven hebben aangetoond - overwegend de tragere en daardoor zwaardere dieren. Selectie kan ook optreden als men de steekproef wel aselect heeft samengesteld, maar als tijdens het onderzoek uitvallers optreden. Dit kan zich o.m. voordoen bij schriftelijke enquêtes, indien een belangrijk deel van de personen die een enquêteformulier hebben ontvangen geen antwoord inzendt. De autoselectie die hierbij optreedt kan tot een bijzonder onzuivere steekproef leiden. De conclusies die een steekproef oplevert hebben uitsluitend betrekking op de populatie, waaruit de steekproef afkomstig is. Een conclusie, gebaseerd op een onderzoek van een steekproef, bestaande uit studenten, behoeft dus niet te gelden voor andere jonge mensen van dezelfde leeftijd. Vele onderzoeken zijn bedoeld om tot min of meer algemeen geldende uitspraken te komen, om algemeen geldende,,wetmatighedenw op te sporen en vast te leggen. Voert men bv. op dit moment een onderzoek uit naar de werking van twee verschillende soorten filterbedden, A en B, en vindt men dat A,,beterw is dan B, dan zal men deze uitspraak niet alleen op het heden willen betrekken, maar tevens op de toekomst. Deze extrapolatie in de tijd is echter niet altijd geoorloofd, omdat de mens en zijn omgeving in vele opzichten evolueren. Na langere tijd zal men dus de vraag of de uitspraak nog geldt gewoonlijk slechts door het uitvoeren van een nieuw onderzoek kunnen beantwoorden. Mede om deze reden is op vele gebieden het herhalen van reeds door anderen verrichte onderzoekingen verre van zinloos. Het is mij niet mogelijk de gedachtengang van de mathematische statistiek hier volledig te behandelen. Er zijn echter in deze gedachtengang twee fasen te onderscheiden. 1. Uitgaande van een populatie, waarvan de verdeling, resp. het type van de verdeling, bekend is, stelt men vast welke variatie optreedt in aselecte steekproeven van rz elementen. Zo'n variatiepatroon kan, gewoonlijk d.m.v. de kansrekening, in de vorm van een kansverdeling worden vastgelegd. Enkele voorbeelden. Beschouw eerst een populatie van N elementen, waarvan er Ni het kenmerk A en Np het kenmerk B dragen (N = Ni + Nz). Men definieert dan als de kans op (van) kenmerk A, bij aselecte trekking van één element uit deze populatie, de relatieve frequentie van dit

21 kenmerk: P(A) = P = NIIN; de kans op kenmerk B is dus: P(B) = Q = N2IN = l-p. Trekt men uit deze populatie aselect een steekproef van n elementen, dan is de kans dat deze x elementen met kenmerk A (dus 11-x elementen met kenmerk B) bevat, indien N is, bij benadering gelijk aan (Hierin is, zoals bekend mag worden verondersteld, n! = 11 faculteit, d.w.z. /I! =ri (11-1) (11-2).. 3 x2x 1). De kansverdeling die door de voorgaande formule wordt gerepresenteerd is de birioi~iiole verdeling. Als tweede voorbeeld nemen wij een populatie van N elementen, die alle een waarde van een grootheid x dragen; de populatieverdeling van deze grootheid is bij benadering normaal (d.i. een verdeling van Gauss-Laplace met gemiddelde en standaardafwijkingen o, (deze en dergelijke kengetallen, betrokken op populaties, worden porclmeters genoemd). De kansverdeling van het gemiddelde X van een aselecte steekvroef van 11 elementen uit deze bezit als eigenschappen dat zij: a. eveneens bij benadering normaal is, b. als gemiddelde,[c en als standaardafwijking 0111 heeft. 2. Met behulp van deze kansverdeling kan men, op basis van een aselecte steekproef uit een populatie met het bestudeerde verdelingstype, tot uitspraken komen omtrent de populatie. Naar de aard van deze uitspraken kan men onderscheid maken tussen: a. methoden voor het toetserz van hypothesen omtrent populatieverdelingen; b. methoden voor het geven van schattingen omtrent populatieverdelingen of hun parameters. Op grond van een steekproef kan men niet tot uitspraken omtrent populatieverdelingen of parameters komen, die zonder enige reserve juist zijn. Steeds is er een zeker risico, een zekere kans dat een uitspraak onjuist is. Het voordeel van een op statistiek gefundeerde t.o.v. een intuïtief getrokken conciusie is echter, dat men de kans op de onjuistheid van de conclusie kan kwantificeren, of anders gezegd: dat men de onbetrouwbaarheid van de uitspraak kan aangeven. Ook hier moet ik met het geven van een enkel voorbeeld volstaan. Veronderstel dat een waterleidingbedrijf een groot aantal exemplaren van een bepaald produkt gaat installeren. Het sluit een contract met een bepaalde leverancier voor exemplaren, die successievelijk zullen worden afgeleverd. De eerste partij van 100 exemplaren wordt nauwgezet gekeurd en blijkt 3 exemplaren (3%) te bevatten, die niet aan de gestelde eisen voldoen (,,defectenv). Wat kan men concluderen over het percentage defecten in de gehele bestelling, aangenomen dat de afgeleverde partij een aselecte steekproef uit deze,,populatien vormt?

22 Langs statistische weg kan men komen tot de uitspraak, dat dit percentage defecten tussen 0,6% en 8,5% ligt; de onbetrouwbaarheid van deze uitspraak (de kans dat zij fout is) is hierbij op 5% gesteld. Deze schatting van het populatiepercentage (de parameter) bezit twee bijzonderheden. In de eerste plaats worden twee grenzen opgegeven, waartussen de parameter wordt geschat (het zg. schattingsinterval). De grootte van dit interval bepaalt de nauwkeurigheid van de schatting: hoe kleiner het is, des te nauwkeuriger de schatting is. Verder bevat de uitspraak een element van onzekerheid: de onbetrouwbaarheid van de uitspraak, de kans dat zij fout is, wordt aangegeven. Bij een gegeven steekproef kan deze onbetrouwbaarheid slechts worden verkleind ten koste van de nauwkeurigheid van de schatting kiest men bv. een onbetrouwbaarheid van 1 %, dan worden de grenzen van het schattingsinterval 0,34% en 10,6%. In de praktijk hangt de keuze van de onbetrouwbaarheid, die men acceptabel acht, gewoonlijk af van de ernst van de consequenties, die aan de onjuiste uitspraak zijn verbonden. Door het trekken van een grotere steekproef kan men een schatting verkrijgen, die bij dezeede onbetrouwbaarheid nauwkeuriger is dan de schatting die een kleine steekproef oplevert. Vindt men bv. bij een steekproef van 500 exemplaren 15 (d.i. 3%) defecten, dan zijn de schattingsintervallen met onbetrouwbaarheid 5% en 1 % resp. 1,7-4,9% en 1,4-5,8%. 2. Vormen van onderzoek Voordat ik de rol van de statistiek bij de analyse van waarnemingsuitkomsten nader ga bezien, wil ik eerst even met u kijken naar de belangrijkste vormen van onderzoek. Deze zijn: A. onderzoek: 1. experimenteel, 2. observationeel; B. analyse van bestaande gegevens. In afb. 1 is de gang van zaken bij een onderzoek schematisch weergegeven. Uitgaande van een bepaalde vraagstelling, na definitie van de populatie(s) waarop men het onderzoek wil betrekken en na bestudering van de relevante literatuur (en zo nodig: na uitvoering van een vooronderzoek) maakt men de proefopzet, waarin de gehele gang van zaken bij het onderzoek nauwkeurig wordt aangegeven. Hierbij dient dus te worden vermeld hoe de steekproef, resp. steekproeven, zullen worden getrokken, welke waarnemingen zullen worden verricht (wanneer, langs welke weg, door wie), hoe zij zullen worden vastgelegd en bewerkt, welke onbetrouwbaarheid van de uitspraken men verantwoord acht, enz. Bij het experimentele onderzoek gaat men gewoonlijk

23 m Rapporteren Li--' b Conclusies G- \ Afb. 1 De gang van zaken bij een onderzoek llï b Steek roeven 4 uit van een steekproef uit de onderzoekpopulatie, waarvan : a. de elementen successievelijk aan verschillende behandelingen worden onderworpen, of b. die wordt gesplitst in groepen, die verschillende behandelingen ondergaan. Bij het observationele onderzoek beperkt men zich tot het verrichten van waarnemingen aan de elementen van steekproeven uit de onderwekpopulaties. Enkele belangrijke vormen van observationeel onderzoek zijn het (éénmalige) transversale en het longitudinale onderzoek, waarbij de in het onderzoek betrokken elementen op verschillende tijdstippen worden geobserveerd. Bij de analyse van bestaande gegevens gaat men uit van waar-. nemingsmateriaal dat reeds ter beschikking staat. Eensdeels is natuurlijk het feit, dat men de waarnemingen zelf niet meer behoeft te verrichten een voordeel, maar hieraan zijn ook belangrijke nadelen verbonden: a. men weet vaak niet precies, uit welke populatie(s) de elementen, waarop de waarnemingen betrekking hebben, afkomstig zijn, resp. of en, zo ja, welke selectie bij het verzamelen van deze elementen heeft plaatsgevonden; b. men weet niet hoe betrouwbaar de waarnemingen zijn (systematische fouten, nauwkeurigheid); c. gewoonlijk vertonen de waarnemingen leemten, die niet meer achteraf zijn te vullen. Dit betekent dat men bij de analyse van bestaande gegevens steeds met grote vakkennis en bijzonder kritisch te werk zal moeten gaan en de uitkomsten van de analyse met min of meer reserve zal moeten beschouwen. Gaarne wil ik dit toelichten.

24 TABEL 6 Plaats Totaal aantal onder- Kinderen met cariës* zochte kinderen Aantal % A B * Uiteraard zal men in werkelijkheid dit gegeven meer gedifferentieerd bestuderen (aantal carieuze elementen per kind). TABEL 7 Leeftijd A B in jaren Onderzocht Cariës % Onderzocht Cariës % , ,O ,O ,s , ,O Y , ,O Totaal ,O ,O Voorbeeld l In twee plaatsen, A en B, zijn gegevens verzameld over de gebitten van kinderen van 6 t/m 9 jaar. In plaats A komt van nature fluoride in het drinkwater voor, in plaats B is dit niet het geval. Men komt na bewerking van de gegevens tot de in tabel 6 gegeven uitkomsten. De uitkomst is voldoende verrassend om de onderzoeker, die de bewerking van de gegevens heeft verricht, aan het denken te zetten. Hij realiseert zich, dat een relevante factor in dit verband wordt gevormd door de leeftijd van de kinderen (bij oudere kinderen komt meer cariës voor) en maakt derhalve tabel 7. Deze uitkomst beantwoordt beter aan de verwachting van de onderzoeker: voor elke leeftijdsgroep is immers het percentage kinderen met cariës in plaats B (iets) hoger dan in plaats A. Hij vraagt zich echter af, of er wellicht nog andere verschillen tussen de plaatsen dienen te worden uitgeschakeld en besluit, de kinderen ook onder te verdelen in twee welstandsgroepen, I en I1 (ik laat hier buiten beschouwing hoe dit gebeurt; het is wel duidelijk dat zo'n inleiding zorgvuldig en met kennis van zaken moet plaatsvinden). De onderzoeker verkrijgt daarna tabel 8. De onderzoeker zal zijn oordeel nogmaals moeten herzien: het blijkt nu dat bij welstand I de cariëspercentages in A en B per leeftijd precies gelijk zijn: bij welstand I1 zijn echter deze percentages in B voor elke leeftijd duidelijk hoger dan in A. Het is duidelijk, dat in de praktijk wellicht nog meer relevante factoren aanwezig kunnen zijn, die moeten worden uitgeschakeld (geslacht?). Afgezien van het feit, dat men nooit precies weet

25 TABEL 8 Leef - I I1 I 11 tijd Tot. Car. % Tot. Car. % Tot. Car. % Tot. Car. % Totaal Vijver TABEL 9 Tijdstip Som Gem of men al deze factoren te pakken heeft, komt men op deze wijze, zelfs bij een groot uitgangsmateriaal, al spoedig tot zo kleine aantallen in de eindtabellen, dat men wel bijzonder voorzichtig moet worden met het vergelijken van de daaruit berekende percentages. Voorbeeld 2 Tabel 9 geeft het aantal diatoma in 5 betonnen vijvertjes op 6 opeenvolgende tijdstippen (aantal organismen per 1 water). Men concludeert uit deze uitkomsten dat het gemiddelde aantal diatoma in de tijd geen verandering heeft ondergaan. Deze conclusie houdt echter geen rekening met de ontbrekende uitkomsten (-) en behoeft niet juist te zijn, daar de volledige uitkomsten heel goed kunnen luiden als weergegeven in tabel 10. Dit voorbeeld lijkt triviaal, maar ik kan u verzekeren dat deze fout, bestaande uit het geen rekening houden met ontbrekende uitkomsten, in de praktijk herhaaldelijk wordt gemaakt. Het is mijn bedoeling dadelijk met u het experimentele onderzoek nader onder de loep te nemen. Ik wil daarom volstaan met het maken van enkele opmerkingen omtrent een vorm, waarin een observationeel onderzoek tegenwoordig vaak wordt uitgevoerd: de enquête, waarbij men gegevens verzamelt door schrif-

26 Vijver TABEL 10 Tijdstip Som Gem. 8,O 11,2 15,O 13,6 11,2 8,2 telijke of mondelinge ondervraging van de in het onderzoek betrokken elementen. Iedere vraag, die bij een enquête wordt gesteld, moet zo beknopt mogelijk en vooral duidelijk zijn. U moet niet te snel denken, dat een vraag die voor u en uw medewerkers volkomen duidelijk is, ook voor niet-ingewijden (of minder ontwikkelden) begrijpelijk zal zijn of slechts één interpretatie zal toelaten. Verder moeten de vragen zonder vooringenomendheid worden gesteld en zij mogen de ondervraagde niet een bepaald antwoord suggereren. Voorts verdient het aanbeveling de vragen zo te stellen, dat er slechts een beperkt aantal antwoorden mogelijk is (dat dan tevens wordt vermeld, zodat de ondervraagde slechts zijn antwoord heeft aan te geven). Stelt men immers de vragen zo, dat met een omstandig verhaal erop kan worden geantwoord dan ondervindt men veel moeite bij de rubricering van de antwoorden; deze zal gewoonlijk niet zonder willekeur kunnen plaatsvinden; voorts zullen sommige antwoorden zo vaag of zo uitgebreid zijn, dat men zelden verantwoord een enquête zal kunnen uitvoeren zonder een vooronderzoek, waarin vragen en antwoorden op hun bruikbaarheid worden getoetst. 3. Experimenteel onderzoek door middel van statistische proefopzetten Bij de klassieke methode van experimenten, die voortkomt uit de fysica, wordt steeds één factor tegelijk gevarieerd; alle ándere bij het experiment betrokken factoren worden constant gehouden. Door Fisher (1) is echter, in de eerste plaats t.b.v. landbouwkundige experimenten, een wijze van experimenteren aangegeven waarbij men in principe werkt met alle mogelijke combinaties van een aantal bewust gekozen niveaus van de onderzoekfactoren. Langs deze weg komt men tot meer gecompliceerde, maar bij-

27 TABEL 11 Een 22 factorïele proef met 3 replicaties: procentuele opbrengst bij de niîrering van aniline A. Toevoeging van HNO3 2 uur 4 uur 87,2 88,4 % uur 87,9 88,l B. Roertijd 87,4 87,s 83,9 85,l 2 uur 84,7 85,3 84,3 86,l Gemiddelden A 2 uur 4 uur Totaal % uur ,l 87,s B 1 2 uur 84,3 85,5 84,9 Totaal 85,9 86,s 86,35 zonder efficiënte proefopzetten, waarbij een voiledige symbiose tussen proefopzet en statistiek optreedt. De situatie waarin men zich, eerst nadat de proef was verricht, ging afvragen, op welke wijze de verkregen waarnemingen het best konden worden geanalyseerd, is daarbij geheel in het tegendeel overgegaan, daar het experiment wordt gebaseerd op een,,statistischew proefopzet, een zg. factorieel proefschema. Ik kan hier met u slechts enkele eenvoudige factoriële proefschema's bekijken. Het eerste daarvan behoort tot het type der 2~ factorïele schema's, d.w.z. de schema's met p factoren, ieder met 2 niveaus. Het betreft een onderzoek naar de opbrengst van een nitre~gsproces, nl. het nitreren van aniline (waarvan het eindresultaat het grondmateriaal vormt van een uitgebreid gebied van kleurstoffen en medicamenten). Veronderstel dat men bij dit onderzoek twee factoren wil variëren, nl.: a. de duur van het toevoegen van salpeterzuur: 2 uur of 4 uur; b. de roertijd: 1 uur of 2 uur. Er zijn dus twee factoren, ieder met twee niveaus, zodat een 22 factorieel schema wordt gebruikt. Wij veronderstellen verder dat de proef bij ieder van de vier combinaties 3 X wordt uitgevoerd; dergelijke herhalingen worden replicaties genoemd. De uitkomsten zijn in tabel 11 gegeven (opbrengsten in %). Bestudeert men de waargenomen gemiddelde opbrengsten, dan blijkt het volgende:

28 TABEL 12 Gemiddelden bij een 22 factorïèle proef (met 3 replicaties) met een duidelijke interactie 2 uur 4 uur Totaal B j % uur 87,5 88,l 87,8 ) 2 uur 89,9 84, Totaal 88,7 86,2 87,45 TABEL 13 Uitkomsten van de variante-analyse, toegepast op de gegevens in tabel 11 Variatiebron Vrijheids- Kwadratengraden (v) som Factor A 1 2,43 F (1;8) = 2,4310,1775 = 13/59 Factor B 1 25,23 F (1;8) = 25,2310,1775 = 142,14 Interactie A X B 1 0,17 F(1;8) = 0,1710,1775 = 0,96 Residueel 8 1,42 s :es = 1,4218 = 0,1775 Totaal 11 29,25 Kritieke waarden van F (1;8): 5%: 5.32, 1%: 7,57, 0.5%: bij toevoeging van HNO, gedurende 4 uur is de opbrengst 0,9% hoger dan bij toevoeging in 2 uur; 2. bij een roertijd van V2 uur is de opbrengst 2,9% hoger dan bij een roertijd van 2 uur. 3. er is geen interactie (wisselwerking) tussen de twee factoren. De verschillen tussen de gemiddelden van B bij beide niveaus van A, 88,l-87,5 = 0,6 en 85,5-84,3 = 1,2 of: die tussen de gemiddelden van A bij beide niveaus van B, 87,5-84,3 = 3,2 en 88,l-85,5 = 2,6 ontlopen elkaar slechts weinig. Ter verduidelijking geeft tabel 12 uitkomsten, waarbij wel interactie tussen de factoren A en B optreedt. Zo is (bv.) het verschil tussen de lange en de korte roertijd bij A-2 uur gelijk aan +2,4 maar bij A-4 uur gelijk aan -3,8. Bij kleine aantallen waarnemingen zal men gewoonlijk nog moeten onderzoeken, of de geconstateerde verschillen wellicht door toevallige variatie kunnen worden verklaard. Men toetst dan de zg. nulhypothese, dat bepaalde waargenomen verschillen op toeval berusten, met als alternatieve hypothese dat zij een afspiegeling zijn van reële verschillen. Dit statistische onderzoek kan geschieden door middel van de techniek van de variantieanalyse. Hoewel een bespreking van deze techniek buiten het kader van deze inleiding valt, geef ik in tabel 13 volledigheidshalve de uitkomsten van de analyse. Deze wijzen uit, dat men bij toet- -

29 B. Roertijd TABEL 14 Uitkomsten van een 23 factoriële proef.a. Toevoeging van HNO3 2 uur 4 uur C. Restant afwezig aanwezig afwezig aanwezig 87,2 87,l 88,4 87,7 *.2 uur 87,9 88,O 88,l 87,9 87,4 87,7 87,8 87,s S3,9 87,5 85,l 87,9 2 uur 84,7 86,8 86,l 88,4 84,3 87, Gemiddelden I 87,s 87,6 88,l 87,7 84,3 87,2 85,s 88,3 sing met een onbetrouwbaarheidsdrempel van 0,01 (l%), d.w.z. als men bereid is een risico van ten hoogste 1 % te accepteren op het ten onrechte verwerpen van de nulhypothese (= het ten onrechte concluderen tot een,,effect"), de volgende conclusies kan trekken. 1. Toevoeging van salpeterzuur gedurende 4 uur levert een hogere opbrengst op dan toevoeging gedurende 2 uur. 2. Een roertijd van Y2 uur levert een hogere opbrengst op dan een roertijd van 2 uur. 3. Er is geen interactie tussen de twee factoren. Het belangrijke van deze statistische conclusies, vergeleken met de uitspraken die wij reeds eerder, op grond van bestudering van de gemiddelden in tabel 11 deden, is, dat ook het betrekkelijk kleine ad 1 genoemde verschil,,significant" is bij de gebruikte 1 % drempel, d.w.z. als reëel kan worden beschouwd. Verder zien wij dat de praktische conclusie luidt, dat men het best kan werken met een roertijd van?h uur en een toevoeging van salpeter in 4 uur. Men kan overigens ook een intervalschatting geven van het verschil tussen de opbrengsten bij de lange en korte duur van HNO3-toevoeging (bij een roertijd van?h uur). Op grond van het waargenomen verschil, 0,9%, kan men bv. met een onbetrouwbaarheid van 5% beweren, dat het werkelijke verschil ligt tussen 0,6% en 1,1%. Hierbij kan echter worden opgemerkt, dat een toevoeging in 2 uur slechts een iets ongunstiger opbrengts zal geven; de mogelijkheid bestaat dat de kortere duur van de toevoeging, ondanks het geringe verlies aan opbrengst, voordeliger zal zijn dan de langere. In tabel 14 staan de (gefingeerde) uitkomsten van een facto-

30 TABEL 15 Uitkomsten van een onderzoek naar de bezinkingssnelheid van rivierslib Bezinkingsduur in uren Slibgehalte Totaal Totaal Gemiddelden ,s ,O riële proef met 3 replicaties. Het betreft hier de eerder besproken proef, uitgebreid met de factor,,restantm, eveneens met twee niveaus, t.w.,,restant afwezig" en,,restant aanwezig". Het restant is de rest van een voorgaande charge, die is achtergebleven in de pan waarin het procédé plaatsvindt. Bij,,restant afwezig" is de pan zorgvuldig gereinigd. Door deze factor in te voeren wil men onderzoeken, in hoeverre een grondige schoonmaak van de pannen nodig is voor het verkrijgen van een hogere opbrengst. Bestudeert men de waargenomen gemiddelden, dan blijkt dat een duidelijke interactie optreedt tussen de factoren B en C: bij een roertijd van % uur is de opbrengst bij,,restant afwezig", onafhankelijk van de toevoegingsduur van salpeterzuur, duidelijk hoger dan bij de roertijd van 2 uur. Dit verschil verdwijnt bij,,restant aanwezig". De praktische conclusie is dus, dat men: a. kan volstaan met de toevoeging van salpeterzuur in 2 uur, b. een roertijd van!h uur kan toepassen en c. de pannen niet grondig behoeft schoon te maken. Een volgend voorbeeld betreft een onderzoek naar de bezinkingssnelheid van rivierslib. Men neemt 12 watermonsters met een slibgehalte van ca. 25 mg11 en 12 watermonsters met een slibgehalte van ca. 75 mgll. Bij elk slibgehalte bepaalt men het percentage slib dat gezonken is in drie monsters en wel na 3, 6, 12 en 24 uur. De eerste factor is hier het slibgehalte met twee niveaus, de tweede de bezinkingsduur met vier niveaus, zodat men een 2 X 4 factorieel schema verkrijgt. De uitkomsten van zo'n onderzoek zijn in tabel 15 opgenomen. Een uitvoerige analyse is feitelijk niet noodzakelijk. Men ziet direct, dat geen interactie optreedt. Bij elke bezinkingsduur is het gemiddelde percentage bezonken slib bij het hoge slibgehalte ca. 10% hoger dan bij het

31 Personen TABEL l6 Latijns vierkant voor het uitvoeren van een makpmef met 4 proefpersonen en 4 soorten water (A. B, C en D) Proefopzet Uitkomsten Tijdstippen Personen Tijdstippen Totaal A B D C 1 6,2 5,8 6,O 5,7 23,7 2 D C A B 2 4,3 7,6 8,8 8,7 29,4 3 B A C D 3 4,7 6,2 5,5 5,3 21,7 4 D B A 4 5,2 4,8 8,l 9,l 27,2 Totaal 20,4 24,4 28,4 28,8 102,O A B C D Totaal 30,3 27,3 24,O 20,4 102,O lage. De gemiddelde percentages bezonken slib verschillen bij 3 en 6 uur slechts weinig; evenzo bij 12 en 24 uur. De twee laatstgenoemde percentages liggen gemiddeld echter duidelijk hoger dan de beide eerstgenoemde. Het laatste voorbeeld betreft het gebruik van een zg. Lntiijns vierkant. Hierbij brengt men feitelijk in een schema met twee factoren, elk met k niveaus, een derde factor met k niveaus onder. Het kan worden gebruikt als men weet, dat tussen de factoren geen interacties optreden. Beschouw een onderzoek, waarbij men de smaak van vier soorten water, A, B, C en D, wil Iaten beoordelen door vier proefpersonen. Deze,,scoren" de smaak door het zetten van een streepje op een schaalverdeling van O t/m 10. Zou men nu alle personen de vier soorten water in dezelfde volgorde toedienen, dan bestaat het gevaar dat een,,volgorde-effect" de vergelijking tussen de watersoorten beïnvloedt. Men ltan daarom het proefje beter uitvoeren op de wijze, die in tabel 16 is aangegeven. Men ziet dat de,,latijnsew letters, die overeenkomen met de vier soorten water, zó over het,,vierkant9' zijn verdeeld, dat elke soort water éénmaal per proefpersoon en per tijdstip voorkomt. Op deze wijze bereikt men, dat een bepaalde combinatie van de drie factoren (personen/soorten water/tijdstippen) precies één keer voorkomt. De (ge ingeerde) uitkomsten van de proef staan eveneens in tabel 16. Men ziet, dat er duidelijke verschillen tussen de gemiddelde scores (= totalen gedeeld door vier) van de proefpersonen zijn. Ook ziet men dat inderdaad een,,verloopw van de gemiddelde scores in de tijd optreedt; deze stijgen duidelijk van tijdstip 1 tot tijdstip 3. Er blijken echter tevens duidelijke verschiien tussen de gemiddelden van de vier soorten water aan- -

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Toegepaste Statistiek, Week 3 1

Toegepaste Statistiek, Week 3 1 Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie

Omnibusenquête 2015. deelrapport. Studentenhuisvesting

Omnibusenquête 2015. deelrapport. Studentenhuisvesting Omnibusenquête 2015 deelrapport Studentenhuisvesting Omnibusenquête 2015 deelrapport Studentenhuisvesting OMNIBUSENQUÊTE 2015 deelrapport STUDENTENHUISVESTING Zoetermeer, 9 december 2015 Gemeente Zoetermeer

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert VOOR HET SECUNDAIR ONDERWIJS Kansmodellen. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg . Populatie: een intuïtieve definitie.... Een

Nadere informatie

Klantonderzoek: statistiek!

Klantonderzoek: statistiek! Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van

Nadere informatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages. MARGES EN SIGNIFICANTIE BIJ STEEKPROEFRESULTATEN. De marges van percentages Metingen via een steekproef leveren een schatting van de werkelijkheid. Het toevalskarakter van de steekproef heeft als consequentie,

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Omnibusenquête 2015. deelrapport. Ter Zake Het Ondernemershuis

Omnibusenquête 2015. deelrapport. Ter Zake Het Ondernemershuis Omnibusenquête 2015 deelrapport Ter Zake Het Ondernemershuis Omnibusenquête 2015 deelrapport Ter Zake Het Ondernemershuis OMNIBUSENQUÊTE 2015 deelrapport TER ZAKE HET ONDERNEMERSHUIS Zoetermeer, 15 februari

Nadere informatie

Omnibusenquête deelrapport. Werk, zorg en inkomen

Omnibusenquête deelrapport. Werk, zorg en inkomen Omnibusenquête 2015 deelrapport Werk, zorg en inkomen Omnibusenquête 2015 deelrapport Werk, zorg en inkomen OMNIBUSENQUÊTE 2015 deelrapport WERK, ZORG EN INKOMEN Zoetermeer, 25 januari 2016 Gemeente Zoetermeer

Nadere informatie

Hoofdstuk 13. De omvang van een steekproef bepalen

Hoofdstuk 13. De omvang van een steekproef bepalen Hoofdstuk 13 De omvang van een steekproef bepalen Steekproefnauwkeurigheid Steekproefnauwkeurigheid: verwijst naar hoe dicht een steekproefgrootheid (bijvoorbeeld het gemiddelde van de antwoorden op een

Nadere informatie

Stop met het gebruik van de methode van Kinney als kwantitatieve risicoevaluatiemethode

Stop met het gebruik van de methode van Kinney als kwantitatieve risicoevaluatiemethode Stop met het gebruik van de methode van Kinney als kwantitatieve risicoevaluatiemethode : De methode van Kinney is geen kwantitatieve doch een kwalitatieve risicoevaluatiemethode Hierbij wil ik aantonen

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

Toegepaste Statistiek, Week 6 1

Toegepaste Statistiek, Week 6 1 Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën

Nadere informatie

Statistische variabelen. formuleblad

Statistische variabelen. formuleblad Statistische variabelen formuleblad 0. voorkennis Soorten variabelen Discreet of continu Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Bij een discrete

Nadere informatie

Numerieke aspecten van de vergelijking van Cantor. Opgedragen aan Th. J. Dekker. H. W. Lenstra, Jr.

Numerieke aspecten van de vergelijking van Cantor. Opgedragen aan Th. J. Dekker. H. W. Lenstra, Jr. Numerieke aspecten van de vergelijking van Cantor Opgedragen aan Th. J. Dekker H. W. Lenstra, Jr. Uit de lineaire algebra is bekend dat het aantal oplossingen van een systeem lineaire vergelijkingen gelijk

Nadere informatie

Lesbrief hypothesetoetsen

Lesbrief hypothesetoetsen Lesbrief hypothesetoetsen 00 "Je gaat het pas zien als je het door hebt" Johan Cruijff Willem van Ravenstein Inhoudsopgave Inhoudsopgave... Hoofdstuk - voorkennis... Hoofdstuk - mens erger je niet... 3

Nadere informatie

Cover Page. The handle holds various files of this Leiden University dissertation.

Cover Page. The handle  holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/22619 holds various files of this Leiden University dissertation. Author: Iterson, Maarten van Title: The power of high-dimensional data in genomics research

Nadere informatie

Statistiek basisbegrippen

Statistiek basisbegrippen MARKETING / 07B HBO Marketing / Marketing management Raymond Reinhardt 3R Business Development raymond.reinhardt@3r-bdc.com 3R 1 M Statistiek: wetenschap die gericht is op waarnemen, bestuderen en analyseren

Nadere informatie

Examen VWO 2015. wiskunde C. tijdvak 2 woensdag 17 juni 13.30-16.30 uur. Bij dit examen hoort een uitwerkbijlage.

Examen VWO 2015. wiskunde C. tijdvak 2 woensdag 17 juni 13.30-16.30 uur. Bij dit examen hoort een uitwerkbijlage. Examen VWO 2015 tijdvak 2 woensdag 17 juni 13.30-16.30 uur wiskunde C Bij dit examen hoort een uitwerkbijlage. Dit examen bestaat uit 22 vragen. Voor dit examen zijn maximaal 79 punten te behalen. Voor

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Omnibusenquête deelrapport. Zoetermeer FM

Omnibusenquête deelrapport. Zoetermeer FM Omnibusenquête 2015 deelrapport Zoetermeer FM Omnibusenquête 2015 deelrapport Zoetermeer FM OMNIBUSENQUÊTE 2015 deelrapport ZOETERMEER FM Zoetermeer, 18 december 2015 Gemeente Zoetermeer Afdeling Juridische

Nadere informatie

1 Basisbegrippen, W / O voor waar/onwaar

1 Basisbegrippen, W / O voor waar/onwaar Naam - Toetsende Statistiek Rijksuniversiteit Groningen Lente Docent: John Nerbonne Tentamen di. 22 juni om 14 uur tentamenhal Belangrijke instructies 1. Schrijf uw naam & studentnummer hierboven, schrijf

Nadere informatie

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

DEZE PAGINA NIET vóór 8.30u OMSLAAN! STTISTIEK 1 VERSIE MT15303 1308 1 WGENINGEN UNIVERSITEIT LEERSTOELGROEP MT Tentamen Statistiek 1 (MT-15303) 5 augustus 2013, 8.30-10.30 uur EZE PGIN NIET vóór 8.30u OMSLN! STRT MET INVULLEN VN NM, REGISTRTIENUMMER,

Nadere informatie

tudievragen voor het vak TCO-2B

tudievragen voor het vak TCO-2B S tudievragen voor het vak TCO-2B 1 Wat is fundamenteel/theoretisch onderzoek? 2 Geef een voorbeeld uit de krant van fundamenteel/theoretisch onderzoek. 3 Wat is het doel van fundamenteel/theoretisch onderzoek?

Nadere informatie

Verandering in de frequentie van het gemengde huwelijk

Verandering in de frequentie van het gemengde huwelijk Verandering in de frequentie van het gemengde huwelijk G. Dekker Aan het kerkelijk gemengde huwelijk wordt vanuit de sociale wetenschappen niet zo bijzonder veel aandacht geschonken. De belangstelling

Nadere informatie

Statistiek. Beschrijvend statistiek

Statistiek. Beschrijvend statistiek Statistiek Beschrijvend statistiek Verzameling van gegevens en beschrijvingen Populatie, steekproef Populatie = o de gehele groep ondervragen o parameter is een kerngetal Steekproef = o een onderdeel van

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. 3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625. Absolute verandering = Aantal 2004 Aantal 1994 = 1625 3070 = -1445 Relatieve verandering = Nieuw Oud Aantal

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

Begrippenlijst Anders Dit is onderzoek

Begrippenlijst Anders Dit is onderzoek Begrippenlijst Anders Dit is onderzoek Begrippenlijst door F. 1080 woorden 15 april 2016 9,1 2 keer beoordeeld Vak Anders Dit is onderzoek! 2.4 Steekproef Onderzoek met een kleine groep met de bedoeling

Nadere informatie

Checklist Wiskunde A HAVO 4 2014-2015 HML

Checklist Wiskunde A HAVO 4 2014-2015 HML Checklist Wiskunde A HAVO 4 2014-2015 HML 1 Hoofdstuk 1 Ik weet hoe je met procenten moet rekenen: procenten en breuken, percentage berekenen, toename en afname in procenten, rekenen met groeifactoren.

Nadere informatie

Het watergehalte in verse en gerookte haringfilets

Het watergehalte in verse en gerookte haringfilets MINISTERIE VAN LANDBOUW Bestuur voor Landbouwkundig Onderzoek Centrum voor Landbouwkundig Onderzoek - Gent PROEFSTATION VOOR ZEEVISSERIJ Directeur : P. Hovart Nr 6 Het watergehalte in verse en gerookte

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

tla Technische Universiteit Eindhoven

tla Technische Universiteit Eindhoven tla Technische Universiteit Eindhoven lnstituut Wiskundige Dienstverlening Eindhoven RAPPORT IWDE 95-05 ONDERZOEK RAPPORT LENTING & PARTNERS J.T.M. Wijnen \\\\"(a Den Dolech 2 Postbus 513 5600 MB Eindhoven

Nadere informatie

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn Statistiek: Spreiding en dispersie 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Met spreiding willen we in één getal uitdrukken hoe verspreid de gegevens zijn: in hoeveel

Nadere informatie

Tijdreeksanalyse in verkeersveiligheidsonderzoek met behulp van state space methodologie

Tijdreeksanalyse in verkeersveiligheidsonderzoek met behulp van state space methodologie Samenvatting Tijdreeksanalyse in verkeersveiligheidsonderzoek met behulp van state space methodologie In dit proefschrift wordt een aantal studies gepresenteerd waarin tijdreeksanalyse wordt toegepast

Nadere informatie

Samenvatting. Samenvatting 8. * COgnitive Functions And Mobiles; in dit advies aangeduid als het TNO-onderzoek.

Samenvatting. Samenvatting 8. * COgnitive Functions And Mobiles; in dit advies aangeduid als het TNO-onderzoek. Samenvatting In september 2003 publiceerde TNO de resultaten van een onderzoek naar de effecten op het welbevinden en op cognitieve functies van blootstelling van proefpersonen onder gecontroleerde omstandigheden

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

Operationaliseren van variabelen (abstracte begrippen)

Operationaliseren van variabelen (abstracte begrippen) Operationaliseren van variabelen (abstracte begrippen) Tabel 1, schematisch overzicht van abstracte begrippen, variabelen, dimensies, indicatoren en items. (Voorbeeld is ontleend aan de masterscriptie

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4.1 PARAMETERTOESTEN 1 A. Toetsen van het gemiddelde Beschouw een steekproef X 1, X,, X n van n onafhankelijke N(µ, σ) verdeelde kansveranderlijken Men

Nadere informatie

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE DEEL 3 INDUCTIEVE STATISTIEK INHOUD H 10: INLEIDING TOT DE INDUCTIEVE STATISTIEK H 11: PUNTSCHATTING 11.1 ALGEMEEN 11.1.1 Definities 11.1.2 Eigenschappen 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE 11.3

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Gegevensverwerving en verwerking

Gegevensverwerving en verwerking Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie

Nadere informatie

Examen Statistiek I Januari 2010 Feedback

Examen Statistiek I Januari 2010 Feedback Examen Statistiek I Januari 2010 Feedback Correcte alternatieven worden door een sterretje aangeduid. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Twee derden van de mannen

Nadere informatie

Feedback proefexamen Statistiek I 2009 2010

Feedback proefexamen Statistiek I 2009 2010 Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Basistechnieken 6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. x 0 2 4 6 p(x) ¼ ¼ ¼ ¼ a. Schrijf alle mogelijke verschillende steekproeven van n =

Nadere informatie

Voorbereidend Wetenschappelijk Onderwijs Tijdvak 1 Woensdag 25 mei totale examentijd 3 uur

Voorbereidend Wetenschappelijk Onderwijs Tijdvak 1 Woensdag 25 mei totale examentijd 3 uur wiskunde A1 Examen VWO - Compex Voorbereidend Wetenschappelijk Onderwijs Tijdvak 1 Woensdag 25 mei totale examentijd 3 uur 20 05 Vragen 1 tot en met 13 In dit deel staan de vragen waarbij de computer niet

Nadere informatie

Procedureoverzicht Promotietraject Faculteit der Geesteswetenschappen (Promotiereglement 2015)

Procedureoverzicht Promotietraject Faculteit der Geesteswetenschappen (Promotiereglement 2015) Procedureoverzicht Promotietraject Faculteit der Geesteswetenschappen (Promotiereglement 2015) Hieronder volgt een overzicht van de stappen in de formele procedure die uiteindelijk wordt afgesloten door

Nadere informatie

Onderzoeksvraag Uitkomst

Onderzoeksvraag Uitkomst Hoe doe je onderzoek? Hoewel er veel leuke boeken zijn geschreven over het doen van onderzoek (zie voor een lijstje de pdf op deze site) leer je onderzoeken niet uit een boekje! Als je onderzoek wilt doen

Nadere informatie

hoofdstuk 2 een vergelijkbaar sekseverschil laat zien voor buitenrelationeel seksueel gedrag: het hebben van seksuele contacten buiten de vaste

hoofdstuk 2 een vergelijkbaar sekseverschil laat zien voor buitenrelationeel seksueel gedrag: het hebben van seksuele contacten buiten de vaste Samenvatting Mensen zijn in het algemeen geneigd om consensus voor hun eigen gedrag waar te nemen. Met andere woorden, mensen denken dat hun eigen gedrag relatief vaak voorkomt. Dit verschijnsel staat

Nadere informatie

Procedureoverzicht Promotietraject (Promotiereglement 2015)

Procedureoverzicht Promotietraject (Promotiereglement 2015) overzicht Promotietraject (Promotiereglement 2015) Hieronder volgt een overzicht van de stappen in de formele procedure die uiteindelijk wordt afgesloten door de openbare verdediging van het proefschrift.

Nadere informatie

Examen VWO. wiskunde A1

Examen VWO. wiskunde A1 wiskunde A1 Examen VWO Voorbereidend Wetenschappelijk Onderwijs Tijdvak 2 Woensdag 22 juni 13.30 16.30 uur 20 05 Voor dit examen zijn maximaal 81 punten te behalen; het examen bestaat uit 19 vragen. Voor

Nadere informatie

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 5: Steekproevendistributies Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel

Nadere informatie

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Learning the Mechanics 6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. De random variabele x wordt tweemaal waargenomen. Ga na dat, indien de waarnemingen

Nadere informatie

Statistiek = leuk + zinvol

Statistiek = leuk + zinvol Statistiek = leuk + zinvol Doel 1: Doel : Doel 3: zie titel een statistisch onderzoek kunnen beoordelen een statistisch onderzoek kunnen opzetten een probleem vertalen in standaardmethoden gegevens verzamelen,

Nadere informatie

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Statistische controle Balgengasmeters en Ultrasone gasmeters

Statistische controle Balgengasmeters en Ultrasone gasmeters GT - 120429 4 april 2013 Statistische controle Balgengasmeters en Ultrasone gasmeters Poolbesluit controlejaar 2012 Aanvullingen controlejaar 2011 4 april 2013 Statistische controle Balgengasmeters en

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10) Tentamen Inleiding Experimentele Fysica (3AA10)

TECHNISCHE UNIVERSITEIT EINDHOVEN. Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10) Tentamen Inleiding Experimentele Fysica (3AA10) TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10) Tentamen Inleiding Experimentele Fysica (3AA10) d.d. 30 oktober 2009 van 9:00 12:00 uur Vul de presentiekaart

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur

Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur Hoewel kinderen die leren praten geen moeite lijken te doen om de regels van hun moedertaal

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

Folkert Buiter 2 oktober 2015

Folkert Buiter 2 oktober 2015 1 Nuchter kijken naar feiten en trends van aardbevingen in Groningen. Een versneld stijgende lijn van het aantal en de kracht van aardbevingen in Groningen. Hoe je ook naar de feitelijke metingen van de

Nadere informatie

Kun je met statistiek werkelijk alles bewijzen?

Kun je met statistiek werkelijk alles bewijzen? Kun je met statistiek werkelijk alles bewijzen? Geert Verbeke Biostatistisch Centrum, K.U.Leuven International Institute for Biostatistics and statistical Bioinformatics geert.verbeke@med.kuleuven.be http://perswww.kuleuven.be/geert

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Meten en experimenteren

Meten en experimenteren Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006 Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie

Nadere informatie

Onderzoeksassistent CONCEPT. Doel

Onderzoeksassistent CONCEPT. Doel Onderzoeksassistent College van van Bestuur Doel Directieraad Voorbereiden van en praktische uitvoeren van onderzoeks- of laboratorium werkzaamheden, volgens werkinstructies/ protocollen en geldende voorschriften

Nadere informatie

Statistische analyse CMDB

Statistische analyse CMDB UvA IC, IMP overleg, 16 november 2010 Statistische analyse CMDB B. Kleijn, KdV Instituut, UvA in samenwerking met C. Klaassen (KdVI, UvA) R. Knijn (IC, UvA) Statistische vraag Analyse en enquete Analyse

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen Biostatistiek voor BMT (2S390) op 17-11-2003 U mag alleen gebruik maken van een onbeschreven Statistisch Compendium (dikt. nr. 2218) en van een zakrekenmachine.

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Les 4 Toetsen van hypothesen We hebben tot nu toe enigszins algemeen naar grootheden van populaties gekeken en bediscussieerd hoe we deze grootheden uit steekproeven kunnen schatten. Vaak hebben we echter

Nadere informatie

Wiskunde B - Tentamen 1

Wiskunde B - Tentamen 1 Wiskunde B - Tentamen Tentamen 57 Wiskunde B voor CiT vrijdag januari 5 van 9. tot. uur Dit tentamen bestaat uit 6 opgaven, formulebladen en tabellen. Vermeld ook uw studentnummer op uw werk en tentamenbriefje.

Nadere informatie

Praktische handreiking voor het opstellen van de representativiteitsopgave bij aanvragen i.h.k.v. de Wet verplichte beroepspensioenregeling (WVB)

Praktische handreiking voor het opstellen van de representativiteitsopgave bij aanvragen i.h.k.v. de Wet verplichte beroepspensioenregeling (WVB) Praktische handreiking voor het opstellen van de representativiteitsopgave bij aanvragen i.h.k.v. de Wet verplichte beroepspensioenregeling (WVB) 1. Inleiding De Minister van Sociale Zaken en Werkgelegenheid

Nadere informatie

in cijfers P.G. van de Veen 23 augustus 2005, Enschede

in cijfers P.G. van de Veen 23 augustus 2005, Enschede en in cijfers P.G. van de Veen 23 augustus 25, Enschede Inleiding: De hier voorliggende inventarisatie van landelijke en provinciale competities is om verschillende redenen gemaakt. I. De vraag is actueel

Nadere informatie

Werkbelevingsonderzoek 2013

Werkbelevingsonderzoek 2013 Werkbelevingsonderzoek 2013 voorbeeldrapport Den Haag, 17 september 2014 Ipso Facto beleidsonderzoek Raamweg 21, Postbus 82042, 2508EA Den Haag. Telefoon 070-3260456. Reg.K.v.K. Den Haag: 546.221.31. BTW-nummer:

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

TERUGBLIK CENTRAAL EXAMEN BIOLOGIE VWO EERSTE TIJDVAK 2016

TERUGBLIK CENTRAAL EXAMEN BIOLOGIE VWO EERSTE TIJDVAK 2016 TERUGBLIK CENTRAAL EXAMEN BIOLOGIE VWO EERSTE TIJDVAK 2016 Inleiding Quickscan Via WOLF (Windows Optisch Leesbaar Formulier) geven examinatoren per vraag de scores van hun kandidaten voor het centraal

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een

Nadere informatie

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten Stochastiek 2 Inleiding in the Mathematische Statistiek staff.fnwi.uva.nl/j.h.vanzanten 1 / 12 H.1 Introductie 2 / 12 Wat is statistiek? - 2 Statistiek is de kunst van het (wiskundig) modelleren van situaties

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Deelrapportage "Apotheken door Cliënten Bekeken" Vorige en huidige meting Apotheek Den Hoorn

Deelrapportage Apotheken door Cliënten Bekeken Vorige en huidige meting Apotheek Den Hoorn Deelrapportage "Apotheken door Cliënten Bekeken" Vorige en huidige meting Apotheek Den Hoorn E Inhoud 1. Inleiding en methode 1 1.1. Achtergrond 1 1.2. Doel van het kwaliteitstraject: meten en verbeteren

Nadere informatie

Box 2: Vaststellen beginsituatie Handelingsgericht werken op PABO s en lerarenopleidingen VO

Box 2: Vaststellen beginsituatie Handelingsgericht werken op PABO s en lerarenopleidingen VO Kees Dijkstra (Windesheim), Els de Jong (Hogeschool Utrecht) en Elle van Meurs (Fontys OSO). 31 mei 2012 Box 2: Vaststellen beginsituatie Handelingsgericht werken op PABO s en lerarenopleidingen VO Doel

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 13 Dinsdag 26 Oktober 1 / 24 2 Statistiek Indeling: Hypothese toetsen Filosofie 2 / 24 Hypothese toetsen 3 / 24 Hypothese toetsen: toepassingen Vb. Een medicijn wordt

Nadere informatie

Inhoud. Introductie tot de cursus

Inhoud. Introductie tot de cursus Inhoud Introductie tot de cursus 1 Inleiding 7 2 Voorkennis 7 3 Het cursusmateriaal 7 4 Structuur, symbolen en taalgebruik 8 5 De cursus bestuderen 9 6 Studiebegeleiding 10 7 Huiswerkopgaven 10 8 Het tentamen

Nadere informatie

ELEKTRICITEITSBRONNEN IN NEDERLAND. Attitude van de Nederlander in kaart gebracht. Onderzoek in opdracht van de Nederlandse Wind Energie Associatie

ELEKTRICITEITSBRONNEN IN NEDERLAND. Attitude van de Nederlander in kaart gebracht. Onderzoek in opdracht van de Nederlandse Wind Energie Associatie ELEKTRICITEITSBRONNEN IN NEDERLAND Attitude van de Nederlander in kaart gebracht Onderzoek in opdracht van de Nederlandse Wind Energie Associatie COLOFON Uitgevoerd in opdracht van: Nederlandse Wind Energie

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

MINISTERIE VAN ONDERWIJS, CULTUUR EN WETENSCHAP

MINISTERIE VAN ONDERWIJS, CULTUUR EN WETENSCHAP MINISTERIE VAN ONDERWIJS, CULTUUR EN WETENSCHAP Nr. WJZ/2005/30013 (3764) (Hoofd) Afdeling DIRECTIE WETGEVING EN JURIDISCHE ZAKEN Nader rapport inzake het voorstel van wet houdende wijziging van de Wet

Nadere informatie

1BA PSYCH Statistiek 1 Oefeningenreeks 3 1

1BA PSYCH Statistiek 1 Oefeningenreeks 3 1 Juno KOEKELKOREN D.1.3. OEFENINGENREEKS 3 OEFENING 1 In onderstaande tabel vind je zes waarnemingen van twee variabelen (ratio meetniveau). Eén van de waarden van y is onbekend. Waarde x y 1 1 2 2 9 2

Nadere informatie

IS DE BEMESTINGSTOESTAND EEN MAAT VOOR HET PEIL VAN DE LANDBOUW IN EEN GEMEENTE?

IS DE BEMESTINGSTOESTAND EEN MAAT VOOR HET PEIL VAN DE LANDBOUW IN EEN GEMEENTE? BIBLIOTHEEK INSTITUUT VOOR 631.8 BODEMVRUCHTBAARHEID GRONINGEN No... /O 7.. ' IS DE BEMESTINGSTOESTAND EEN MAAT VOOR HET PEIL VAN DE LANDBOUW IN EEN GEMEENTE? TH. J. FERRARI Instituut voor Bodemvruchtbaarheid,

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Eindexamen wiskunde A1-2 vwo 2004-II

Eindexamen wiskunde A1-2 vwo 2004-II APK Auto s moeten elk jaar gekeurd worden. Deze wettelijk verplichte keuring wordt APK, Algemene Periodieke Keuring, genoemd en wordt uitgevoerd door garagebedrijven. Om na te gaan of de garagebedrijven

Nadere informatie

Netwerkdiagram voor een project. AON: Activities On Nodes - activiteiten op knooppunten

Netwerkdiagram voor een project. AON: Activities On Nodes - activiteiten op knooppunten Netwerkdiagram voor een project. AON: Activities On Nodes - activiteiten op knooppunten Opmerking vooraf. Een netwerk is een structuur die is opgebouwd met pijlen en knooppunten. Bij het opstellen van

Nadere informatie