- DEN HAAG. Technische Hogeschool. ZESTIENDE VAKANTIECURSUS 16 en 17 januari 1964. Gebruik van moderne statistische methoden

Vergelijkbare documenten

Hoofdstuk 3 Statistiek: het toetsen

Toegepaste Statistiek, Week 3 1

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Omnibusenquête deelrapport. Studentenhuisvesting

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert

Klantonderzoek: statistiek!

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Hoofdstuk 5 Een populatie: parametrische toetsen

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Omnibusenquête deelrapport. Ter Zake Het Ondernemershuis

Omnibusenquête deelrapport. Werk, zorg en inkomen

Hoofdstuk 13. De omvang van een steekproef bepalen

Stop met het gebruik van de methode van Kinney als kwantitatieve risicoevaluatiemethode

Populaties beschrijven met kansmodellen

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Toegepaste Statistiek, Week 6 1

Statistische variabelen. formuleblad

Numerieke aspecten van de vergelijking van Cantor. Opgedragen aan Th. J. Dekker. H. W. Lenstra, Jr.

Lesbrief hypothesetoetsen

Cover Page. The handle holds various files of this Leiden University dissertation.

Statistiek basisbegrippen

Examen VWO wiskunde C. tijdvak 2 woensdag 17 juni uur. Bij dit examen hoort een uitwerkbijlage.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Omnibusenquête deelrapport. Zoetermeer FM

1 Basisbegrippen, W / O voor waar/onwaar

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

tudievragen voor het vak TCO-2B

Verandering in de frequentie van het gemengde huwelijk

Statistiek. Beschrijvend statistiek

Kansrekening en Statistiek

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.

Wiskunde B - Tentamen 2

Begrippenlijst Anders Dit is onderzoek

Checklist Wiskunde A HAVO HML

Het watergehalte in verse en gerookte haringfilets

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

tla Technische Universiteit Eindhoven

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

Tijdreeksanalyse in verkeersveiligheidsonderzoek met behulp van state space methodologie

Samenvatting. Samenvatting 8. * COgnitive Functions And Mobiles; in dit advies aangeduid als het TNO-onderzoek.

Voorbeeldtentamen Statistiek voor Psychologie

Operationaliseren van variabelen (abstracte begrippen)

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 6 Twee populaties: parametrische toetsen

Gegevensverwerving en verwerking

Examen Statistiek I Januari 2010 Feedback

Feedback proefexamen Statistiek I

Data analyse Inleiding statistiek

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Voorbereidend Wetenschappelijk Onderwijs Tijdvak 1 Woensdag 25 mei totale examentijd 3 uur

Procedureoverzicht Promotietraject Faculteit der Geesteswetenschappen (Promotiereglement 2015)

Onderzoeksvraag Uitkomst

hoofdstuk 2 een vergelijkbaar sekseverschil laat zien voor buitenrelationeel seksueel gedrag: het hebben van seksuele contacten buiten de vaste

Procedureoverzicht Promotietraject (Promotiereglement 2015)

Examen VWO. wiskunde A1

Hoofdstuk 5: Steekproevendistributies

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

Statistiek = leuk + zinvol

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

HOOFDSTUK VII REGRESSIE ANALYSE

Statistische controle Balgengasmeters en Ultrasone gasmeters

TECHNISCHE UNIVERSITEIT EINDHOVEN. Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10) Tentamen Inleiding Experimentele Fysica (3AA10)

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Samenvatting Impliciet leren van kunstmatige grammatica s: Effecten van de complexiteit en het nut van de structuur

Hoofdstuk 10: Regressie

Folkert Buiter 2 oktober 2015

Kun je met statistiek werkelijk alles bewijzen?

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Meten en experimenteren

Onderzoeksassistent CONCEPT. Doel

Statistische analyse CMDB

TECHNISCHE UNIVERSITEIT EINDHOVEN

Oefenvragen bij Statistics for Business and Economics van Newbold

Toetsen van hypothesen

Wiskunde B - Tentamen 1

Praktische handreiking voor het opstellen van de representativiteitsopgave bij aanvragen i.h.k.v. de Wet verplichte beroepspensioenregeling (WVB)

in cijfers P.G. van de Veen 23 augustus 2005, Enschede

Werkbelevingsonderzoek 2013

8. Analyseren van samenhang tussen categorische variabelen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

TERUGBLIK CENTRAAL EXAMEN BIOLOGIE VWO EERSTE TIJDVAK 2016

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Inleiding Applicatie Software - Statgraphics

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Deelrapportage "Apotheken door Cliënten Bekeken" Vorige en huidige meting Apotheek Den Hoorn

Box 2: Vaststellen beginsituatie Handelingsgericht werken op PABO s en lerarenopleidingen VO

Kansrekening en Statistiek

Inhoud. Introductie tot de cursus

ELEKTRICITEITSBRONNEN IN NEDERLAND. Attitude van de Nederlander in kaart gebracht. Onderzoek in opdracht van de Nederlandse Wind Energie Associatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

MINISTERIE VAN ONDERWIJS, CULTUUR EN WETENSCHAP

1BA PSYCH Statistiek 1 Oefeningenreeks 3 1

IS DE BEMESTINGSTOESTAND EEN MAAT VOOR HET PEIL VAN DE LANDBOUW IN EEN GEMEENTE?

. Dan geldt P(B) = a d. 3 8

Eindexamen wiskunde A1-2 vwo 2004-II

Netwerkdiagram voor een project. AON: Activities On Nodes - activiteiten op knooppunten

Transcriptie:

Technische Hogeschool Afdeling der Weg- en Waterbouwkunde Gebruik van moderne statistische methoden ZESTIENDE VAKANTIECURSUS 16 en 17 januari 1964 MOORMANS PERIODIEKE PERS N.V. - DEN HAAG

Reeds zijn in onderstaande volgorde in boekvorm verschenen de voordrachten van de volgende cursussen: l. Filtratie, 2. Vervaardiging van buizen voor transport- en distributieleidingen. 3. Winning van mondwater. 4. waterzuivering: 5. Hygiënische aspectei van de m-wate&ooniening; 6. Het transmrt en de distributie van leidinmater, 7. Keuze. aantasting en bescherm& van materialen voor koud- en wa&nwaterleiciin~en. 8. g en 10. Enige ketenschappelijke grondslagen der waterleidingtec&ek I, II en Iii. 11. Radioactiviteit, 12. Het mondwater, 13. De Riin. -. 14. Nieuwe - ontwikk;lingen in de waterleidingtechniek op f&sch, chemisch en biole gisch gebied, 15. De watervoorziening en de industrie.

Technische Hogeschool Afdeling der Weg- en Waterbouwkunde Zestiende Vakantiecursus in drinkwatervoorziening gehouden op 16 en 17 januari 1964 te Delft Gebruik van moderne statistische methoden MOORMANS PERIODIEKE PERS N.V. - DEN HAAG

WOORD VOORAF Gaarne geef ik gevolg aan het verzoek van de Voorzitter van de Commissie inzake Vakantiecursussen in Drinkwatervoorziening hier een enkel woord te zeggen. Het was voor de Afdeling der Weg- en Waterbouwkunde van de Technische Hogeschool Delft steeds een genoegen gastvrijheid te verlenen aan de Vakantiecursussen in Drinkwatervoorziening, omdat het streven van genoemde Commissie de volle instemming heeft van de Afdeling en omdat elke nascholingscursus kan leiden tot een beperkte verkorting van de studieduur aan de T.H. Bij het streven naar verkorting van de studieduur staat de Technische Hogeschool Delft, evenals alle instellingen voor wetenschappelijk onderwijs, voor de moeilijke taak: 1. een ald doend hoog wetenschappelijk peil voor het onderwijs te handhaven; 2. de snelle vorderingen van wetenschap en techniek zo goed mogelijk te volgen; 3. een voor de diverse onderdelen bv. voor de opleiding tot civielingenieur, voldoend brede basis te handhaven; 4. een behoorlijke studievrijheid te eerbiedigen; 5. een studieduurverkorting te bereiken. Reeds mijn voorganger, prof. ir. A. A. van Douwen, heeft in vorige cursussen verteld van de plannen van de Afdeling m.b.t. een onderwijsherziening, waarbij voortdurend aan genoemde punten aandacht werd geschonken. Maar het zal niet lukken, een schaap met vijf poten ter wereld

te brengen. De minister van Onderwijs, Kunsten en Wetenschappen heeft gewaarschuwd, dat hij zelf de nodige maatregelen zal treffen om studieduurverkorting te bereiken als de instellingen van wetenschappelijk onderwijs daarvoor geen middelen weten te vinden. De Rector Magnificus van de Technische Hogeschool Delft heeft tijdens het bezoek van de minister aan deze Technische Hogeschool op de dag van deze Vakantiecursus erop gewezen, dat het bereiken van een studieduurverkorting niet alleen afhangt van de maatregelen, te treffen door de Technische Hogeschool, of door het ministerie van Onderwijs, Kunsten en Wetenschappen, maar altijd ook van de studenten zelf. Nu is er natuurlijk wel een methode om een - zij het ook beperkte - studieduurverkorting te verkrijgen, bv. door veel aandacht *te schenken aan de (basis- en hulpwetenschappen (wiskunde, natuurkunde, de mechanica's, inclusief de hydraulica, de constructievakken, enz.), en bij de zuiver technische vakken niet teveel tot beschrijving over te gaan maar te volstaan met het wijzen op de beginselen die bij het coiistrueren moeten gelden en op de achtergronden van de constructies. Aldus behandelt men de hoofdlijnen en laat veel details onbehandeld, overwegende, da+ de pas afgestudeerde ingenieur in zijn praktijk de details, waarmee hij te maken krijgt, zelf zal moeten leren. Hierin schuilt het gevaar, dat hij de werkwijzen en details leert kennen zoals ze tot nu toe geweest zijn en gebruikelijk waren, maar niet die, welke volgens de nieuwste inzichten de meest wenselijke zijn. Om nu na beëindiging van de studie tijdens de werkzaamheid in de praktijd op de hoogte te komen en te blijven van de inmiddels verbeterde zienswijzen is bezoek aan post-academiale cursussen zo nuttig. Aan de Commissie inzake Vakantiecursussen in Drinkwatervoorziening komt de eer toe, naar ik meen, de eerste te zijn geweest, die een onderwerp, dat aan de Technische Hogeschool wordt behandeld, heeft gekozen als onderwerp voor de door haar in het leven geroepen telkenjare terugkerende vakantiecursus, op-

dat mensen uit de praktijk op de hoogte kunnen blijven van de laatste stand van wetenschap en techniek. Ditmaal is het de laatste keer, dat de huidige Voorzitter, prof. W. F. J. M. Krul, als hoogleraar een inleiding voor deze cursus zal houden. Hij was het die zestien jaar geleden de stoot tot het organiseren van deze vakantiecursussen heeft gegeven en die al die jaren een stuwende kracht van de Commissie is geweest. Ik hoop voor prof. Krul en voor de Commissie dat prof. Krul niet zonder meer van het toneel zal verdwijnen als hij volgend jaar geen hoogleraar in deze Afdeling meer zal zijn, maar dat de Commissie ook voor volgende jaren van zijn kennis en ervarhg zal kunnen profiteren. Ik zou willen besluiten met een wens en een woord van dank. Ik wens de Commissie met deze 16e cursus een even groot succes toe als zij met alle voorgaande heeft gehad en ik dank prof. Krul namens de Afdeling van harte voor wat hij deze zestien jaar als hoogleraar voor deze Commissie en voor deze cursussen heeft gedaan. Delft, januari 1964 De Voorzitter van de Afdeling der Weg- en Waterbouwkunde, prof. ir. F. M. C. Berkhout

Algemene inleiding door prof. W. F. J. M. Krul Bij de aanvang van deze 16e Vakantiecursus past het, onze op 13 juni 1963 overleden vriend ir. Andrew F. Meyer te herdenken, die op zo voortreffelijke wijze als lid van de Commissie van Voorbereiding de eerste 15 cursussen hielp tot stand brengen. Hij vervulde een zéér bijzondere plaats in de Nederlandse waterleidingkring, als bekwaam en vooruitstrevend bedrijfsdirecteur, als leider van commissies en vergaderingen, als toegewijd medewerker ook aan menige studie. Maar vooral leeft hij voort in de gedachten van zijn vele vrienden door zijn begaafdheid met uitzonderlijke karakterdeugden. Nooit kwamen die treffender uit dan tijdens zijn langdurige ziekte, die hij met volle bewustzijn en in volledige berusting aanvaardde. * Reeds gedurende vele decennia plegen onze waterleidingbedrijven jaarlijks gegevens van technische en fiancïele aard omtrent produktie, distributie en consumptie beschikbaar te stellen aan een centrale instantie die voor geordende publikatie zorgt. Aanvankelijk was die instantie de Vereniging voor Waterleidingsbelangen, thans is het de Vereniging van Exploitanten van Waterleidingbedrijven in Nederland. Die statistische overzichten zijn uitermate belangrijk en in weinig andere landen zó volledig, voor zover ze daar al bestaan. De leiding van een bedrijf kan er vergelijkingsmateriaal, trots of jaloezie aan ontlenen, de overheid grondslagen voor doelmatig en rechtvaardig beleid, de bedrijfsadviseur voorlopig inzicht, de buitenlander bewondering, de hoogleraar stof voor collegebeschouwingen. Toch is deze statistische activiteit niet de statistiek, die de Commissie van Voorbereiding zich als onderwerp voor deze 16e Vakantiecursus voor ogen stelde: de overzichten van de VEWIN geven immers cijfermateriaal, waarop wellicht statistische methoden kunnen worden toegepast, de cursus echter zal de statistische methodiek met haar beginselen en doelstellingen behandelen.

Men dient zich ervan bewust te zijn of te maken, dat in de moderne industriële samenleving het individu steeds meer afhankelijk is van wat de collectiviteit voor hem verricht. In het agrarische milieu bedient de mens zich van eenvoudige, deels door hemzelf vervaardigde, werktuigen, die hij kent, begrijpt en kan herstellen; hij beheerst zijn omgeving, voorzover die niet door hogere natuurmacht wordt bepaald. In het industriële milieu is de enkeling nagenoeg geheel afhankelijk van een onnoemelijk aantal specialisten die in een ingewikkeld samenstel zijn voortbeweging, zijn voeding, zijn gezondheid verzorgen. Steeds groter wordt daardoor de invloed en de verantwoordelijkheid van collectieve ondernemingen en de overheid; het besturen van die collectiviteiten is een nieuwe specialiteit geworden die om wetenschappelijke beoefening vraagt. Zeer merkwaardig is daarbij, dat de mens in het huidige stadium van zijn evolutie, nu hij - naar Teilhard de Chardin ons leert - van de biosfeer in de noösfeer, de sfeer van de geest, is getreden, de hoogst merkwaardige automatische interne regeling van zijn eigen lichaam heeft ontdekt. Door een wonderbaarlijk mechanisme van inwendige chemische processen, beheerst door interne secretie van velerlei aard, adapteert de mens zich of hij tracht zich te adapteren aan veranderingen in zijn milieu. Dat mechanisme wordt bestuurd door elektrische prikkels, door een informatiesysteem en een keuzesysteem. Men is nu tot het inzicht gekomen dat in wezen dezelfde wetten de basis vormen voor de elektronische regeltechniek en dat aldus de studie van de biologische verschijnselen de ontwikkeling van de regeltechniek kan bevorderen. In 1960 heeft men aan deze nieuwe wetenschap de naam,,bionicay' gegeven. De grondslagen voor de technische stuurmechanismen en de automatische rekenmachines of computers zijn vervat in de cybernetica, zoals de thermodynamica de grondslag vormt van de warmtemachines. Ik vermeld deze bijzonderheden omdat zij aanvankelijk meer of minder vaag rondwaarden in het ondeskundig brein van de leden van de Voorbereidingscornmissie van deze Vakantiecursus. Voorgelicht door prof. ir. L. J. Mostertman, die aan onze Delftse internationale cursussen de,,engineering operation" doceert, kregen wij de deskundige medewerking van de docenten van deze cursus. Daarbij werd het ons aldra duidelijk dat noch de cybernetica, noch de werking van computers een onderwerp van

bespreking moesten zijn, maar wel de mathematisch-statistische methoden die aan informatie en beslissing ten grondslag liggen. Het gaat hierbij niet om de,,definiete9' wiskunde, die stellingen uit bepaalde axioma's afleidt, maar om de waarschijnlijkheidsrekening, waarmee op grond van bepaalde gegevens bepaalde consequenties met een zekere mate van nauwkeurigheid kunnen worden voorspeld, om een benadering volgens zg.,,stochastische methoden". In mijn Grieks woordenboek vind ik voor,,stochazoma?' de vertaling:,,op iets mikken, maar iets gissen". Het woord,,stochasis" wordt vertaald met,,gissingw. De heer De Jonge zal als eerste inleider ons een algemene begripsomschrijving van moderne statistische methoden geven en voorbeelden van toepassing in zijn rijke ervaring als statisticus bij het Nederlands Instituut voor Praeventieve Geneeskunde. Dit is onontbeerlijk voor het hoofddoel van deze cursus, dat kan worden omschreven als: het aantonen van het nut van deze methoden in de moderne techniek en bedrijfsvoering. Tot nu toe is in het waterleidingbedrijf de toepassing vrijwel beperkt gebleven tot het bacteriologisch wateronderzoek, waarin ir. Leeflang ons een inzicht zal geven. Steeds méér echter, vooral tijdens en na de Tweede Wereldoorlog, is het belang van de stochastische methoden voor het nemen van beslissingen en het ontwerpen van technische constructies op velerlei gebied aan het licht getreden. Daaraan zullen de lessen van prof. Cohen en prof. Monhemius zijn gewijd. Zij zullen ongetwijfeld laten uitkomen, dat het de moeite loont, de toepassing ook in de waterleidingtechniek en de bedrijfsvoering van de waterleidingbedrijven te overwegen en te bevorderen. Men mag van deze cursus geenszins pasklare voorschriften verwachten, maar wel een prikkel voor de waterleidingdeskundigen om te gaan denken. Het zal niet mogelijk zijn, tenzij misschien bij de grootste bedrijven, om eigen statistische deskundigheid in de staforganisatie in te bouwen. Wel acht de Commissie van Voorbereiding het mogelijk, dat in samenwerking tussen verschiiiende bedrijven, wellicht door inschakeling van het KIWA, voorlichting wordt gezocht bij deskundigen op het gebied van statistische methoden als hulpmiddel bij,,operationeel onderzoek" (een goede vertaling van,,operational research"). Dat zou een fraai resultaat van deze ongetwijfeld niet gemakkelijke studiedagen zijn.

Aan het einde van deze inleiding wil ik aan onze deskundigen en overige aanwezigen het volgende vraagstuk voorleggen. Twee hoogleraren zijn betrokken bij de voorbereiding van een cursus in statistische methoden op geheel verschillende gebieden van de techniek, waarbij zij geen enkele voeling met elkaar houden. Hoe groot is de kans, dat hun cursus op dezelfde dag zal aanvangen? Dit probleem is actueel, want op deze zelfde dag opent mijn collega prof. ir. J. Volmuller aan deze zelfde Hogeschool een cursus in,,statistiek en waarschijnlijkheidsleer met betrekking tot de verkeerskunde", waarin ook prof. Cohen als docent optreedt. Ik kan er als leek slechts deze verklaring voor vinden:,,it is in the air". Ten slotte een waarschuwing inzake het gebruik van de statistiek, die ik in een Franse publikatie vond:,,la statistique est le bikini des grandes entreprises: elle cache ce qui est intéressant".

Statistiek en proefopzet door H. de Jonge 1. Statistiek Bij het woord statistiek plegen velen in de eerste plaats te denken aan methoden, die kunnen worden gebruikt als men beschikt over een uitgebreid waamemingsmateriaal, dat moet worden omgezet in tabellen en grafieken, of dat tot een reeks kengetallen (zoals gemiddelden of correlatiecoëfficiënten) moet worden gereduceerd. Anderen denken wellicht aan min of meer ingewikkelde rekenmethoden, die tenslotte tot een conclusie leiden waarin het woord,,significanty' voorkomt. Deze opvattingen omtrent de statistiek zijn echter verouderd en zodoende misleidend. Het is mijn taak u een indruk te geven van de rol, die de moderne statistische methoden - zoals deze in de afgelopen 50 jaar zijn ontwikkeld - kunnen spelen bij de opzet van onderzoekingen en bij de analyse van hun uitkomsten. Het is, zoals wij later zullen zien, niet toevallig dat ik in de voorgaande zin eerst spreek over de rol van de statistiek bij de opzet van een onderzoek en pas daarna haar gebruik bij de analyse van de onderzoekuitkomsten noem. In de laatste decennia is namelijk een samenspel van experiment en analyse tot stand gekomen, waarbij, zoals Hamaker (4) opmerkt:,,... uit de gedachtenwereld van de statistiek tal van nieuwe ideeën zijn voortgesproten over de wijze waarop experimenten het best h e n worden genomeny'. voordat wij echter over de proefopzetten op statistische basis kunnen gaan spreken, dien ik enige aandacht te wijden aan enkele essentiële elementen van de,,taal" van de statistiek. Ik wil daarbij uitgaan van een eenvoudige definitie, nl.: statistiek is een hulpwetenschap, die kan worden gebruikt bij het bestuderen van de variatie die optreedt in kenmerken van de elementen van een populatie. Een (statistische) populatie is de nauwkeurig omschreven verzameling van elementen, waarop een onderzoek betrekking heeft. De elementen van zo'n populatie kunnen materiële objecten, zoals mensen, dieren of voorwerpen, zijn. Zij kunnen echter ook be-

staan uit gebeurtenissen (zoals ongevallen), getallen, of uit denkbeeldige elementen (zoals waarnemingsuitkomsten die zouden kunnen worden, maar niet zijn verkregen). Laat ik enkele voorbeelden van dergelijke populaties geven. 1. De arbeiders die op 1 januari 1964 in een bepaald bedrijf werkzaam zijn. 2. De geregistreerde verkeersongevallen op de openbare weg in Nederland in 1962. 3. Alle metingen die waarnemer A aan een bepaald voorwerp op voorgeschreven wijze zou kunnen verrichten. 4. De gehele getallen van 1 t/m 100. Wanneer men t.b.v. een onderzoek een populatie heeft gedefinieerd, gaat men over tot het verrichten van waarnemingen aan de elementen van deze populatie. Deze waarnemingen betreffen min of meer gedifferentieerde reeksen van kenmerken, die kwalitatief of kwantitatief kunnen zijn. Een kwalitatief kenmerk wordt met een omschrijving (soms met een niet-numeriek symbool) aangeduid. Het eenvoudigste systeem van kwalitatieve kenmerken is de dichotomie (tweedeling), bestaande uit twee kenmerken (positief/negatief, geslaagdlgezakt). Hierop volgt een systeem van k (3 of meer) kenmerken; bij zo'n categorisch systeem kan men onderscheid maken tussen: a. een systeem waarbij de kenmerken een intrinsieke volgorde bezitten (zoals de reeks: goed/voldoende/matig/onvoldoende/slecht), en b. een systeem waarbij dit niet het geval is (zoals: de reeks bestaande uit alle in Nederland voorkomende godsdiensten; de verschillende soorten defecten die een produkt kan vertonen, plus het kenmerk,,niet defect").' Een kwantitatief kenmerk wordt verkregen door tellen, meten of wegen en het bestaat uit een getal (waarde, score). Bij kwantitatieve kenmerken krijgt men te doen met categorische systemen van waarden van grootheden (zoals lichaamslengte, verzuimduur, hoeveelheid neerslag). Bestudeert men de elementen van een populatie t.a.v. een bepaald categorisch systeem, dan blijkt variatie op te treden: niet alle elementen bezitten hetzelfde kenmerk of dezelfde waarde. Men kan vaststellen hoe frequent elk kenmerk, resp. elke waarde, voorkomt en de reeks van bij een categorisch systeem behorende frequenties, de frequentieverdeìing, geeft een beeld van het variatiepatroon. Tabel 1 geeft een voorbeeld, waarbij de frequen- -- l Deze kwalitatieve kenmerken komen vooral op psychologisch, sociologisch en medisch gebied veel voor.

TABEL I Geregistreerde verkeersongevallen op de openbare weg in Nederland Ernst van het ongeval Frequentieverdelingen naar ernst 1938 1947 1951 1956 1961 Dodelijke afloop 1 740 941 1088 1534 1873 Ten hoogste ernstig letsel 6593 11480 19 198 27 166 Ten hoogste licht 11 913 letsel 5 074 8 382 12 600 15970 Uitsluitend materiële schade 32001 26792 53 753 95 482 145 237 Totaal 46664 39 400 74703 128 814 190246 ~elatieve frequentieverdelingen ( i %) Dodelijke afloop 1,6 2,4 1s 12 1,o T.h. ernstig letsel 16,7 15,4 14,9 14,3 29.8 T.h. licht letsel 12,9 11,2 93 8,4 Uitsl. mat. schade 68,6 68,O 71,9 74,l 76,3 tieverdelingen naar ernst zijn gegeven van de geregistreerde verkeersongevallen op de openbare weg in Nederland in de jaren 1938, 1947, 1951, 1956 en 1961. Voor het vergelijken van de verdelingen onderling zijn ook de relatieve frequentieverdelingen berekend, die voor elk jaar laten zien welk procentueel aandeel elke categorie in het totaal aantal ongevallen bezit. Een onderzoek wordt vaak verricht om: 1. het variatiepatroon (in de vorm van frequentieverdelingen) van één of meer categorische systemen van een populatie te leren kennen; voorbeeld:' een onderzoek naar aantal en aard van defecten bij de vervaardiging van een bepaald produkt; 2. na te gaan of de variatie van twee of meer categorische systemen binnen één populatie een samenhang vertoont enlof om deze samenhang te bestuderen; voorbeeld: een onderzoek naar de relatie tussen de afvoer van de Rijn te Lobith en het chloorgehalte te Rhenen (zie tabel 2); 3. de frequentieverdelingen van een categorisch systeem van twee of meer populaties te vergelijken; voorbeelden: onderzoek, waarbij per machine een frequentieverdeling wordt opgesteld; onderzoek naar de verdeling van chloorgehalten in een rivier in de zomer- en winterperioden (zie tabel 3); 4. de fluctuatie, d.i. de variatie in de tijd, van één of meer categorische systemen, al dan niet in hun onderlinge samenhang, te bestuderen.

TABEL 2 Correlatie tussen de afvoer van de Rj'n te Lobith (m3/sec) en het chloorgehalte te Rhenen (mgtl) in de wintermaanden van 1926-1930 (1 nov.- 1 mei). Perioden met zware ijsgang of ijsbedekking zijn buiten besehouwing gelaten. Gegevens uit,,rapport 1940, de watervoorziening van Amsterdam" Log (chloorgehalte) Log 130-140- 150-160- 170-180- 190-200- 210- Totaal (afvoer) 139 149 159 169 179 189 199 209 219 4,OO-4,09 1 1 3,90-3,99 3 1 4 3,80-3,89 2 11 13 3,70-3,79 1 1 1 32 44 3,60-3,69 1 24 14 1 40 3,50-3,59 8 57 16 1 82 3,40-3,49 3481 7 1 123 3,30-3,39 53 54 7 1 115 3,20-3,29 2 97 46 3 148 3,lO-3,19 9 50 25 84 3,OO-3,09 4 34 9 47 Totaal 7 24 64 105 153 168 108 63 9 701 TABEL 3 Verdelingen van de (logaritmen van de) chloorgehalten te Rhenen, 1926-1930, in de zomermaanden (1 mei-l nov.) en de wintermaanden (1 nov.- 1 mei). Gegevens uit,,rapport 1940 enz." Absolute frequenties Relatieve frequenties Log (chloor- Zomer Winter 100.fzlnz 100.f wlnw gehalte) fz f rv Totaal 759 701 100,l 100,O nz n n7 Bij deze en dergelijke (en vanzelfsprekend meestal meer gecompliceerde onderzoekingen) kan men in de eerste plaats gebruik maken van de beschrijvende statistiek. Ik moet afkien van een behandeling van deze tak van de statistiek en volsta met de vermelding, dat hij methoden verschaft voor: a. de ordening van waarnemingen, bv. door het opstellen van frequentie en conelatietabellen, b. het tekenen van grafieken, bv. voor het verge-

lijken van frequentieverdelingen, c. het karakteriseren van frequentieverdelingen d.m.v. kengetallen zoals gemiddelden, spreidingsmaten, correlatiematen. Indien men steeds alle tot de onderzoekpopulatie behorende elementen in het onderzoek zou kunnen betrekken, zou men met de beschrijvende statistiek kunnen volstaan. Gewoonlijk is dit echter niet mogelijk. Vele populaties bezitten een zo grote omvang en/of geogra ische spreiding, dat een volledig onderzoek te tijdrovend of te kostbaar is. Op industrieel gebied is vaak de moeilijkheid, dat de elementen door het onderzoek zelf worden beschadigd of verloren gaan (een fabrikant van lucifers kan niet van elk geproduceerd exemplaar onderzoeken of het bevredigend ontvlamt en brandt). Op medisch terrein dient men bij vele onderzoekingen, bv. bij die naar de werking van geneesmiddelen, de omvang van het onderzoek om ethische redenen zoveel mogelijk te beperken. Verder zijn er vele situaties, waarin men op grond van een betrekkelijk klein, nu ter beschikking staand aantal elementen, conclusies moet trekken omtrent een populatie die (wellicht) slechts in de toekomst zal gaan bestaan; zo zal men bv. in de industrie, op grond van proeven met een aantal prototypen, willen uitmaken of een nieuw produkt ook inderdaad in fabricage zal worden genomen. Tenslotte noem ik de mogelijkheid dat het economisch niet verantwoord is de onderzoekpopulatie volledig te bestuderen, omdat een betrekkelijk klein deelonderzoek voldoend betrouwbare informatie kan verschaffen (zoals bij marktonderzoek). In de praktijk zal men dus meestal (moeten) volstaan met het onderzoeken van een deel van de populatie, een steekproef (of monster). Hierbij doet zich onmiddellijk een aantal vragen voor, nl. hoe groot moet de steekproef zijn, hoe moet deze worden samengesteld en welke uitspraken omtrent de populatie laat zij toe? Het is duidelijk dat deze vragen een samenhang bezitten: een,,verkeerdy7 samengestelde steekproef zal onherroepelijk tot verkeerde conclusies omtrent de populatie leiden; een op juiste wijze samengestelde steekproef zal meer informatie (omtrent de populatie) bevatten, naarmate zij groter is. Ik laat de (belangrijke) vraag omtrent de steekproefomvang buiten beschouwing en neem aan, dat zij,,zo groot mogelijk" wordt gekozea2 Veronderstel nu dat een populatie volledig bekend is en uit N Onder bepaalde voorwaarden kan de voor een verantwoord onderzoek noodzakelijke steekproefomvang echter van te voren worden aangegeven, of er kan een zg. sequent onderzoek worden uitgevoerd.

TABEL 4 Aantal mogelijke verschilleude steekproeven, C t = (t ), bij trekking zonder teruglegging Steekproefomvang I1 Aantal steekproeven TABEL 5 Alle mogelijke, verschillende steekproeven van n-3 elementen uit een populatie van N = 6 elementen met de waarden 1,2,... 6 elementen bestaat, waarvan er n in de steekproef worden opgenomen. Er kunnen echter vele verschillende steekproeven van n elementen worden gevormd. Tabel 4 geeft een overzicht waaruit blijkt dat zelfs bij een kleine omvang van de populatie het aantal mogelijke verschillende steekproeven (d.i. het aantal steekproeven dat tenminste één verschillend element bevat) reeds (zeer) groot is. Tabel 5 geeft een overzicht van alle mogelijk verschillende steekproeven van n = 3 elementen die kunnen worden getrokken uit een populatie van N = 6 elementen, die de waarden 1, 2, 3, 4, 5 en 6 dragen. De tweede tak van de statistiek, de mathematische statistiek (statistica) verschaft technieken voor het doen van uitspraken omtrent de populatie op basis van een steekproef. De mathematische statistiek kan echter slechts worden gebruikt als de steekproef aselect wordt samengesteld (getrokken) d.w.z. als de trek-

king zó plaatsvindt dat elke mogelijke steekproef dezelfde kans heeft om als de te bestuderen steekproef te worden aangewezen. Indien de tot de populatie behorende elementen van 1 t/m N kunnen worden genummerd, kan men deze aselecte trekking uitvoeren d.m.v. een lotingsprocedure. Men laat door het toeval n nummers tussen O en N + 1 aanwijzen en neemt de elementen van de populatie, die deze nummers dragen in de steekproef op. Men kan hierbij gebruik maken van tabellen met aselecte getallen (zie De Jonge (7), O 1.3.1.). Bij het uitvoeren van experimenten gaat men vaak uit van een steekproef van n elementen uit de onderzoekpopulatie, die in twee of meer groepen wordt gesplitst, die verschillende,,behandelingen" ondergaan. Deze groepen dienen eveneens aselect te worden samengesteld (men noemt dit aselecteren) en men kan hierbij het beste gebruik maken van tabellen met aselecte permutaties (zie De Jonge (7) 8 1.3.2.). De zojuist genoemde procedures gaan uit van een zg. volledige aselecte trekking, resp. aselectering. Indien echter omtrent de samenstelling van de populatie (resp. steekproef) relevante informatie ter beschikking staat kan men tot laagsgewijze trekking (resp. aselectering) overgaan. Als de populatie bestaat uit een groot aantal betrekkelijk kleine deelpopulaties (,,clusters"), staat de methode van de groepssteekproeven (,,cluster sampling") ter beschikking (zie voor deze en andere speciale steekproeftechnieken: De Jonge (7), O 1.3.3. en 1.3.4.). Vaak kan men bij het steekproeftrekken geen loterijprocedure toepassen, bv. omdat het inventariseren en/of nummeren van de elementen van de populatie vrijwel onmogelijk is. In deze gevallen moet men zoeken naar een trekkingsmethode, waarvan redelijkerwijze mag worden aangenomen dat zij een aselecte steekproef zal opleveren. Dit is niet altijd eenvoudig, maar bijzonder belangrijk. Is de steekproef immers niet als aselect te beschouwen (,,biassed", onzuiver), dan is de betrouwbaarheid van de conclusies, die zij omtrent de populatie oplevert, onbekend. Men dient zich te realiseren dat de mens een bijzonder slecht instrument is voor het maken van een aselecte keuze. Yule en Kendall (9) merken hierover op:,,wherever there is any scope for personal choice or judgement on the part of the observer, bias is almost certain to creep in. Nor is this a quality which can be removed by conscious effort or training. Nearly every human being has, as part of his psychological make-up, a tendency away from true randomness in his choices". Om deze reden is dan ook het zg. doelbewust steekproeftrekken niet aan te bevelen. Deze

methode van uitzoeken van wat typerend voor de populatie wordt geacht is immers juist in sterke mate gevoelig voor (vaak onbewuste) vooroordelen van de onderzoeker. Een algemeen verbreide misvatting is, dat een,,lukrakev keuze van de elementen wel tot een aselecte steekproef zal leiden. Gewoonlijk is dit juist niet het geval, omdat allerlei niet vermoede of qua invloed moeilijk waardeerbare factoren selectief blijken te werken. Trekt men bv. uit een kooi met 25 ratten lukraak een steekproef van 5 ratten, dan verkrijgt men - zoals vele proeven hebben aangetoond - overwegend de tragere en daardoor zwaardere dieren. Selectie kan ook optreden als men de steekproef wel aselect heeft samengesteld, maar als tijdens het onderzoek uitvallers optreden. Dit kan zich o.m. voordoen bij schriftelijke enquêtes, indien een belangrijk deel van de personen die een enquêteformulier hebben ontvangen geen antwoord inzendt. De autoselectie die hierbij optreedt kan tot een bijzonder onzuivere steekproef leiden. De conclusies die een steekproef oplevert hebben uitsluitend betrekking op de populatie, waaruit de steekproef afkomstig is. Een conclusie, gebaseerd op een onderzoek van een steekproef, bestaande uit studenten, behoeft dus niet te gelden voor andere jonge mensen van dezelfde leeftijd. Vele onderzoeken zijn bedoeld om tot min of meer algemeen geldende uitspraken te komen, om algemeen geldende,,wetmatighedenw op te sporen en vast te leggen. Voert men bv. op dit moment een onderzoek uit naar de werking van twee verschillende soorten filterbedden, A en B, en vindt men dat A,,beterw is dan B, dan zal men deze uitspraak niet alleen op het heden willen betrekken, maar tevens op de toekomst. Deze extrapolatie in de tijd is echter niet altijd geoorloofd, omdat de mens en zijn omgeving in vele opzichten evolueren. Na langere tijd zal men dus de vraag of de uitspraak nog geldt gewoonlijk slechts door het uitvoeren van een nieuw onderzoek kunnen beantwoorden. Mede om deze reden is op vele gebieden het herhalen van reeds door anderen verrichte onderzoekingen verre van zinloos. Het is mij niet mogelijk de gedachtengang van de mathematische statistiek hier volledig te behandelen. Er zijn echter in deze gedachtengang twee fasen te onderscheiden. 1. Uitgaande van een populatie, waarvan de verdeling, resp. het type van de verdeling, bekend is, stelt men vast welke variatie optreedt in aselecte steekproeven van rz elementen. Zo'n variatiepatroon kan, gewoonlijk d.m.v. de kansrekening, in de vorm van een kansverdeling worden vastgelegd. Enkele voorbeelden. Beschouw eerst een populatie van N elementen, waarvan er Ni het kenmerk A en Np het kenmerk B dragen (N = Ni + Nz). Men definieert dan als de kans op (van) kenmerk A, bij aselecte trekking van één element uit deze populatie, de relatieve frequentie van dit

kenmerk: P(A) = P = NIIN; de kans op kenmerk B is dus: P(B) = Q = N2IN = l-p. Trekt men uit deze populatie aselect een steekproef van n elementen, dan is de kans dat deze x elementen met kenmerk A (dus 11-x elementen met kenmerk B) bevat, indien N 2 5011 is, bij benadering gelijk aan (Hierin is, zoals bekend mag worden verondersteld, n! = 11 faculteit, d.w.z. /I! =ri (11-1) (11-2).. 3 x2x 1). De kansverdeling die door de voorgaande formule wordt gerepresenteerd is de birioi~iiole verdeling. Als tweede voorbeeld nemen wij een populatie van N elementen, die alle een waarde van een grootheid x dragen; de populatieverdeling van deze grootheid is bij benadering normaal (d.i. een verdeling van Gauss-Laplace met gemiddelde en standaardafwijkingen o, (deze en dergelijke kengetallen, betrokken op populaties, worden porclmeters genoemd). De kansverdeling van het gemiddelde X van een aselecte steekvroef van 11 elementen uit deze bezit als eigenschappen dat zij: a. eveneens bij benadering normaal is, b. als gemiddelde,[c en als standaardafwijking 0111 heeft. 2. Met behulp van deze kansverdeling kan men, op basis van een aselecte steekproef uit een populatie met het bestudeerde verdelingstype, tot uitspraken komen omtrent de populatie. Naar de aard van deze uitspraken kan men onderscheid maken tussen: a. methoden voor het toetserz van hypothesen omtrent populatieverdelingen; b. methoden voor het geven van schattingen omtrent populatieverdelingen of hun parameters. Op grond van een steekproef kan men niet tot uitspraken omtrent populatieverdelingen of parameters komen, die zonder enige reserve juist zijn. Steeds is er een zeker risico, een zekere kans dat een uitspraak onjuist is. Het voordeel van een op statistiek gefundeerde t.o.v. een intuïtief getrokken conciusie is echter, dat men de kans op de onjuistheid van de conclusie kan kwantificeren, of anders gezegd: dat men de onbetrouwbaarheid van de uitspraak kan aangeven. Ook hier moet ik met het geven van een enkel voorbeeld volstaan. Veronderstel dat een waterleidingbedrijf een groot aantal exemplaren van een bepaald produkt gaat installeren. Het sluit een contract met een bepaalde leverancier voor 100.000 exemplaren, die successievelijk zullen worden afgeleverd. De eerste partij van 100 exemplaren wordt nauwgezet gekeurd en blijkt 3 exemplaren (3%) te bevatten, die niet aan de gestelde eisen voldoen (,,defectenv). Wat kan men concluderen over het percentage defecten in de gehele bestelling, aangenomen dat de afgeleverde partij een aselecte steekproef uit deze,,populatien vormt?

Langs statistische weg kan men komen tot de uitspraak, dat dit percentage defecten tussen 0,6% en 8,5% ligt; de onbetrouwbaarheid van deze uitspraak (de kans dat zij fout is) is hierbij op 5% gesteld. Deze schatting van het populatiepercentage (de parameter) bezit twee bijzonderheden. In de eerste plaats worden twee grenzen opgegeven, waartussen de parameter wordt geschat (het zg. schattingsinterval). De grootte van dit interval bepaalt de nauwkeurigheid van de schatting: hoe kleiner het is, des te nauwkeuriger de schatting is. Verder bevat de uitspraak een element van onzekerheid: de onbetrouwbaarheid van de uitspraak, de kans dat zij fout is, wordt aangegeven. Bij een gegeven steekproef kan deze onbetrouwbaarheid slechts worden verkleind ten koste van de nauwkeurigheid van de schatting kiest men bv. een onbetrouwbaarheid van 1 %, dan worden de grenzen van het schattingsinterval 0,34% en 10,6%. In de praktijk hangt de keuze van de onbetrouwbaarheid, die men acceptabel acht, gewoonlijk af van de ernst van de consequenties, die aan de onjuiste uitspraak zijn verbonden. Door het trekken van een grotere steekproef kan men een schatting verkrijgen, die bij dezeede onbetrouwbaarheid nauwkeuriger is dan de schatting die een kleine steekproef oplevert. Vindt men bv. bij een steekproef van 500 exemplaren 15 (d.i. 3%) defecten, dan zijn de schattingsintervallen met onbetrouwbaarheid 5% en 1 % resp. 1,7-4,9% en 1,4-5,8%. 2. Vormen van onderzoek Voordat ik de rol van de statistiek bij de analyse van waarnemingsuitkomsten nader ga bezien, wil ik eerst even met u kijken naar de belangrijkste vormen van onderzoek. Deze zijn: A. onderzoek: 1. experimenteel, 2. observationeel; B. analyse van bestaande gegevens. In afb. 1 is de gang van zaken bij een onderzoek schematisch weergegeven. Uitgaande van een bepaalde vraagstelling, na definitie van de populatie(s) waarop men het onderzoek wil betrekken en na bestudering van de relevante literatuur (en zo nodig: na uitvoering van een vooronderzoek) maakt men de proefopzet, waarin de gehele gang van zaken bij het onderzoek nauwkeurig wordt aangegeven. Hierbij dient dus te worden vermeld hoe de steekproef, resp. steekproeven, zullen worden getrokken, welke waarnemingen zullen worden verricht (wanneer, langs welke weg, door wie), hoe zij zullen worden vastgelegd en bewerkt, welke onbetrouwbaarheid van de uitspraken men verantwoord acht, enz. Bij het experimentele onderzoek gaat men gewoonlijk

m Rapporteren Li--' b Conclusies G- \ Afb. 1 De gang van zaken bij een onderzoek llï b Steek roeven 4 uit van een steekproef uit de onderzoekpopulatie, waarvan : a. de elementen successievelijk aan verschillende behandelingen worden onderworpen, of b. die wordt gesplitst in groepen, die verschillende behandelingen ondergaan. Bij het observationele onderzoek beperkt men zich tot het verrichten van waarnemingen aan de elementen van steekproeven uit de onderwekpopulaties. Enkele belangrijke vormen van observationeel onderzoek zijn het (éénmalige) transversale en het longitudinale onderzoek, waarbij de in het onderzoek betrokken elementen op verschillende tijdstippen worden geobserveerd. Bij de analyse van bestaande gegevens gaat men uit van waar-. nemingsmateriaal dat reeds ter beschikking staat. Eensdeels is natuurlijk het feit, dat men de waarnemingen zelf niet meer behoeft te verrichten een voordeel, maar hieraan zijn ook belangrijke nadelen verbonden: a. men weet vaak niet precies, uit welke populatie(s) de elementen, waarop de waarnemingen betrekking hebben, afkomstig zijn, resp. of en, zo ja, welke selectie bij het verzamelen van deze elementen heeft plaatsgevonden; b. men weet niet hoe betrouwbaar de waarnemingen zijn (systematische fouten, nauwkeurigheid); c. gewoonlijk vertonen de waarnemingen leemten, die niet meer achteraf zijn te vullen. Dit betekent dat men bij de analyse van bestaande gegevens steeds met grote vakkennis en bijzonder kritisch te werk zal moeten gaan en de uitkomsten van de analyse met min of meer reserve zal moeten beschouwen. Gaarne wil ik dit toelichten.

TABEL 6 Plaats Totaal aantal onder- Kinderen met cariës* zochte kinderen Aantal % - - - - - - - - - A 400 112 28 B 450 126 28 * Uiteraard zal men in werkelijkheid dit gegeven meer gedifferentieerd bestuderen (aantal carieuze elementen per kind). TABEL 7 Leeftijd A B in jaren Onderzocht Cariës % Onderzocht Cariës % 6 90 11 12,2 140 21 15,O 7 80 16 20,O 110 27 24,s 8 110 29 26,4 100 30 30,O Y 120 56 46,7 100 48 48,O Totaal 400 112 28,O 450 126 28,O Voorbeeld l In twee plaatsen, A en B, zijn gegevens verzameld over de gebitten van kinderen van 6 t/m 9 jaar. In plaats A komt van nature fluoride in het drinkwater voor, in plaats B is dit niet het geval. Men komt na bewerking van de gegevens tot de in tabel 6 gegeven uitkomsten. De uitkomst is voldoende verrassend om de onderzoeker, die de bewerking van de gegevens heeft verricht, aan het denken te zetten. Hij realiseert zich, dat een relevante factor in dit verband wordt gevormd door de leeftijd van de kinderen (bij oudere kinderen komt meer cariës voor) en maakt derhalve tabel 7. Deze uitkomst beantwoordt beter aan de verwachting van de onderzoeker: voor elke leeftijdsgroep is immers het percentage kinderen met cariës in plaats B (iets) hoger dan in plaats A. Hij vraagt zich echter af, of er wellicht nog andere verschillen tussen de plaatsen dienen te worden uitgeschakeld en besluit, de kinderen ook onder te verdelen in twee welstandsgroepen, I en I1 (ik laat hier buiten beschouwing hoe dit gebeurt; het is wel duidelijk dat zo'n inleiding zorgvuldig en met kennis van zaken moet plaatsvinden). De onderzoeker verkrijgt daarna tabel 8. De onderzoeker zal zijn oordeel nogmaals moeten herzien: het blijkt nu dat bij welstand I de cariëspercentages in A en B per leeftijd precies gelijk zijn: bij welstand I1 zijn echter deze percentages in B voor elke leeftijd duidelijk hoger dan in A. Het is duidelijk, dat in de praktijk wellicht nog meer relevante factoren aanwezig kunnen zijn, die moeten worden uitgeschakeld (geslacht?). Afgezien van het feit, dat men nooit precies weet

TABEL 8 Leef - I I1 I 11 tijd Tot. Car. % Tot. Car. % Tot. Car. % Tot. Car. % 6 50 5 10 40 6 15 70 7 10 70 14 20 7 40 8 20 40 8 20 60 12 20 50 15 30 8 40 8 20 70 21 30 60 12 20 40 18 45 9 40 16 40 80 40 50 60 24 40 40 24 60 Totaal 170 37-230 75-250 55-200 71 - Vijver TABEL 9 Tijdstip 1 2 3 4 5 6 Som 40 40 40 40 40 40 Gem. 10 10 10 10 10 10 of men al deze factoren te pakken heeft, komt men op deze wijze, zelfs bij een groot uitgangsmateriaal, al spoedig tot zo kleine aantallen in de eindtabellen, dat men wel bijzonder voorzichtig moet worden met het vergelijken van de daaruit berekende percentages. Voorbeeld 2 Tabel 9 geeft het aantal diatoma in 5 betonnen vijvertjes op 6 opeenvolgende tijdstippen (aantal organismen per 1 water). Men concludeert uit deze uitkomsten dat het gemiddelde aantal diatoma in de tijd geen verandering heeft ondergaan. Deze conclusie houdt echter geen rekening met de ontbrekende uitkomsten (-) en behoeft niet juist te zijn, daar de volledige uitkomsten heel goed kunnen luiden als weergegeven in tabel 10. Dit voorbeeld lijkt triviaal, maar ik kan u verzekeren dat deze fout, bestaande uit het geen rekening houden met ontbrekende uitkomsten, in de praktijk herhaaldelijk wordt gemaakt. Het is mijn bedoeling dadelijk met u het experimentele onderzoek nader onder de loep te nemen. Ik wil daarom volstaan met het maken van enkele opmerkingen omtrent een vorm, waarin een observationeel onderzoek tegenwoordig vaak wordt uitgevoerd: de enquête, waarbij men gegevens verzamelt door schrif-

Vijver TABEL 10 Tijdstip 1 2 3 4 5 6 Som 40 56 75 68 56 41 Gem. 8,O 11,2 15,O 13,6 11,2 8,2 telijke of mondelinge ondervraging van de in het onderzoek betrokken elementen. Iedere vraag, die bij een enquête wordt gesteld, moet zo beknopt mogelijk en vooral duidelijk zijn. U moet niet te snel denken, dat een vraag die voor u en uw medewerkers volkomen duidelijk is, ook voor niet-ingewijden (of minder ontwikkelden) begrijpelijk zal zijn of slechts één interpretatie zal toelaten. Verder moeten de vragen zonder vooringenomendheid worden gesteld en zij mogen de ondervraagde niet een bepaald antwoord suggereren. Voorts verdient het aanbeveling de vragen zo te stellen, dat er slechts een beperkt aantal antwoorden mogelijk is (dat dan tevens wordt vermeld, zodat de ondervraagde slechts zijn antwoord heeft aan te geven). Stelt men immers de vragen zo, dat met een omstandig verhaal erop kan worden geantwoord dan ondervindt men veel moeite bij de rubricering van de antwoorden; deze zal gewoonlijk niet zonder willekeur kunnen plaatsvinden; voorts zullen sommige antwoorden zo vaag of zo uitgebreid zijn, dat men zelden verantwoord een enquête zal kunnen uitvoeren zonder een vooronderzoek, waarin vragen en antwoorden op hun bruikbaarheid worden getoetst. 3. Experimenteel onderzoek door middel van statistische proefopzetten Bij de klassieke methode van experimenten, die voortkomt uit de fysica, wordt steeds één factor tegelijk gevarieerd; alle ándere bij het experiment betrokken factoren worden constant gehouden. Door Fisher (1) is echter, in de eerste plaats t.b.v. landbouwkundige experimenten, een wijze van experimenteren aangegeven waarbij men in principe werkt met alle mogelijke combinaties van een aantal bewust gekozen niveaus van de onderzoekfactoren. Langs deze weg komt men tot meer gecompliceerde, maar bij-

TABEL 11 Een 22 factorïele proef met 3 replicaties: procentuele opbrengst bij de niîrering van aniline A. Toevoeging van HNO3 2 uur 4 uur 87,2 88,4 % uur 87,9 88,l B. Roertijd 87,4 87,s 83,9 85,l 2 uur 84,7 85,3 84,3 86,l Gemiddelden A 2 uur 4 uur Totaal % uur 873 88,l 87,s B 1 2 uur 84,3 85,5 84,9 Totaal 85,9 86,s 86,35 zonder efficiënte proefopzetten, waarbij een voiledige symbiose tussen proefopzet en statistiek optreedt. De situatie waarin men zich, eerst nadat de proef was verricht, ging afvragen, op welke wijze de verkregen waarnemingen het best konden worden geanalyseerd, is daarbij geheel in het tegendeel overgegaan, daar het experiment wordt gebaseerd op een,,statistischew proefopzet, een zg. factorieel proefschema. Ik kan hier met u slechts enkele eenvoudige factoriële proefschema's bekijken. Het eerste daarvan behoort tot het type der 2~ factorïele schema's, d.w.z. de schema's met p factoren, ieder met 2 niveaus. Het betreft een onderzoek naar de opbrengst van een nitre~gsproces, nl. het nitreren van aniline (waarvan het eindresultaat het grondmateriaal vormt van een uitgebreid gebied van kleurstoffen en medicamenten). Veronderstel dat men bij dit onderzoek twee factoren wil variëren, nl.: a. de duur van het toevoegen van salpeterzuur: 2 uur of 4 uur; b. de roertijd: 1 uur of 2 uur. Er zijn dus twee factoren, ieder met twee niveaus, zodat een 22 factorieel schema wordt gebruikt. Wij veronderstellen verder dat de proef bij ieder van de vier combinaties 3 X wordt uitgevoerd; dergelijke herhalingen worden replicaties genoemd. De uitkomsten zijn in tabel 11 gegeven (opbrengsten in %). Bestudeert men de waargenomen gemiddelde opbrengsten, dan blijkt het volgende:

TABEL 12 Gemiddelden bij een 22 factorïèle proef (met 3 replicaties) met een duidelijke interactie 2 uur 4 uur Totaal B j % uur 87,5 88,l 87,8 ) 2 uur 89,9 84,3 87.1 Totaal 88,7 86,2 87,45 TABEL 13 Uitkomsten van de variante-analyse, toegepast op de gegevens in tabel 11 Variatiebron Vrijheids- Kwadratengraden (v) som Factor A 1 2,43 F (1;8) = 2,4310,1775 = 13/59 Factor B 1 25,23 F (1;8) = 25,2310,1775 = 142,14 Interactie A X B 1 0,17 F(1;8) = 0,1710,1775 = 0,96 Residueel 8 1,42 s :es = 1,4218 = 0,1775 Totaal 11 29,25 Kritieke waarden van F (1;8): 5%: 5.32, 1%: 7,57, 0.5%: 14.7. 1. bij toevoeging van HNO, gedurende 4 uur is de opbrengst 0,9% hoger dan bij toevoeging in 2 uur; 2. bij een roertijd van V2 uur is de opbrengst 2,9% hoger dan bij een roertijd van 2 uur. 3. er is geen interactie (wisselwerking) tussen de twee factoren. De verschillen tussen de gemiddelden van B bij beide niveaus van A, 88,l-87,5 = 0,6 en 85,5-84,3 = 1,2 of: die tussen de gemiddelden van A bij beide niveaus van B, 87,5-84,3 = 3,2 en 88,l-85,5 = 2,6 ontlopen elkaar slechts weinig. Ter verduidelijking geeft tabel 12 uitkomsten, waarbij wel interactie tussen de factoren A en B optreedt. Zo is (bv.) het verschil tussen de lange en de korte roertijd bij A-2 uur gelijk aan +2,4 maar bij A-4 uur gelijk aan -3,8. Bij kleine aantallen waarnemingen zal men gewoonlijk nog moeten onderzoeken, of de geconstateerde verschillen wellicht door toevallige variatie kunnen worden verklaard. Men toetst dan de zg. nulhypothese, dat bepaalde waargenomen verschillen op toeval berusten, met als alternatieve hypothese dat zij een afspiegeling zijn van reële verschillen. Dit statistische onderzoek kan geschieden door middel van de techniek van de variantieanalyse. Hoewel een bespreking van deze techniek buiten het kader van deze inleiding valt, geef ik in tabel 13 volledigheidshalve de uitkomsten van de analyse. Deze wijzen uit, dat men bij toet- -

B. Roertijd TABEL 14 Uitkomsten van een 23 factoriële proef.a. Toevoeging van HNO3 2 uur 4 uur C. Restant afwezig aanwezig afwezig aanwezig 87,2 87,l 88,4 87,7 *.2 uur 87,9 88,O 88,l 87,9 87,4 87,7 87,8 87,s S3,9 87,5 85,l 87,9 2 uur 84,7 86,8 86,l 88,4 84,3 87,3 85.3 88.6 Gemiddelden I 87,s 87,6 88,l 87,7 84,3 87,2 85,s 88,3 sing met een onbetrouwbaarheidsdrempel van 0,01 (l%), d.w.z. als men bereid is een risico van ten hoogste 1 % te accepteren op het ten onrechte verwerpen van de nulhypothese (= het ten onrechte concluderen tot een,,effect"), de volgende conclusies kan trekken. 1. Toevoeging van salpeterzuur gedurende 4 uur levert een hogere opbrengst op dan toevoeging gedurende 2 uur. 2. Een roertijd van Y2 uur levert een hogere opbrengst op dan een roertijd van 2 uur. 3. Er is geen interactie tussen de twee factoren. Het belangrijke van deze statistische conclusies, vergeleken met de uitspraken die wij reeds eerder, op grond van bestudering van de gemiddelden in tabel 11 deden, is, dat ook het betrekkelijk kleine ad 1 genoemde verschil,,significant" is bij de gebruikte 1 % drempel, d.w.z. als reëel kan worden beschouwd. Verder zien wij dat de praktische conclusie luidt, dat men het best kan werken met een roertijd van?h uur en een toevoeging van salpeter in 4 uur. Men kan overigens ook een intervalschatting geven van het verschil tussen de opbrengsten bij de lange en korte duur van HNO3-toevoeging (bij een roertijd van?h uur). Op grond van het waargenomen verschil, 0,9%, kan men bv. met een onbetrouwbaarheid van 5% beweren, dat het werkelijke verschil ligt tussen 0,6% en 1,1%. Hierbij kan echter worden opgemerkt, dat een toevoeging in 2 uur slechts een iets ongunstiger opbrengts zal geven; de mogelijkheid bestaat dat de kortere duur van de toevoeging, ondanks het geringe verlies aan opbrengst, voordeliger zal zijn dan de langere. In tabel 14 staan de (gefingeerde) uitkomsten van een facto-

TABEL 15 Uitkomsten van een onderzoek naar de bezinkingssnelheid van rivierslib Bezinkingsduur in uren Slibgehalte 3 6 12 24 Totaal Totaal 486 495 525 528 2034 Gemiddelden 75 77 82 84 79,s 87 88 93 92 90,O riële proef met 3 replicaties. Het betreft hier de eerder besproken proef, uitgebreid met de factor,,restantm, eveneens met twee niveaus, t.w.,,restant afwezig" en,,restant aanwezig". Het restant is de rest van een voorgaande charge, die is achtergebleven in de pan waarin het procédé plaatsvindt. Bij,,restant afwezig" is de pan zorgvuldig gereinigd. Door deze factor in te voeren wil men onderzoeken, in hoeverre een grondige schoonmaak van de pannen nodig is voor het verkrijgen van een hogere opbrengst. Bestudeert men de waargenomen gemiddelden, dan blijkt dat een duidelijke interactie optreedt tussen de factoren B en C: bij een roertijd van % uur is de opbrengst bij,,restant afwezig", onafhankelijk van de toevoegingsduur van salpeterzuur, duidelijk hoger dan bij de roertijd van 2 uur. Dit verschil verdwijnt bij,,restant aanwezig". De praktische conclusie is dus, dat men: a. kan volstaan met de toevoeging van salpeterzuur in 2 uur, b. een roertijd van!h uur kan toepassen en c. de pannen niet grondig behoeft schoon te maken. Een volgend voorbeeld betreft een onderzoek naar de bezinkingssnelheid van rivierslib. Men neemt 12 watermonsters met een slibgehalte van ca. 25 mg11 en 12 watermonsters met een slibgehalte van ca. 75 mgll. Bij elk slibgehalte bepaalt men het percentage slib dat gezonken is in drie monsters en wel na 3, 6, 12 en 24 uur. De eerste factor is hier het slibgehalte met twee niveaus, de tweede de bezinkingsduur met vier niveaus, zodat men een 2 X 4 factorieel schema verkrijgt. De uitkomsten van zo'n onderzoek zijn in tabel 15 opgenomen. Een uitvoerige analyse is feitelijk niet noodzakelijk. Men ziet direct, dat geen interactie optreedt. Bij elke bezinkingsduur is het gemiddelde percentage bezonken slib bij het hoge slibgehalte ca. 10% hoger dan bij het

Personen TABEL l6 Latijns vierkant voor het uitvoeren van een makpmef met 4 proefpersonen en 4 soorten water (A. B, C en D) Proefopzet Uitkomsten Tijdstippen Personen Tijdstippen Totaal 1 2 3 4 1 2 3 4 1 A B D C 1 6,2 5,8 6,O 5,7 23,7 2 D C A B 2 4,3 7,6 8,8 8,7 29,4 3 B A C D 3 4,7 6,2 5,5 5,3 21,7 4 D B A 4 5,2 4,8 8,l 9,l 27,2 Totaal 20,4 24,4 28,4 28,8 102,O A B C D Totaal 30,3 27,3 24,O 20,4 102,O lage. De gemiddelde percentages bezonken slib verschillen bij 3 en 6 uur slechts weinig; evenzo bij 12 en 24 uur. De twee laatstgenoemde percentages liggen gemiddeld echter duidelijk hoger dan de beide eerstgenoemde. Het laatste voorbeeld betreft het gebruik van een zg. Lntiijns vierkant. Hierbij brengt men feitelijk in een schema met twee factoren, elk met k niveaus, een derde factor met k niveaus onder. Het kan worden gebruikt als men weet, dat tussen de factoren geen interacties optreden. Beschouw een onderzoek, waarbij men de smaak van vier soorten water, A, B, C en D, wil Iaten beoordelen door vier proefpersonen. Deze,,scoren" de smaak door het zetten van een streepje op een schaalverdeling van O t/m 10. Zou men nu alle personen de vier soorten water in dezelfde volgorde toedienen, dan bestaat het gevaar dat een,,volgorde-effect" de vergelijking tussen de watersoorten beïnvloedt. Men ltan daarom het proefje beter uitvoeren op de wijze, die in tabel 16 is aangegeven. Men ziet dat de,,latijnsew letters, die overeenkomen met de vier soorten water, zó over het,,vierkant9' zijn verdeeld, dat elke soort water éénmaal per proefpersoon en per tijdstip voorkomt. Op deze wijze bereikt men, dat een bepaalde combinatie van de drie factoren (personen/soorten water/tijdstippen) precies één keer voorkomt. De (ge ingeerde) uitkomsten van de proef staan eveneens in tabel 16. Men ziet, dat er duidelijke verschillen tussen de gemiddelde scores (= totalen gedeeld door vier) van de proefpersonen zijn. Ook ziet men dat inderdaad een,,verloopw van de gemiddelde scores in de tijd optreedt; deze stijgen duidelijk van tijdstip 1 tot tijdstip 3. Er blijken echter tevens duidelijke verschiien tussen de gemiddelden van de vier soorten water aan- -