Toegepaste Statistiek

Maat: px
Weergave met pagina beginnen:

Download "Toegepaste Statistiek"

Transcriptie

1 Faculteit Ingenieurswetenschappen - Wetenschappen Toegepaste Statistiek Prof. dr. ir. Gerd Vandersteen June 7, 16

2 Inhoudsopgave Inhoudsopgave 1 Lijst van figuren Lijst vab tabellen Inleiding: ka 7 nsrekening versus statistiek 8.1 Wat is kansrekening? Wat is statistiek? Waarom een cursus over kansrekening en statistiek? Doelstelling van deze cursus Beschrijvende statistiek Inleiding Presentatie van de ruwe gegevens Histogram De empirische verdelingsfunctie Kentallen van ligging: gemiddelde, mediaan, modus Kentallen van schaal Matlab instructies Beschrijven van toevalsverschijnselen 4.1 Inleiding Toevalsverschijnsel De axiomatische definitie van de kans Voorwaardelijke kans Onafhankelijke gebeurtenissen Regel van Bayes Stochastische variabelen en hun kansverdeling Stochastische variabele Verdelingsfunctie Inleiding en definitie Eigenschappen van een verdelingsfunctie Discrete en continue verdelingsfuncties Niet-lineaire transformatie van een continue stochastische variabele Affiene transformatie

3 INHOUDSOPGAVE Niet-lineaire transformatie met enkelvoudige wortels voor y = g(x 1 ) Niet-lineaire transformatie met meervoudige wortels voor y = g(x) Kansvectoren en onafhankelijke stochastische variabelen Meerdimensionale stochastische variabelen Tweedimensionale verdelingsfuncties Tweedimensionale dichtheidsfunctie Marginale verdelingen Onafhankelijke stochastische variabelen Kentallen van locatie, schaal en vorm Inleiding Kentallen van locatie Verwachtingswaarde of rekenkundig gemiddelde E {X} Eigenschappen van de verwachtingswaarde De mediaan De modus Kentallen van schaal Definities Eigenschappen Kentallen van vorm Inleiding en definitie De scheefheid (Eng: skewness) De kurtosis Covariantie en correlatiecoëfficiënt De covariantiematrix Interpretatie en gebruik van de covariantie matrix De correlatiecoëfficiënt Discrete verdelingen Inleiding De binomiale, hypergeometrische en geometrische verdeling Inleiding Een Bernoulli-experiment De binomiaal verdeling De hypergeometrische verdeling De geometrische verdeling De Poissonverdeling en exponentiële Inleiding De Poissonverdeling De exponentiële verdeling Continue verdelingen Inleiding De uniforme verdeling De normaal verdeling Eigenschappen van de normaal verdeling N (µ, σ)

4 INHOUDSOPGAVE 1.4 De centrale limietstelling Opstellen van betrouwbaarheidsintervallen Het opstellen en gebruiken van betrouwbaarheidsintervallen in praktische situaties Studie van het steekproefgemiddelde Studie van de steekproefvariantie De chi-kwadraat verdeling Toepassing χ n verdeling voor algemene normaal verdelingen Studie van de steekproefvariantie Betrouwbaarheidsinterval voor Sn Studie van Xn µ S n/ n Student-t verdeling Betrouwbaarheidsintervallen Hypothesetoetsen Inleiding Hypothese- en significantietest: de basisideeën Formuleren van de hypothesen Hypothesetoetsen Methodologie Specifieke toetsen De z-toets H :µ = µ met σ gekend De t-toets: H :µ = µ De t-toets voor onafhankelijke steekproeven: H : µ 1 = µ De χ -toets: H : σ = σ De F -toets: H : σ1 = σ Fouten in hypothesetoetsen Schatten van modellen Introductie Eigenschappen van een schatter Bias of verschuiving ( zuiver ) Consistentie Efficiëntie Kostfunctieinterpretatie Toepassing op schatting lineair verband Simulatievoorbeeld Studie asymptotisch gedrag De kleinste kwadraten schatter De errors-in-variables schatter Het simpel gemiddelde Variantie van de schatters Kostfunctie interpretatie van de schatters Bibliografie 14 3

5 Lijst van figuren 3.1 Histogram van de score van de studenten De empirische verdelingsfunctie voor de score van de studenten op het tentamen chemie De empirische verdelingsfunctie met de mediaan en de kwartielen De empirische verdelingsfunctie met de mediaan en de kwartielen Het histogram met de modus van de steekproef De empirische verdelingsfunctie met het steekproefgemiddelde x en de grenzen x S n en x + S n De verdelingsfunctie van een dobbelsteen Voorbeeld van een staafdiagram (links) en de bijhorende verdelingsfunctie (rechts) Voorbeeld van een continue verdeling: de normaal verdeling Affiene transformatie van de kansdichtheidsfunctie f X (x) naar f Y (ax + b) Kubische transformatie met enkelvoudige wortels van de kansdichtheidsfunctie f X (x) naar f Y (x 3 ) Kwadratische transformatie met dubbele wortels van de kansdichtheidsfunctie f X (x) naar f Y (x ) dimensionale kansdichtheidsfunctie f Z (x, y) (Normaal verdeling) dimensionale verdelingsfunctie F Z (x, y) (Normaal verdeling) De integratiegrenzen voor het oppervlak x + y Weergeven van de individuele termen in de convolutie voor de som van (eerlijke) worpen van een dobbelsteen De finale kansverdeling voor de som van (eerlijke) worpen van een dobbelsteen De kansdichtheidsfuncties van de som van of meerdere uniforme distributies en de (asymptotische) normaal verdeling Voorbeeld van onafhankelijke stochastische grootheden Voorbeeld van lineair afhankelijke stochastische grootheden Voorbeeld van niet-lineair afhankelijke stochastische grootheden Mediaan van een (symmetrische) normaal verdeling N (.1) weergegeven op f X (x) en F X (x) Mediaan van een (asymmetrische) χ -verdeling met 1 vrijheidsgraden (χ 1(1)) weergegeven op f X (x) en F X (x)

6 LIJST VAN FIGUREN 7.3 Modus van een (symmetrische) normaal verdeling N (.1) weergegeven op f X (x) en F X (x) Modus van een (asymmetrische) χ -verdeling met 1 vrijheidsgraden (χ 1(1)) weergegeven op f X (x) en F X (x) Stochastische variabelen met verschillende correlaties Binomiaal verdeling voor n = 1 (gegenereerd via de Matlab instructie binopdf) Voorbeeld van hypergeometrische verdeling H (4, 4p, ), evenals de binomiaal verdeling B (, p) Voorbeeld van hypergeometrische verdeling H (1, 1p, ), evenals de binomiaal verdeling B (, p) Voorbeeld van geometrische verdeling Voorbeeld van een Poisson kansdichtheidsfunctie: λt =.1, 1, Vergelijking van kansdichtheidsfunctie voor binomiaal, Poisson en normaal verdeling De kansdichtheidsfunctie van de exponentiële verdeling voor verschillende λ De kansdichtheidsfunctie van de exponentiële en de geometrisch verdelingsfunctie, beiden met een gemiddelde E {X} = De kansdichtheidsfunctie en de verdeling van de uniforme verdeling in het interval (, ) De kansdichtheidsfunctie en de verdeling van de standaard normaal verdeling N (, 1) De kansdichtheidsfuncties van de som van of meerdere uniforme distributies en de (asymptotische) normaal verdeling Voorbeeld van 95% betrouwbaarheidsinterval voor N (, 1) Betrouwbaarheidsinterval met betrouwbaarheid 1 α voor standaardnormaal verdeling met gekend is De kansdichtheidsfunctie van X n voor n = 1, 1, 1, 1 voor een standaardnormaal verdeling X i N (, 1) De χ n kansdichtheidsfunctie voor n =, 4, 8, 16, 3, evenals de asymptotische N (3, 8) verdeling Voorbeeld van 95% betrouwbaarheidsinterval voor χ Grenzen van het 95% betrouwbaarheidsinterval voor S n/σ in functie van het aantal metingen n. De figuur bovenaan toont de χ n 1 n 1 verdeling die overeenstemt met n = 1. De figuur onderaan toont hoe de grenzen (volgens de n-wet) naar elkaar toe convergeren Kansverdelingsfunctie van de t n verdeling voor n =, 8, 3, en de asymptotisch normaal verdeling N (, 1) Voorbeeld van 95% betrouwbaarheidsinterval voor t Illustratie van de aanvaardingsgebieden van de tweezijdige toets (boven) en de eenzijdige toetsen voor de z-toets voor α = 5% Illustratie van de aanvaardingsgebieden van de tweezijdige toets (boven) en de eenzijdige toetsen voor de χ -toets met α = 5%. 15 5

7 LIJST VAN FIGUREN 1.1 De resultaten van de verschillende voorgestelde schatters in functie van het aantal observaties n De kansdichtheidsfunctie van de verschillende schatters voor n = 1, 1, De standaardafwijking van de verschillende schatters in functie van het aantal observaties n

8 Hoofdstuk 1 Inleiding: ka 7

9 Hoofdstuk nsrekening versus statistiek In dit hoofdstuk belichten we heel bondig de twee onderwerpen van deze cursus: kansrekening enerzijds, statistiek anderzijds. Vervolgens bespreken we de doelstellingen van deze cursus..1 Wat is kansrekening? Kansrekening (ook gekend onder waarschijnlijkheidsrekening) is een wiskundige discipline waarbij men een abstract kanstheoretisch model opstelt om onder meer kansen te berekenen en te bestuderen. Hierbij vertrekt men van een aantal basis axioma s waaruit men via deductie 1 conclusies afleidt. Voorbeelden Wat is de kans om een 4 te gooien met een eerlijke dobbelsteen? (uniforme kansruimte) Wat is de kans om bij 1 pogingen met een eerlijke dobbelsteen, 4 keer een 4 te gooien? Wat is de kans om met eerlijke dobbelstenen een 1 en een te gooien? (trekking met teruglegging) Wat is de kans dat een persoon blauwe ogen heeft? Wat is de kans om bij een examen vragen 1 en te trekken uit 6 vooropgestelde vragen? (trekking zonder teruglegging) 1 Deductie (Van Dale): redenering waarbij men uitgaande van het meer algemene besluit tot het bijzondere (afgeleide waarheid) 8

10 HOOFDSTUK. NSREKENING VERSUS STATISTIEK Wat is de kans om bij een herexamens dezelfde vraag te trekken? Is het een onafhankelijk examen of wordt wordt de vorige vraag niet meer gesteld? (voorwaardelijke kans) Wat is de kans dat een persoon blauwe ogen heeft indien de ouders beiden blauwe ogen hebben? (voorwaardelijke kans) Het examentijd bij Prof. A duurt 4 keer langer dan bij Prof. B. Hoeveel keer kleiner wordt de onzekerheid op de (gemeten) punten? ( n regel) Meer praktische voorbeelden Wat is de kans op falen van een systeem indien je de kans tot falen van iedere component kent? ( yield van de productie) Wat is de kans dat in een lot van 1 geproduceerde systemen er zeker 997 goede bij zijn, als de kans op een faling.1% is? Wat is de kans tot productie van een trage-normale-snelle microprocessor? (product binning) Hoe zwaar moet een computerserver gekozen worden opdat 99% van de bevragingen onmiddellijk verwerkt kunnen worden? Wat is de kans dat de detectoren een (nieuw) fysisch fenomeen detecteren indien 4 van de 5 detectoren (elk met een zekere kans) het fenomeen opmeten?. Wat is statistiek? In de statistiek gaat men inductief na of een bepaald kanstheoretisch model toepasbaar is op een gegeven verzameling van waarnemingen (metingen). Deze kennis kan dan worden gebruikt om voorspellingen te doen. Voorbeelden 1 realisaties met een dobbelsteen levert 4 keer een 4 op. Is de dobbelsteen eerlijk (m.a.w. is de kans op een 4 gelijk aan 1 /6)? Met welke kans kan je die uitspraak doen? Hoe kunnen we nagaan of opeenvolgende examens onafhankelijk zijn? Inductief (Van Dale): uit het bijzondere tot het algemene besluiten; uit proefondervindelijk onderzoek afleidend. 9

11 HOOFDSTUK. NSREKENING VERSUS STATISTIEK Hoe kunnen we bepalen of twee professoren even streng of mild zijn bij de quotering van de examens? Hoeveel studenten moeten ze gezamenlijk ondervragen om deze vraag (met een gevraagde kans) te beantwoorden? Meer praktische voorbeelden Hoe kan je de kans op falen van je systeem (de yield) verkleinen als je weet hoe de waarden van de subsystemen verdeeld zijn? Hoe kan de verdeling van deze waarden doorgerekend worden? Hoeveel metingen moet ik uitvoeren opdat de toevallige fouten op de gemiddelde waarde kleiner dan 1% zouden zijn? Hoe lang moet een databuffer / wachtrij zijn om data pakketten / klanten met een gegeven kans te verliezen? Wat is de gemiddelde hoeveelheid data / vertraging / klanten in de wachtrij? Wat is de kwaliteit van een communicatieverbinding? Kan ik uit een beperkt aantal metingen de verbinding karakteriseren en vervolgens voorspellen wat de kans is dat een pakket foutief doorgestuurd wordt? (biterror-rate) Zijn de geconstateerde leukemiegevallen in de dorpen rond een industrieterrein te wijten aan toevallige (overal voorkomende) oorzaken, of is er daar sprake van een statistisch significant groter risico op deze ziekte? Met welke kans kan je zeggen dat dit het geval is, en met welke kans kan je je vergissen?.3 Waarom een cursus over kansrekening en statistiek? In het dagelijkse leven, en in uw latere carrière als ingenieur, worden wij overstelpt met gegevens. Statistiek helpt om gegevens kritisch en met inzicht te lezen. Het leert ons gegevens te produceren die duidelijke antwoorden geven op belangrijke vragen, en wij moeten wel gefundeerde methoden leren voor het trekken van betrouwbare conclusies op grond van gegevens..4 Doelstelling van deze cursus De statistische analyse vereist een grondige kennis van de kansrekening. Betrouwbaarheidsintervallen, hypothesetoetsen, vergelijkingstoetsen, onafhankelijkheidstoetsen, enz. kunnen niet bepaald worden zonder beroep te doen op 1

12 HOOFDSTUK. NSREKENING VERSUS STATISTIEK het begrip waarschijnlijkheid of kans. In deze cursus worden beide aspecten (kansrekening en statistiek) bestudeerd. In een eerste deel worden voornamelijk de theoretische modellen opgesteld (waarschijnlijkheidsleer). In het tweede deel gaan we na hoe we deze modellen kunnen combineren met waarnemingen en daaruit de kans van een gegeven gebeurtenis kunnen bepalen. 11

13 Hoofdstuk 3 Beschrijvende statistiek In dit hoofdstuk gaan we bestuderen hoe we een grote hoeveelheid ruwe gegevens (data) kunnen herschikken om een betere toegang te krijgen tot de informatie die erin vervat zit. Vervolgens gaan we een aantal belangrijke grootheden introduceren (kentallen) die de verdeling van de data samenbalt in een paar getallen. De volgende begrippen worden geïntroduceerd: Steekproef, ruwe gegevens, histogram, indeling in klassen, klassenbreedte, empirische verdelingsfunctie, gemiddelde, mediaan, modus, empirische variantie, standaardafwijking, mediane absolute afwijking. 3.1 Inleiding In de beschrijvende statistiek moet men in heel wat gevallen grote hoeveelheden ruwe data verwerken. Deze data kunnen het resultaat zijn van een steekproef (een test op een beperkte deelgroep die men als representatief beschouwt voor de ganse groep), of ze kunnen bekomen zijn door de gegevens van een welomschreven groep te verzamelen (b.v. de resultaten van de studenten in de eerste bachelor IR voor het tentamen scheikunde). Omdat dergelijke grote hoeveelheden getallen weinig overzichtelijk zijn willen we ze enerzijds beter presenteren door ze te ordenen en de resultaten grafisch voor te stellen (bv. het histogram), anderzijds kunnen we een aantal belangrijke karakteristieken van deze getallen samenballen in een beperkt aantal kentallen zoals hun gemiddelde of mediaan en hun spreiding. 1

14 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK In een allereerste stap moeten we eerst echter de begrippen ganse groep en beperkte deelgroep preciseren. Definitie 3.1.1: Populatie De gehele groep objecten of personen waarover informatie wordt gewenst, wordt de populatie genoemd. Definitie 3.1.: Steekproef Een steekproef is een gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te verzamelen. Merk op dat de populatie gedefinieerd wordt in termen van ons verlangen naar kennis. Als we conclusies willen trekken over alle studenten aan de universiteiten in België, dan is die groep onze populatie. De steekproef is het gedeelte studenten dat werd ondervraagd, en waaruit we conclusies trekken over het geheel. Het is duidelijk dat een steekproef voorzichtig moet worden uitgevoerd. Een slecht ontworpen steekproefprocedé kan misleidende resultaten geven: bv. men selecteert systematisch enkel de goede studenten. Meestal is men niet geïnteresseerd in de individuele metingen, maar wenst men enkel een aantal globale karakteristieken eruit te destilleren: bv. welke quotering komt het meeste voor? Daartoe is het wenselijk om de ruwe gegevens op een meer verfijnde manier voor te stellen. Dit wordt in Sectie 3. uiteengezet aan de hand van een voorbeeld. 3. Presentatie van de ruwe gegevens In Tabel 3.1 worden de resultaten gegeven van 145 studenten op het tentamen scheikunde. 13

15 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK Tabel 3.1: Quotering van 145 studenten voor het tentamen scheikunde, niet gesorteerd. Erg veel informatie geeft zo n tabel van ruwe gegevens niet. Het is uit deze tabel moeilijk af te lezen wat de meestvoorkomende quotering is, waar de uitersten liggen,... Dezelfde gegevens maar nu gesorteerd op grootte zoals in Tabel 3. geven veel meer informatie. We zien onmiddellijk dat alle metingen in het interval [3., 18.5] liggen. De waarden rond 13 tot 15 komen het meeste voor Tabel 3.: Quotering van 145 studenten voor het tentamen scheikunde, gesorteerd. Voor een nog beter overzicht is het beter de gegevens in een aantal klassen (meestal 5 tot 3) in te delen. Hiertoe kiezen we een klassenbreedte, bv. 1, we verdelen het relevante interval in halfopen deelintervallen van deze lengte, 14

16 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK bv. [13., 14.[, enz., en we tellen de frequenties (dit is het aantal keren dat een meting in een bepaald deelinterval valt). De ruwe gegevens werden op deze wijze verwerkt in Tabel 3.3. Het is duidelijk dat deze voorstelling toelaat om de verdeling van de resultaten veel sneller af te lezen. Tabel 3.3: Voorstelling van de resultaten, opgedeeld in klassen. Klasse Ondergrens ( ) Bovengrens (<) Frequentie Percentage Histogram In plaats van gebruik te maken van tabellen, kan de klassenindeling grafisch worden weergeven in een histogram. Op ieder deelinterval richten we een rechthoek op waarvan de oppervlakte evenredig is met de frequentie van de betreffende klasse. In Figuur 3.1 wordt het histogram getekend voor verschillende klassenbreedtes. Hieruit blijkt duidelijk dat de vorm van het histogram sterk afhangt van de keuze van de klassenbreedte. In de praktijk dient men het aantal klassen te kiezen in functie van het aantal metingen: hoe meer metingen, hoe kleiner men de klassenbreedte kan kiezen om een beter beeld te bekomen van de verdeling van de metingen. Indien men te weinig metingen heeft voor een gegeven aantal klassen wordt het beeld sterk verstoord door toevallige fluctuaties. 15

17 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK klassebreedte 1 klassebreedte Figuur 3.1: Histogram van de score van de studenten. Links: klassenbreedte = 1; Rechts: klassebreedte =.5. Opgepast: de Matlab -definitie verschilt van deze gebuikt in de cursus (Matlab specificeerd de centra van de klassen). 3.4 De empirische verdelingsfunctie Definitie 3.4.1: Empirische verdelingsfunctie De empirische verdelingsfunctie F n (x) voor n metingen is F n (x) = # {x i x} n (3.1) Een grafische voorstelling van deze functie laat de gebruiker onmiddellijk zien hoe zijn gegevens verdeeld zijn (hoeveel kleine waarden, hoeveel extreem grote waarden,...). In combinatie met het histogram levert dit opnieuw heel wat inzicht. De empirische verdelingsfunctie zal later worden aangevuld met de theoretische verdeling (zie Sectie 5.). In Figuur 3. is de empirische verdelingsfunctie getoond voor de data in Tabel 3.1. Deze functie is een trapfunctie die in de punten x i een sprong maakt. Voor continue grootheden (bv. het gewicht van maand oude varkens; de dagelijkse neerslag gemeten op het kmi; de netspanning van het Belgische elektriciteitsnet) gaat deze verdelingsfunctie naar een continue functie convergeren. 16

18 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK 1 Empirische verdelingsfunctie P(x X) X Figuur 3.: De empirische verdelingsfunctie voor de score van de studenten op het tentamen chemie. 3.5 Kentallen van ligging: gemiddelde, mediaan, modus Soms willen we de gegevens nog sterker samenvatten dan in een histogram of een empirische verdelingsfunctie. Hiervoor gebruikt men meestal kentallen: één voor de ligging en één voor de spreiding. Het gemiddelde, mediaan en modus zijn veelgebruikte kengetallen voor de ligging; voor de schaal (de spreiding) worden de standaard afwijking en soms de mediane absolute afwijking gebruikt. Definitie 3.5.1: Gemiddelde Het gemiddelde (steekproefgemiddelde) van de gegevens {x i }, i = 1,..., n is x = 1 n Definitie 3.5.: Mediaan n x i. (3.) Beschouw de gesorteerde gegevens {x 1 x... x n }. De mediaan is de middelste waarneming als n oneven is, en het gemiddelde van de twee middelste waarnemingen indien n even is: i=1 med = x n+1 als n oneven, en med = x n + x n +1 als n even. (3.3) Definitie 3.5.3: Kwartiel Het eerste kwartiel Q 1 is de mediaan van de waarnemingen links van de globale mediaan. Het derde kwartiel Q 3 is de mediaan van de waarnemingen rechts van de globale mediaan. 17

19 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK Figuur 3.3 toont de positie van de mediaan en de kwartielen op de empirische verdelingsfunctie. Merk op dat P (x med) (per definitie) gelijk is aan.5. Deze kwartielen worden onder meer ook gebruikt voor de zogenaamde box plot dewelke, naast de mediaan en de kwartielen, ook de maximale waarden en eventuele uitschieters aangeeft verdelingsfunctie mediaan Q1 Q3 Kwartielen en mediaan P(x X) X Figuur 3.3: De empirische verdelingsfunctie met de mediaan en de kwartielen. Kwartielen en mediaan Boxplot X P(x X) Figuur 3.4: De empirische verdelingsfunctie met de mediaan en de kwartielen. Definitie 3.5.4: Modus De modus van een steekproef is de meest voorkomende waarneming. Figuur 3.5 toont de positie van de modus op het histogram. Merk op dat de modus niet eenduidig hoeft te zijn: verschillende waarnemingen kunnen evenveel voorkomen. 18

20 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK 1 1 histogram modus histogram & modus X Figuur 3.5: Het histogram met de modus van de steekproef. In het voorbeeld is het gemiddelde x = 11.55, de mediaan med = 1, de modus is Conclusie Het gemiddelde is eenvoudig te berekenen en heeft een aantal handige wiskundige eigenschappen zoals lineariteit. Dit wil concreet zeggen dat het gemiddelde van ax i + by i gelijk is aan ax + by (voor a en b constant). Het gemiddelde is echter zeer gevoelig voor uitschieters. De mediaan daarentegen is het meest robuust, maar de gegevens moet wel eerst gesorteerd worden. 3.6 Kentallen van schaal Naast de ligging is het belangrijk om te weten hoever de metingen van deze ligging kunnen afwijken, met andere woorden, hoe sterk zijn de metingen gegroepeerd. Hiertoe gebruiken we de standaardafwijking en soms ook de mediane absolute afwijking. Definitie 3.6.1: Standaardafwijking S n, variantie S n S n = S n met S n = 1 n 1 n i=1 (x i x). Figuur 3.6 toont de positie van het steekproefgemiddelde x en de grenzen van x S n en x+s n op de empirische verdelingsfunctie. Merk op dat het merendeel van de kansmassa ligt in het gebied van [x S n, x + S n ] met in dit voorbeeld S n = 3.5. Merk verder op dat P (x x) niet noodzakelijk overeenkomt met een kans van.5. 19

21 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK verdelingsfunctie gem gem. std gem.+std Gemiddelde+/ standaardafwijking P(x X) X Figuur 3.6: De empirische verdelingsfunctie met het steekproefgemiddelde x en de grenzen x S n en x + S n. Definitie 3.6.: Mean absolute deviation 1 n n x i x, i = 1,..., n. i=1 Definitie 3.6.3: Mediane absolute deviation mediaan { x i med }, i = 1,..., n. 3.7 Matlab instructies Hieronder worden een aantal Matlab instructies kort beschreven. De volledige informatie kan bekomen worden door help INSTRUCTIE. hist Histogram. N = hist(y) bins the elements of Y into 1 equally spaced containers and returns the number of elements in each container. If Y is a matrix, hist works down the columns. N = hist(y,m), where M is a scalar, uses M bins. mean Average or mean value. For vectors, mean(x) is the mean value of the elements in X. For matrices, mean(x) is a row vector containing the mean value of each column. For N-D arrays, MEAN(X) is the mean value of the elements along the first non-singleton dimension of X. mean(x,dim) takes the mean along the dimension DIM of X.

22 HOOFDSTUK 3. BESCHRIJVENDE STATISTIEK Example: If X = [ 1 ; 3 4 5] then mean(x,1) is [ ] and mean(x,) is [1; 4] std Standard deviation. For vectors, std(x) returns the standard deviation. std(x) normalizes by (N-1) where N is the sequence length. For matrices, std(x,flag,dim) takes the standard deviation along the dimension DIM of X. When FLAG=, std normalizes by (N-1), otherwise std normalizes by N. median Median value. For vectors, median(x) is the median value of the elements in X. For matrices, median(x) is a row vector containing the median value of each column. mad Mean absolute deviation and the median absolute deviation Y = mad(x) calculates the mean absolute deviation and the median absolute deviation of X depending on the specified options. For matrix X, mad returns a row vector containing the MAD of each column. 1

23 Hoofdstuk 4 Beschrijven van toevalsverschijnselen In dit hoofdstuk leren we een toevalsverschijnsel te beschrijven. Hiertoe wordt eerst een kansmodel ingevoerd, en vervolgens worden de individuele componenten ervan in meer detail bestudeerd. De volgende begrippen worden geïntroduceerd: toevalsverschijnsel, kansmodel, uitkomstenruimte, kans: axiomatische definitie en basiseigenschappen, voorwaardelijke kans, (on)afhankelijke gebeurtenissen, regel van Bayes. 4.1 Inleiding Dat sommige dingen toevallig zijn is een waargenomen feit. De uitkomst van het opgooien van een muntstuk, het tijdsinterval tussen de emissies van deeltjes door een radioactieve bron, het geslacht van een baby, de uitslag bij herhaalde metingen zijn allemaal onvoorspelbaar. Voor veel van deze gebeurtenissen hebben we een intuïtief begrip van kans: We weten dat de kans om een of te gooien met een dobbelsteen kleiner is dan de kans om een,, te gooien.

24 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN Als we in een wagen stappen gaan we ervan uit dat de kans op een ongeluk aanvaardbaar klein is. Met een oogopslag beslissen we of er een grote kans op regen is, en of we al dan niet een paraplu meenemen. Deze intuïtieve kanservaring moet echter geformaliseerd worden alvorens ze als basisbegrip gebruikt kan worden in een wiskundige theorie. Hiertoe moeten we een kansruimte (Ω, A, P) invoeren. Een kansmodel voor een toevalsverschijnsel bestaat uit een kansruimte (Ω, A, P) met een uitkomstenruimte die de mogelijke uitkomsten bevat, Ω, een collectie van alle mogelijke gebeurtenissen, A, een kansfunctie die aan elke gebeurtenis A A een getal P (A) [, 1] als kans toekent. 4. Toevalsverschijnsel Definitie 4..1: Toevalsverschijnsel We noemen een verschijnsel een toevalsverschijnsel als de individuele uitkomsten onzeker zijn, maar er niettemin bij een groot aantal herhalingen een regelmatige verdeling van uitkomsten bestaat. Bijvoorbeeld: als we een munt eenmaal opgooien kunnen we niet voorspellen wat het resultaat zal zijn: kop of munt. Als we echter 1 maal een munt opgooien blijkt dat er ongeveer 5 keer kop zal voorkomen en 5 keer munt. Ondanks het feit dat we de individuele uitslagen niet kunnen voorspellen, kunnen we heel wat zeggen over het gedrag van een groot aantal experimenten. Een toevalsverschijnsel wordt omschreven door zijn mogelijke uitkomsten. Definitie 4..: Uitkomstenruimte (Ω) De uitkomstenruimte Ω is de verzameling van uitkomsten of elementaire gebeurtenissen (steekproefruimte of uitkomstenruimte genoemd). We zijn niet altijd geïnteresseerd in dergelijke elementaire gebeurtenissen. Dikwijls willen we meer complexe situaties bestuderen. Daarin worden een aantal elementaire gebeurtenissen samengevoegd. Definitie 4..3: Gebeurtenis (A) Een gebeurtenis A is een deelverzameling van Ω waarvan de kans bestudeerd wordt (A Ω). 3

25 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN Vervolgens voeren we de collectie van alle mogelijke gebeurtenissen in: Axioma 4..1: Collectie van alle mogelijke gebeurtenissen (A) 1. en Ω zijn gebeurtenissen: A en Ω A. Als A een gebeurtenis is, dan is ook zijn complement een gebeurtenis: A A A c = Ω \ A A, (4.1) 3. A en B gebeurtenissen, dan is ook A B een gebeurtenis A, B A A B A (4.) Voorbeeld 4..1: Bij het werpen met een dobbelsteen is de uitkomstruimte Ω = {,,,,, }. Een gebeurtenis A is bijvoorbeeld het gooien van een, dan is A = { }. Gebeurtenis B is bijvoorbeeld een even worp B = {,, }. 4.3 De axiomatische definitie van de kans Om het toevalsverschijnsel volledig te karakteriseren moeten we niet enkel alle mogelijke uitkomsten kennen (de uitkomstenruimte Ω), maar ook de kans op elk van deze uitkomsten. Definitie 4.3.1: Voor iedere gebeurtenis A bestaat er een kans(functie) P (A) die de kans op het realiseren (voorkomen) van deze gebeurtenis geeft. Voorbeeld: Voor een eerlijke dobbelsteen geeft ons intuïtief kansbegrip aan dat P (A = { }) = 1 6. In deze cursus definiëren we het kansbegrip met behulp van 3 axioma s. Al de andere eigenschappen worden hieruit afgeleid. Kansfunctie P van A Axioma 4.3.1: Een kans is begrepen tussen (gebeurtenis gebeurt nooit) en 1 (gebeurtenis gebeurt altijd): P (A) 1 voor alle A A Axioma 4.3.: De ledige verzameling heeft kans : P ( ) = De volledige uitkomstenruimte heeft kans 1: P (Ω) = 1 4

26 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN Axioma 4.3.3: A, B A en A B = P (A B) = P (A) + P (B) Merk op dat A B = betekent dat de gebeurtenissen A en B niet gelijktijdig kunnen plaatsgrijpen. Voorbeeld 4.3.1: Bij een worp met een dobbelsteen is de verzameling uitkomsten Ω = {,,,,, } en de kans op een elementaire gebeurtenis wordt gelijk gesteld aan 1 /6. Dat kunnen we met behulp van Axioma s terugvinden. P (Ω) = P (,,,,, ) = P ( ) + P ( ) + P ( ) + P ( ) + P ( ) + P ( ) = 6 P ( ) = 1 Opmerking: Als Ω oneindig veel elementen bevat dienen de bovenvermelde axioma s uitgebreid te worden. Dit kan zonder veel problemen voor aftelbare verzamelingen (bv. de verzameling der natuurlijke getallen), maar dient met de nodige omzichtigheid te gebeuren voor continue verzamelingen (bv. de verzameling der reële getallen). Uit de bovenvermelde axioma s volgen de volgende eigenschappen: Eigenschap 4.3.1: Als A, B A, dan geldt er dat A B A Eigenschap 4.3.: Somregel P (A B) = P (A) + P (B) P (A B) Eigenschap 4.3.3: Complementregel P (A) + P (A c ) = 1 Eigenschappen die nuttig kunnen zijn uit de verzamelingenleer. Eigenschap 4.3.4: De Morgan (A B) c = (A c B c ) (A B) = (A c B c ) c (A B) c = (A c B c ) (A B) = (A c B c ) c 5

27 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN (A\B) = (A B c ) Voorbeeld 4.3.: Neem als uitkomstenruimte Ω de ruimte van de reële getallen Ω =R. Beschouw de gebeurtenis dat een getal X voldoet aan a < X b. Gebruikmakende van De Morgan, (A B) = (A c B c ) c, kan de kans voor deze gebeurtenis geschreven worden als P (a < X X b) = 1 P (a X X > b) Gebruikmakende van de som regel en het feit dat P (A B) = met gebeurtenis A: a X en gebeurtenis B: X > b indien a < b bekomen we P (a < X X b) = 1 (P (a X) + P (X > b)) Gebruikmakende van de complement regel kan de eerste term geschreven worden als Bijgevolg bekomen we P (X > b) = 1 P (X b) P (a < X b) = P (X b) P (X a) Deze uitdrukking heeft het grote voordeel dat ze nu beschreven wordt aan de hand van de cumulatieve verdelingsfunctie F X (a) = P (X a) dewelke later in de cursus ingevoerd zal worden. 4.4 Voorwaardelijke kans Onderstel dat men de kans analyseert dat een laatstejaars humaniora leerling kiest voor de opleiding burgerlijk ingenieur. Afhankelijk van de beschouwde groep leerlingen zal deze kans verschillend zijn: 1. Alle leerlingen die afstuderen in het middelbaar.. Alle leerlingen die afstuderen in het middelbaar en minstens 6 uur wiskunde kregen per week. 3. Alle meisjes die afstuderen in het middelbaar. 6

28 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN 4. Alle jongens die afstuderen in het middelbaar. Een dergelijke voorkennis wordt binnen de kansrekening geformaliseerd met het begrip voorwaardelijke kans. Hierin gaat men na wat de kans is op gebeurtenis A, indien men weet dat gebeurtenis B zich heeft voorgedaan. Dit wordt voorgesteld door en wordt voorgesteld door P (A B) en leest men als: de kans op A onder voorwaarde B. Deze voorwaardelijk kans kan als volgt uitgedrukt worden P (A B) = P (A B). (4.3) P (B) Een redenering is dat om zowel aan A als aan B te voldoen P (A B), we eerst er voor zorgen dat gebeurtenis B zich voltrek (P (B)) en vervolgens de gebeurtenis A te beschouwen (wetende dat B zich al voltrokken geeft: P (A B)). Bijgevolg is P (A B) = P (A B) P (B) = P (B A) P (A) Het gebruik van voorwaardelijke kansen laat toe om heel complexe problemen op te splitsen in een serie van (meer) eenvoudige problemen. Voorbeeld 4.4.1: We werpen met twee dobbelstenen. Wat is de kans op een even aantal ogen als één van beide dobbelstenen een toont? Oplossing 1. Het totaal aantal mogelijk uitslagen bij het gooien van dobbelstenen is 6 6 = 36. Definieer de volgende gebeurtenissen A: een even aantal ogen B: minstens één van de dobbelstenen toont een.. De kans op A: De kans voor een even aantal ogen is gelijk aan een oneven aantal ogen: P (A) = = De kans op B? P (één van beide dobbelstenen toont een ) = ({ }),,,,, P,,,, 7

29 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN Dus P (B) = Wat is de kans op gebeurtenis A B? P (A B) = P ({,,,, }) = Hieruit volgt onmiddellijk de volgende voorwaardelijke waarschijnlijkheden P (A B) = P (B A) = P (A B) P (B) P (A B) P (A) = 5/36 11/36 = 5 11 = 5/36 1/ = Onafhankelijke gebeurtenissen In het vorige voorbeeld hebben we gezien dat het antwoord op de vraag Wat is de kans op een even worp afhangt van het feit dat men vooraf weet dat 1 van beide dobbelstenen een 1 vertoont. De kans op gebeurtenis A hangt dus af van de gebeurtenis B. Indien dit niet het geval is spreekt men van onafhankelijke gebeurtenissen. Dus, indien P (A B) = P (A B) P (B) = P (A) (dit is de eis die we stellen), (4.4) dan hebben we onmiddellijk als resultaat: P (A B) = P (A) P (B). Dit zullen we als formele definitie gebruiken. Definitie 4.5.1: Onafhankelijke gebeurtenissen A en B zijn onafhankelijk P (A B) = P (A) P (B). Deze definitie kan uitgebreid worden tot N gebeurtenissen. Definitie 4.5.: Onafhankelijke gebeurtenissen De gebeurtenissen A 1, A,..., A N zijn onafhankelijk indien geldt dat P (A v1 A v A v3... A vn ) = P (A v1 ) (4.5) voor elke mogelijke keuze van de indices v i onder {1,..., N} (alle v i verschillend!). Een gevolg is de volgende eigenschap: Eigenschap 4.5.1: Productregel Indien de gebeurtenissen A 1, A,..., A N onafhankelijk zijn, dan heeft men: P (A 1 A A N ) = P (A 1 ) P (A )... P (A N ) (4.6) 8

30 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN Indien men kan stellen dat gebeurtenissen onafhankelijk zijn kan men het oplossen van het probleem sterk vereenvoudigen omdat men een ingewikkeld probleem opsplitst in een set van vereenvoudigde problemen. Voorbeeld 4.5.1: Beschouw een trans-atlantische telefoonkabel die bv. 1 repeaters bevat op regelmatige afstanden om het signaal te herstellen en te versterken. De lijn werkt slechts indien geen enkel van deze repeaters defect is. Stel dat de kans op een defect over een periode van 1 jaar.1 is, wat is dan de kans dat deze lijn zonder defect werkt gedurende 1 jaar? Om het antwoord te berekenen is het eenvoudiger om de complementaire gebeurtenissen te beschouwen: de kans voor 1 repeater om correct te werken gedurende 1 jaar is.999. Indien we onderstellen dat de defecten bij de verschillende repeaters los van elkaar voorkomen (onafhankelijke gebeurtenissen) kunnen we (4.6) gebruiken: P (geen defect op de lijn) = P (alle repeaters werken) (4.7) = (P (1 repeater werkt)) 1 (4.8) Dit resulteert in de volgende betrouwbaarheid als functie van de kans op een defect: zoals gegeven in Tabel 4.1 Dit toont duidelijk dat voor complexe systemen met een groot aantal individuele componenten men extreem hoge betrouwbaarheidseisen moet stellen aan elke individuele component opdat het geheel betrouwbaar zou zijn. Tabel 4.1: Kans op een correct werkende transmissielijn. kans defect 1 repeater kans correcte repeater kans correcte lijn Regel van Bayes In sommige gevallen wenst men de voorwaardelijke kansen om te draaien, met andere woorden, kunnen we P (B A) berekenen vanaf P (A B)? Het antwoord op deze vraag wordt gegeven door de regel van Bayes. Definitie 4.6.1: Regel van Bayes P (A B) = P (B A) P (A) P (B) (4.9) 9

31 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN Dit resultaat volg onmiddellijk vanuit de gelijkheden: P (A B) = P (A B) P (B) en P (B A) = P (B A). P (A) Het is nu ook nog mogelijk om P (B) uit te drukken aan de hand van de (beschikbare) voorwaardelijke kansen P (B A) en P (B A c ). P (B) = P (B Ω) = P (B (A A c )) = P ((B A) (B A c )) = P (B A) + P (B A c ) = P (B A) P (A) + P (B A c ) P (A c ) Substitutie in (4.9) resulteert uiteindelijk in het volgende resultaat: P (A B) = Voorbeeld 4.6.1: Bevolkingsonderzoek P (B A) P (A) P (B A) P (A) + P (B A c ) P (A c ). (4.1) Met de toenemende mogelijkheden van de medische diagnose-technieken keert herhaaldelijk de discussie terug of het houden van een globaal bevolkingsonderzoek, bv. naar baarmoederhalskanker, naar seropositiviteit,..., nuttig, kosteneffectief en/of sociaal aanvaardbaar is. Beschouw een test naar een infectie met de volgende betrouwbaarheid: P (positief test geïnfecteerd) =.999: dit is de een correcte test P (positief test niet geïnfecteerd) =.1: dit is een vals alarm Indien men weet uit voorafgaande screenings dat.1% van de bevolking geïnfecteerd is, kan men zich de vraag stellen welk percentage van de positieve testen te wijten is aan een vals alarm, m.a.w. hoeveel mensen gaat men nodeloos ongerust maken t.o.v. het aantal juiste diagnoses? Antwoord: 1. Definieer: gebeurtenis A: niet geïnfecteerd, gebeurtenis B: positieve test. 3

32 HOOFDSTUK 4. BESCHRIJVEN VAN TOEVALSVERSCHIJNSELEN Dan wordt P (B A c ) =.999 P (B A) =.1 P (A c ) =.1 P (A) = 1 P (A c ). De kans dat men niet geïnfecteerd is (A), terwijl er toch een positieve test is (B): P (B A) P (A) P (A B) = P (B A) P (A) + P (B A c ) P (A c ) P (B A) (1 P (A c )) = P (B A) (1 P (A c )) + P (B A c ) P (A c ).1 (1.1) =.1 (1.1) Ook de kans op een positieve test kan bepaald worden: P (B) = P (B A) P (A) + P (B A c ) P (A c ) =.1 (1.1) Besluit: het merendeel der positieve testen bij een volledige screening van de bevolking is dus een vals alarm. Voorbeeld 4.6.: Bevolkingsonderzoek (vervolg) Wat is de kans dat men geïnfecteerd is terwijl de test negatief is (de ziekte wordt niet gedetecteerd)? Bepaal P (A c B c )? Antwoord: P (A c B c P (B c A c ) P (A c ) ) = P (B c A) P (A) + P (B c A c ) P (A c ) (1 P (B A c )) P (A c ) = (1 P (B A))(1 P (A c )) + (1 P (B A c )) P (A c ) (1.999).1 = (1.1) (1.1) + (1.999)

33 Hoofdstuk 5 Stochastische variabelen en hun kansverdeling In dit hoofdstuk gaan we een toevalsverschijnsel beschrijven door een variabele. Vervolgens gaan we het gedrag van die variabele beschrijven aan de hand van haar verdelingsfunctie. De volgende begrippen worden ingevoerd: stochastische variabele (discreet/continu) kansverdelingsfunctie en kansdichtheidsfunctie transformatie van variabelen 5.1 Stochastische variabele De steekproefruimten of uitkomstenruimten Ω hoeven niet te bestaan uit getallen. Als we vier muntstukken opgooien, kunnen we de uitkomst vastleggen als een rijtje k s en m s ( kruis en munt ), bv. kmmk. In de statistiek zijn we echter het meest geïnteresseerd in numerieke uitkomsten zoals het aantal k s in 4 worpen. Het is handig een verkorte notatie te gebruiken: X stelt het aantal k s voor. Als onze uitkomst kmmk is, dan is X =. Als de volgende uitkomst mmmk is, verandert de waarde van X in X = 1. Voor 4 worpen zijn de mogelijke waarden van X:, 1,, 3, 4. We noemen X een stochastische variabele (ook wel kansvariabele) omdat zijn waarden op een niet voorspelbare wijze variëren wanneer het opwerpen van de munt wordt herhaald. Bij een toenemend aantal experimenten zal het gemiddeld gedrag (bv. de fractie ) zich wel beter laten voorspellen. 3

34 HOOFDSTUK 5. STOCHASTISCHE VARIABELEN EN HUN KANSVERDELING Een stochastische variabele is een variabele waarvan de waarde een numerieke uitkomst is gehecht aan een toevalsverschijnsel. Definitie 5.1.1: Stochastische variabele De reële functie X van uitkomstenruimten Ω naar R is een stochastiek (of stochastische variabele of toevalsveranderlijke ) als deze afbeelding compatibel is met de structuur van de collectie A van deelverzamelingen in Ω: X : Ω R. Deze compatibiliteit betekent het volgende: 1. Voor ieder reëel getal a is de verzameling {ω Ω X(ω) a} A. De kansen, gedefinieerd op de elementen van A projecteren gewoon mee: P (X a) = P ({ω Ω X(ω) a}) Meestal interesseren we ons meer voor de getalwaarde X(ω) dan voor de elementen ω van de onderliggende verzameling Ω. Als ik schoenen wil verkopen in dit land, is de verdeling van voetlengten het enige wat ik van zijn inwoners wil weten om de goede hoeveelheden van de verschillende maten te kunnen inkopen; ik wil dus iets weten over de getallen voetafmetingen=x(ω) voor iedere inwoner ω Ω. 5. Verdelingsfunctie 5..1 Inleiding en definitie Een van de middelen om een stochastische variabele te beschrijven is de verdelingsfunctie die aangeeft hoe de kansmassa verdeeld is. Definitie 5..1: Verdelingsfunctie Als X een stochastisch variabele is, dan heet de functie F X, met F X (a) = P (X a) (5.1) de verdelingsfunctie van X (ook wel cumulatieve verdelingsfunctie genoemd, of in het Engels: cumulative distribution function of cdf). Merk op dat deze functie discreet of continue kan zijn. Voorbeeld 5..1: F X is discreet Ω = {,,,,, } (5.) = {1 oog, ogen,..., 6 ogen}, (5.3) 33

35 HOOFDSTUK 5. STOCHASTISCHE VARIABELEN EN HUN KANSVERDELING X (k ogen) = k voor k = 1,,..., 6 (5.4) P (X < 1) = P (X k) = k 6 k {1,,..., 6} (5.5) P (X k) = 1 k > 6 Dit is grafisch weergegeven in Figuur 5.1. P(x X) X Figuur 5.1: De verdelingsfunctie van een dobbelsteen. 5.. Eigenschappen van een verdelingsfunctie De eigenschappen van een verdelingsfunctie worden hieronder opgesomd. Eigenschap 5..1: Alle kansen liggen immers tussen nul en een: Eigenschap 5..: F X (a) 1 De verdelingsfunctie is monotoon niet-dalend: Eigenschap 5..3: a b F X (a) F X (b) F X is rechts continu gezien voor ɛ > geldt dat lim F X(a + ε) = F X (a) ε Bij nadering van links kunnen we tegen een sprong oplopen. 34

36 HOOFDSTUK 5. STOCHASTISCHE VARIABELEN EN HUN KANSVERDELING Eigenschap 5..4: Eigenschap 5..5: lim F X(x) = x De kans op een half-open interval wordt gegeven door: lim F X(x) = 1 (5.6) x P (a < X b) = P (X b) P (X a) = F X (b) F X (a) (5.7) P (X > a) = 1 P (X a) = 1 F X (a) (5.8) Eigenschap 5..6: Als we een affiene transformatie Y = ax + b uitvoeren op een stochastiek X, dan transformeert de verdelingsfunctie mee: als a > : F Y (y) = P (Y y) (5.9) = P (ax + b y) (5.1) ( = P X y b ) (5.11) a ( ) y b = F X (5.1) a als a < : ( F Y (y) = P X y b ) a ( = 1 P X < y b ) = 1 F X ( y b a a ) + P ( X = y b ) a (5.13) (5.14) (5.15) ( Opmerking: ) Indien F X een continue ( functie ) is in X = y b a, dan komt P X = y b a met een kans nul voor (P X = y b a = ). 35

37 HOOFDSTUK 5. STOCHASTISCHE VARIABELEN EN HUN KANSVERDELING 5..3 Discrete en continue verdelingsfuncties Voor de eenvoud van de discussies in de rest van deze cursus beschouwen we de discrete en continue verdelingsfunctie als gescheiden gevallen. Definitie 5..: We noemen een stochastiek X discreet als X slechts een eindig aantal, of een aftelbaar oneindig aantal 1, verschillende waarden kan aannemen. M.a.w.: X {x i i = 1,,...} zodat: P (X = x i ) = p i (5.16) i=1 p i = 1 De kansverdeling van een dergelijke verdeling kan worden voorgesteld door een staafdiagram: op het punt x i richten we een staafje op van lengte p i. De cumulatieve verdelingsfunctie F X is dan stuksgewijs constant met sprongen in de punten x i van grootte p i. Een voorbeeld is gegeven in Figuur P(x).1 P(x<=X) X. 1 1 X Figuur 5.: Voorbeeld van een staafdiagram (links) en de bijhorende verdelingsfunctie (rechts). Definitie 5..3: We noemen een stochastische variabele X continu, als de cumulatieve verdelingsfunctie F X overal differentieerbare is (behalve eventueel in een eindig aantal 1 Een aftelbare verzameling is niet noodzakelijk eindig. De gehele getallen zijn aftelbaar gezien we ze kunnen in een rij zetten om geteld te worden:, 1, -1,, -, 3, -3, enz. Het tellen van de elementen stopt weliswaar nooit. 36

38 HOOFDSTUK 5. STOCHASTISCHE VARIABELEN EN HUN KANSVERDELING punten). f X (x) = df X(x) dx of F X (x) = ˆ x (5.17) f X (t)dt (5.18) f X (x) noemen we de kansdichtheidsfunctie (in het Engels: probability density function of pdf). Merk op: aangezien F X monotoon niet-dalend is, is f X (x), x. Aangezien de totale kansmassa gelijk is aan 1, moeten de staarten van f X naar gaan. Een voorbeeld van een continue verdeling (de normaal verdeling) is gegeven in Figuur Normaal verdeling.4 f X (x) X 1.8 F X (x) X Figuur 5.3: Voorbeeld van een continue verdeling: de normaal verdeling Niet-lineaire transformatie van een continue stochastische variabele Beschouw een continue stochastische variabele X met kansdichtheidsfunctie f X (x). De vraag is nu: wat is de kansdichtheidsfunctie van de stochastische 37

Toegepaste Statistiek

Toegepaste Statistiek Faculteit Ingenieurswetenschappen - Wetenschappen Toegepaste Statistiek Prof. dr. ir. Gerd Vandersteen 8 mei 8 Inhoudsopgave Inhoudsopgave Lijst van figuren.............................. 4 Lijst van tabellen..............................

Nadere informatie

Statistiek I Samenvatting. Prof. dr. Carette

Statistiek I Samenvatting. Prof. dr. Carette Statistiek I Samenvatting Prof. dr. Carette Opleiding: bachelor of science in de Handelswetenschappen Academiejaar 2016 2017 Inhoudsopgave Hoofdstuk 1: Statistiek, gegevens en statistisch denken... 3 De

Nadere informatie

Samenvatting Statistiek

Samenvatting Statistiek Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door

Nadere informatie

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2WS4, dinsdag 17 juni 28, van 9. 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Hoofdstuk 3 : Numerieke beschrijving van data Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Numerieke beschrijving van data p 1/31 Beschrijvende

Nadere informatie

Voorbeeld 1. Statistiek voor Informatica Hoofdstuk 3: Stochastische Variabelen en Verdelingen. Voorbeeld 2A. Voorbeeld 1 (vervolg)

Voorbeeld 1. Statistiek voor Informatica Hoofdstuk 3: Stochastische Variabelen en Verdelingen. Voorbeeld 2A. Voorbeeld 1 (vervolg) Voorbeeld Statistiek voor Informatica Hoofdstuk 3: Stochastische Variabelen en Verdelingen Cursusjaar 2009 Peter de Waal Departement Informatica In een eperiment gooien we 4 maal met een zuivere munt.

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

Medische Statistiek Kansrekening

Medische Statistiek Kansrekening Medische Statistiek Kansrekening Medisch statistiek- kansrekening Hoorcollege 1 Uitkomstenruimte vaststellen Ook wel S of E. Bij dobbelsteen: E= {1,2,3,4,5,6} Een eindige uitkomstenreeks Bij het gooien

Nadere informatie

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99 Inhoud 1 Inleiding tot de beschrijvende statistiek 13 1.1 Een eerste verkenning 14 1.2 Frequentieverdelingen 22 1.3 Grafische voorstellingen 30 1.4 Diverse diagrammen 35 1.5 Stamdiagram, histogram en frequentiepolygoon

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1) Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

Meten en experimenteren

Meten en experimenteren Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006 Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie

Nadere informatie

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur Tentamen Kansrekening en Statistiek MST 14 januari 2016, 14.00 17.00 uur Het tentamen bestaat uit 15 meerkeuzevragen 2 open vragen. Een formuleblad wordt uitgedeeld. Normering: 0.4 punt per MC antwoord

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

1. Statistiek gebruiken 1

1. Statistiek gebruiken 1 Hoofdstuk 0 Inhoudsopgave 1. Statistiek gebruiken 1 2. Gegevens beschrijven 3 2.1 Verschillende soorten gegevens......................................... 3 2.2 Staafdiagrammen en histogrammen....................................

Nadere informatie

Vertaling van enkele termen uit de kansrekening en statistiek alternative hypothesis alternatieve hypothese approximate methods benaderende methoden asymptotic variance asymptotische variantie asymptotically

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Statistiek: Herhaling en aanvulling

Statistiek: Herhaling en aanvulling Statistiek: Herhaling en aanvulling 11 mei 2009 1 Algemeen Statistiek is de wetenschap die beschrijft hoe we gegevens kunnen verzamelen, verwerken en analyseren om een beter inzicht te krijgen in de aard,

Nadere informatie

1. De wereld van de kansmodellen.

1. De wereld van de kansmodellen. STATISTIEK 3 DE GRAAD.. De wereld van de kansmodellen... Kansmodellen X kansmodel Discreet model Continu model Kansverdeling Vaas Staafdiagram Dichtheidsfunctie f(x) GraJiek van f Definitie: Een kansmodel

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert VOOR HET SECUNDAIR ONDERWIJS Kansmodellen 4. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg . Een concreet voorbeeld.... Een kansmodel

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS

VOOR HET SECUNDAIR ONDERWIJS VOOR HET SECUNDAIR ONDERWIJS Steekproefmodellen en normaal verdeelde steekproefgrootheden 5. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg

Nadere informatie

Les 2 / 3: Meetschalen en Parameters

Les 2 / 3: Meetschalen en Parameters Les 2 / 3: Meetschalen en Parameters I Theorie: A. Algemeen : V is de verzameling van alle mogelijke uitkomsten van een toevallig experiment. Een veranderlijke of stochastiek is een afbeelding G die aan

Nadere informatie

Statistiek, gegevens en een kritische houding

Statistiek, gegevens en een kritische houding Statistiek Hoofdstuk 1. Statistiek, gegevens en een kritische houding 1.1. Statistiek 1.2. De wetenschap statistiek de wetenschap van gegevens verzamelen evalueren (classificeren, samenvatten, organiseren,

Nadere informatie

36, P (5) = 4 36, P (12) = 1

36, P (5) = 4 36, P (12) = 1 Les 2 Kansverdelingen We hebben in het begin gesteld dat we de kans voor een zekere gunstige uitkomst berekenen als het aantal gunstige uitkomsten gedeelt door het totale aantal mogelijke uitkomsten. Maar

Nadere informatie

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel. 9.0 Voorkennis Bij samengestelde kansexperimenten maak je gebruik van de productregel. Productregel: Voor de gebeurtenis G 1 bij het ene kansexperiment en de gebeurtenis G 2 bij het andere kansexperiment

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 15 Dinsdag 2 November 1 / 16 2 Statistiek Indeling: Filosofie Schatten Centraal Bureau voor Statistiek 2 / 16 Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens:

Nadere informatie

Hoofdstuk 4 Kansen. 4.1 Randomheid

Hoofdstuk 4 Kansen. 4.1 Randomheid Hoofdstuk 4 Kansen 4.1 Randomheid Herhalingen en kansen Als je een munt opgooit (of zelfs als je een SRS trekt) kunnen de resultaten van tevoren voorspeld worden, omdat de uitkomsten zullen variëren wanneer

Nadere informatie

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn Statistiek: Spreiding en dispersie 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Met spreiding willen we in één getal uitdrukken hoe verspreid de gegevens zijn: in hoeveel

Nadere informatie

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan. Afdeling Wiskunde Volledig tentamen Statistics Deeltentamen 2 Statistics Vrije Universiteit 28 mei 2015 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen: opgaven 1,2,3,4. Cijfer=

Nadere informatie

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions cursus 4 mei 2012 werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions Huiswerk P&D, opgaven Chapter 6: 9, 19, 25, 33 P&D, opgaven Appendix A: 1, 9 doen

Nadere informatie

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten Deze week: Steekproefverdelingen Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen Cursusjaar 29 Peter de Waal Zuivere Schatters Betrouwbaarheidsintervallen Departement Informatica Hfdstk

Nadere informatie

Inleiding Kansrekening en Statistiek

Inleiding Kansrekening en Statistiek Inleiding Kansrekening en Statistiek Inleiding Kansrekening en Statistiek S.J. de Lange VSSD 4 VSSD Eerste druk 1989 Tweede druk 1991-2007 Uitgegeven door de VSSD Poortlandplein 6, 2628 BM Delft, The Netherlands

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling 12.0 Voorkennis Voorbeeld 1: Yvette pakt vier knikkers uit een vaas waar er 20 inzitten. 9 van de knikkers zijn rood en 11 van de knikkers zijn blauw. X = het aantal rode knikkers dat Yvette pakt. Er zijn

Nadere informatie

Meten en experimenteren

Meten en experimenteren Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 6 oktober 009 Catherine De Clercq Statistische verwerking van gegevens Kursus statistiek voor fysici door Jorgen D Hondt

Nadere informatie

CVO PANTA RHEI - Schoonmeersstraat 26 9000 GENT 09 335 22 22. Soorten stochastische variabelen (discrete versus continue)

CVO PANTA RHEI - Schoonmeersstraat 26 9000 GENT 09 335 22 22. Soorten stochastische variabelen (discrete versus continue) identificatie opleiding Marketing modulenaam Statistiek code module A12 goedkeuring door aantal lestijden 80 studiepunten datum goedkeuring structuurschema / volgtijdelijkheid link: inhoud link leerplan:

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 8 Donderdag 13 Oktober 1 / 23 2 Statistiek Vandaag: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 23 Stochast en populatie

Nadere informatie

Schatten en simuleren

Schatten en simuleren Les 5 Schatten en simuleren 5.1 Maximum likelihood schatting Tot nu toe hebben we meestal naar voorbeelden gekeken waar we van een kansverdeling zijn uitgegaan en dan voorspellingen hebben gemaakt. In

Nadere informatie

Kansrekening en stochastische processen 2DE18

Kansrekening en stochastische processen 2DE18 Kansrekening en stochastische processen 2DE18 Docent : Jacques Resing E-mail: resing@win.tue.nl 1/28 The delta functie Zij De eenheids impulsfunctie is: d ε (x) = { 1ε als ε 2 x ε 2 0 anders δ(x) = lim

Nadere informatie

Statistiek voor A.I. College 6. Donderdag 27 September

Statistiek voor A.I. College 6. Donderdag 27 September Statistiek voor A.I. College 6 Donderdag 27 September 1 / 1 2 Deductieve statistiek Kansrekening 2 / 1 Vraag: Afghanistan In het leger wordt uit een groep van 6 vrouwelijke en 14 mannelijke soldaten een

Nadere informatie

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

Statistiek voor A.I. College 10. Dinsdag 16 Oktober Statistiek voor A.I. College 10 Dinsdag 16 Oktober 1 / 30 Jullie - onderzoek Geert-Jan, Joris, Brechje Horizontaal: lengte Verticaal: lengte tussen topjes middelvingers met gestrekte armen. DIII 170 175

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

Formules Excel Bedrijfsstatistiek

Formules Excel Bedrijfsstatistiek Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

Les 1: Waarschijnlijkheidrekening

Les 1: Waarschijnlijkheidrekening Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het

Nadere informatie

Onderzoeksmethodiek LE: 2

Onderzoeksmethodiek LE: 2 Onderzoeksmethodiek LE: 2 3 Parameters en grootheden 3.1 Parameters Wat is een parameter? Een karakteristieke grootheid van een populatie Gem. gewicht van een 34-jarige man 3.2 Steekproefgrootheden Wat

Nadere informatie

Hoofdstuk 6 Discrete distributies

Hoofdstuk 6 Discrete distributies Hoofdstuk 6 Discrete distributies Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Discrete distributies p 1/33 Discrete distributies binomiale verdeling

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Empirische kansen = op ervaring gegrond; bereken je door relatieve frequenties te gebruiken. Wet van de grote aantallen.

Empirische kansen = op ervaring gegrond; bereken je door relatieve frequenties te gebruiken. Wet van de grote aantallen. Samenvatting Kansen Definitie van Laplace : P(G) = aantal _ gunstige _ uitkomsten aantal _ mogelijke _ uitkomsten Voorbeeld : Vb kans op 4 gooien met dobbelsteen: Aantal gunstige uitkomsten = 1 ( namelijk

Nadere informatie

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Populatie: De gehele groep elementen waarover informatie wordt gewenst. Statistiek I Werkcollege 1 Populatie: De gehele groep elementen waarover informatie wordt gewenst. Steekproef: Gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren. Eenheden:

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert VOOR HET SECUNDAIR ONDERWIJS Kansmodellen. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg . Populatie: een intuïtieve definitie.... Een

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen

Nadere informatie

Meten en experimenteren

Meten en experimenteren Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 5 oktober 007 Catherine De Clercq Statistische verwerking van gegevens Kursus statistiek voor fysici door Jorgen D Hondt

Nadere informatie

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 5: Sampling Distributions 5.1: The

Nadere informatie

HOOFDSTUK I - INLEIDENDE BEGRIPPEN

HOOFDSTUK I - INLEIDENDE BEGRIPPEN HOOFDSTUK I - INLEIDENDE BEGRIPPEN 1.2 Kansveranderlijken en verdelingen 1 Veranderlijken Beschouw een toevallig experiment met uitkomstenverzameling V (eindig of oneindig), de verzameling van alle gebeurtenissen

Nadere informatie

Examenprogramma wiskunde D vwo

Examenprogramma wiskunde D vwo Examenprogramma wiskunde D vwo Het eindexamen Het eindexamen bestaat uit het schoolexamen. Het examenprogramma bestaat uit de volgende domeinen: Domein A Vaardigheden Domein B Kansrekening en statistiek

Nadere informatie

WISKUNDE D VWO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0

WISKUNDE D VWO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0 WISKUNDE D VWO VAKINFORMATIE STAATSEAMEN 2016 V15.7.0 De vakinformatie in dit document is vastgesteld door het College voor Toetsen en Examens (CvTE). Het CvTE is verantwoordelijk voor de afname van de

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1 Statistiek II Sessie 1 Verzamelde vragen en feedback Deel 1 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 1 1 Staafdiagram 1. Wat is de steekproefgrootte? Op de horizontale as vinden we de respectievelijke

Nadere informatie

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 5: Steekproevendistributies Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Deze week: Verdelingsfuncties. Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties. Bernoulli verdeling. Bernoulli verdeling.

Deze week: Verdelingsfuncties. Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties. Bernoulli verdeling. Bernoulli verdeling. Deze week: Verdelingsfuncties Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties Cursusjaar 29 Peter de Waal Toepassingen Kansmassafuncties / kansdichtheidsfuncties Eigenschappen Departement Informatica

Nadere informatie

Het tentamen heeft 25 onderdelen. Met ieder onderdeel kan maximaal 2 punten verdiend worden.

Het tentamen heeft 25 onderdelen. Met ieder onderdeel kan maximaal 2 punten verdiend worden. Hertentamen Inleiding Kansrekening WI64. 9 augustus, 9:-: Het tentamen heeft 5 onderdelen. Met ieder onderdeel kan maximaal punten verdiend worden. Het tentamen is open boek. Boeken, nota s en een (eventueel

Nadere informatie

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Afdeling Wiskunde Volledig tentamen Algemene Statistiek Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen:

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Moore, McCabe & Craig: 3.3 Toward Statistical Inference From Probability to Inference 5.1 Sampling Distributions for

Nadere informatie

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen) Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen) 8.16. Men wenst H 0 : p 0.2 te testen tegenover H 1 : p 0.4 voor een binomiale distributie met n 10. Bepaal α en β als de testfunctie gegeven

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Voorbeelden van gebruik van 5 VUSTAT-apps

Voorbeelden van gebruik van 5 VUSTAT-apps Voorbeelden van gebruik van 5 VUSTAT-apps Piet van Blokland Begrijpen van statistiek door simulaties en visualisaties Hoe kun je deze apps gebruiken bij het statistiek onderwijs? De apps van VUSTAT zijn

Nadere informatie

Elementaire Statistiek

Elementaire Statistiek Elementaire Statistiek Elementaire Statistiek J. van Soest VSSD VSSD Zevende druk 1992, 1994, 1997 Eerste druk 1972 Uitegegeven door: VSSD Leeghwaterstraat 42 2628 CA Delft, The Netherlands tel. +31 15

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

Examenprogramma wiskunde A vwo

Examenprogramma wiskunde A vwo Examenprogramma wiskunde A vwo Het eindexamen Het eindexamen bestaat uit het centraal examen en het schoolexamen. Het examenprogramma bestaat uit de volgende domeinen: Domein A Vaardigheden Domein Bg Functies

Nadere informatie

Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements

Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements Sietske Tacoma, Susanne Tak, Henk Hietbrink en Wouter van Joolingen Inleiding Het doel van dit project is om een aantal vrij

Nadere informatie

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en empirische distributies

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en empirische distributies Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en empirische distributies 6.. Uit een normaal verdeeld universum X met gemiddelde waarde µ = en standaardafwijking σ = worden 0 onafhankelijke steekproefwaarden

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 13 Dinsdag 1 November 1 / 26 2 Statistiek Vandaag: Power Grootte steekproef Filosofie 2 / 26 Power 3 / 26 Power Def. De power (kracht) van een hypothese toets is (1 β),

Nadere informatie

SOCIALE STATISTIEK (deel 2)

SOCIALE STATISTIEK (deel 2) SOCIALE STATISTIEK (deel 2) D. Vanpaemel KU Leuven D. Vanpaemel (KU Leuven) SOCIALE STATISTIEK (deel 2) 1 / 57 Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele D. Vanpaemel

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

Een Bernoulli experiment is een experiment met slechts twee mogelijke uitkomsten, die we succes ( S ) en mislukking ( M ) noemen.

Een Bernoulli experiment is een experiment met slechts twee mogelijke uitkomsten, die we succes ( S ) en mislukking ( M ) noemen. Hoofdstuk 6 Kansverdelingen 6.1 Discrete stochasten 6.1.1 De Bernoulli verdeling Een Bernoulli experiment is een experiment met slechts twee mogelijke uitkomsten, die we succes ( S ) en mislukking ( M

Nadere informatie

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN. Continue Verdelingen 1 A. De uniforme (of rechthoekige) verdeling Kansdichtheid en cumulatieve frequentiefunctie Voor x < a f(x) = 0 F(x) = 0 Voor a x

Nadere informatie

Beschrijvend statistiek

Beschrijvend statistiek 1 Beschrijvend statistiek 1. In een school werd het intelligentiequotiënt gemeten van de leerlingen van het zesde jaar (zie tabel). De getallen werden afgerond tot op de eenheid. De berekeningen mogen

Nadere informatie

Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal. Toets Kansrekenen I. 28 maart 2014

Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal. Toets Kansrekenen I. 28 maart 2014 Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal Toets Kansrekenen I 28 maart 2014 Naam : Richting : Lees volgende aanwijzingen alvorens aan het examen te beginnen Wie de

Nadere informatie

Statistiek voor A.I. College 4. Donderdag 20 September 2012

Statistiek voor A.I. College 4. Donderdag 20 September 2012 Statistiek voor A.I. College 4 Donderdag 20 September 2012 1 / 30 2 Deductieve statistiek Kansrekening 2 / 30 Cycle 3 / 30 Context 4 / 30 2 Deductieve statistiek Vandaag: Eigenschappen kansen Oneindige

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

Inleiding statistiek

Inleiding statistiek Inleiding Statistiek Pagina 1 uit 8 Inleiding statistiek 1. Inleiding In deze oefeningensessie is het de bedoeling jullie vertrouwd te maken met een aantal basisbegrippen van de statistiek, meer bepaald

Nadere informatie

introductie kansen pauze meer kansen random variabelen transformaties ten slotte

introductie kansen pauze meer kansen random variabelen transformaties ten slotte toetsende statistiek week 1: kansen en random variabelen Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 4: Probability: The Study of Randomness 4.1: Randomness 4.2: Probability

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

14.1 Kansberekeningen [1]

14.1 Kansberekeningen [1] 14.1 Kansberekeningen [1] Herhaling kansberekeningen: Somregel: Als de gebeurtenissen G 1 en G 2 geen gemeenschappelijke uitkomsten hebben geldt: P(G 1 of G 2 ) = P(G 1 ) + P(G 2 ) B.v. P(3 of 4 gooien

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie