Beschrijvend statistiek

Vergelijkbare documenten
HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

4 HAVO wiskunde A HOOFDSTUK voorkennis 1. soorten verdelingen 2. de normale verdeling 3. betrouwbaarheidsintervallen 4. groepen en kenmerken

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Kansrekening en Statistiek

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Paragraaf 5.1 : Frequentieverdelingen

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Examen Data Analyse II - Deel 2

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Les 1: Waarschijnlijkheidrekening

2 Data en datasets verwerken

Kansrekening en Statistiek

2. In de klassen 2A en 2B is een proefwerk gemaakt. Je ziet de resultaten in de frequentietabel. 2A 2B

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Les 1: Waarschijnlijkheidrekening

Hoofdstuk 5 Een populatie: parametrische toetsen

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en empirische distributies

2.1.4 Oefenen. d. Je ziet hier twee weegschalen. Wat is het verschil tussen beide als het gaat om het aflezen van een gewicht?

Samenvatting Wiskunde A

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

Statistiek: Herhaling en aanvulling

Voorbeeldtentamen Statistiek voor Psychologie

Kansrekening en Statistiek

Kerstvakantiecursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven HAVO kan niet korter

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Examen Statistiek I Feedback

Werkblad 1 Normale dichtheidsfunctie als benadering voor een klokvormig histogram

Statistiek I Samenvatting. Prof. dr. Carette

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Toetsen van hypothesen

Kansrekening en Statistiek

8.1 Centrum- en spreidingsmaten [1]

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Niet de hoogte, wel de oppervlakte. Aandachtspunten bij. - statistische technieken voor een continue veranderlijke

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

Rekenen met de normale verdeling (met behulp van grafisch rekentoestel)

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Lesbrief hypothesetoetsen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Populaties beschrijven met kansmodellen

Havo A deel 1 H2 Statistiek - Samenvatting

Statistiek voor A.I.

Formules Excel Bedrijfsstatistiek

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Oefenvragen bij Statistics for Business and Economics van Newbold

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

1. De wereld van de kansmodellen.

TIP 10: ANALYSE VAN DE CIJFERS

Herkansing eindtoets statistiek voor HBO

OEFENPROEFWERK HAVO A DEEL 2

Meten en experimenteren

Samenvatting Statistiek

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Examen Statistiek I Januari 2010 Feedback

4-8 juni 2007 NAAM:...

GEOGEBRAINSTITUUT. VlAANDEREN

Samenvattingen 5HAVO Wiskunde A.

Toetsen van Hypothesen. Het vaststellen van de hypothese

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

Kansrekening en Statistiek

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Betrouwbaarheid van een steekproefresultaat m.b.t. de hele populatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Samenvatting Wiskunde Samenvatting en stappenplan van hfst. 7 en 8

15.1 Beslissen op grond van een steekproef [1]

Steelbladdiagram In een steelbladdiagram staan alle leerlingen genoemd. Je kunt precies zien waar Wouter staat.

2 Data en datasets verwerken

Examen G0N34 Statistiek

S0A17D: Examen Sociale Statistiek (deel 2)

Inleiding Applicatie Software - Statgraphics

Inleiding tot de meettheorie

Hoofdstuk 6 Twee populaties: parametrische toetsen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Beschrijvende statistiek

STATISTIEK OEFENOPGAVEN

Les 2 / 3: Meetschalen en Parameters

2 Data en datasets verwerken

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Transcriptie:

1 Beschrijvend statistiek 1. In een school werd het intelligentiequotiënt gemeten van de leerlingen van het zesde jaar (zie tabel). De getallen werden afgerond tot op de eenheid. De berekeningen mogen met EXCEL uitgevoerd worden, die dan samen met de nodige grafieken uitgeprint worden. Neem een apart examenblad om de vragen te beantwoorden. Gevraagd: (a) Wat is hier de aard van de statistische data; (b) Is de data continu of discreet en waarom? (c) Hoeveel waarnemingsgetallen zijn er? (d) Bereken alle parameters; (e) Stel de frequentietabel op met de absolute, relatieve frequenties en cumulatieve frequenties; (f) Maak een histogram, een ogief en een boxplot. (g) Interpretatie van de verzamelde gegevens i. Wat is het gemiddelde intelligentiequoti ënt van deze leerlingen? ii. Wat is de betekenis van het feit dat het gemiddelde groter is dan de mediaan? iii. Hoeveel procent van de leerlingen heeft een intelligentiequoti ënt kleiner dan 80 en hoeveel groter dan 100? iv. Hoeveel procent van de leerlingen heeft een intelligentiequoti ënt tussen 95 en 105? v. Welk intelligentiequotint moet een leerling hebben om tot de top van 10% meest intelligente leerlingen te behoren? vi. Welk intelligentiequoti ënt moet een leerling hebben om te behoren tot de middenmoot waartoe de helft van de leerlingen behoren? Tussen welke twee waarden rond het gemiddelde zou normaal ongeveer 68% van de waarnemingsgegeven liggen? Controleer dat hier op het ogief. (2001) 72 143 66 102 106 74 111 52 102 111 111 83 113 89 72 44 84 95 94 120 127 61 98 94 78 105 88 125 101 91 86 102 83 98 94 95 87 99 107 114 80 86 99 91 55 80 101 114 98 61 131 105 94 100 94 78 68 87 109 98 94 86 86 70 100 94 77 115 96 80 99 100 84 99 103 111 95 106 98 102 2. In de jaren 50 wou men statistieken opmaken betreffende het aantal kinderen in normale volgroeide gezinnen. Willekeurig worden 100 gezinnen uitgekozen (zie tabel). (2002)

2 (a) Wat is hier de aard van de statistische variabele; (b) Is de data continu of discreet en waarom? (c) Bepaal met EXCEL het minimum, het maximum, het rekenkundig gemiddelde, de standaardafwijking, de modus en de kwartielen van de ruwe gegevens. Leg de betekenis uit aan de hand van deze waarnemingsgegevens; (d) Maak de gepaste grafische voorstelling van de relatieve frequenties van de waarnemingsgegevens; (e) Hoeveel procent van de gezinnen heeft minder kinderen dan het gemiddelde. 1 3 3 1 2 4 5 0 6 2 2 0 1 3 4 5 2 3 7 8 5 3 2 2 7 6 0 8 4 3 3 4 5 3 1 7 2 3 10 4 7 1 2 9 3 2 0 4 5 6 3 2 4 3 2 0 5 6 4 7 4 3 4 2 3 1 7 3 5 2 0 4 1 5 4 3 1 6 2 8 2 9 3 1 6 4 4 2 5 3 6 2 4 5 2 3 4 3 1 6 3. In een kraamkliniek werden bij 1690 baby s de lengte genoteerd en de waarnemingsgetallen gegroepeerd in klassen van 2 cm. Gevraagd: f i ]39, 41] 9 ]41, 43] 11 ]43, 45] 37 ]45, 47] 114 ]47, 49] 380 ]49, 51] 721 ]51, 53] 335 ]53, 55] 68 ]55, 57] 14 ]57, 59] 1 (a) Bereken met EXCEL het rekenkundig gemiddelde en de standaardafwijking van deze stochastische veranderlijke Xi (b) Bepaal de modus; (c) Teken de gepaste grafische voorstelling van de relatieve frequenties.

3 (d) Hoe kan je hier de kwartielen bepalen. Maak een boxplot. (2002) Betrouwbaarheidsintervallen 1. Men schat dat ongeveer 70% van de Vlaamse gezinnen beschikt over een DVDspeler. Welke gsteekproefgrootte moeten men nemen om de werkelijke proportie met een waarschijnlijkheid van 99% te kennen met een foutenmarge kleiner dan 1%? (n > 54) 2. De tijd, nodig om één bepaalde handeling uit te voeren, is normaal verdeeld met een standaardafwijking van 36,36 sec. Als je weet dat op basis van een steekproef met steekproefgrootte 400, de gemiddelde tijd zich bevindt in het interval [478sec; 484sec], wat was dan het betrouwbaarheidsniveau? 3. Van 400 lukraak gekozen kiezers verklaren er 216 te zullen stemmen op kandidaat Y. Bereken voor het ganse kiesdistrict het 95%-betrouwbaarheidsinterval voor de proportie kiezers van deze kandidaat. 4. Het verbruik van je wagen is normaal verdeeld met een variantie van 0.5 l 2. Een meting bestaat erin 1000 km te rijden en het verbruik op die 100 km te noteren. Je wil een 99% betrouwbaarheidsniinterval met een lengte die hoogstens 1.2 l bedraagt. Hoeveel metingen moet je hiervoor uitvoeren? 5. Een statistiekbureau vroeg via een steekproef aan 1785 volwassen Amerikanen: Hebt u in de afgelopen 7 dagen een kerk bezocht? Van de ondervraagden antwoordden 750 met ja. Op basis van die gegevens kunnen we het 99% betrouwbaarheidinterval berekenen voor de fractie van alle volwassen Amerikanen die in de week voorafgaande aan de peiling een kerk bezochten. (a) Bereken dit 99% betrouwbaarheidsinterval [a, b]. Duid hieronder aan als de redenering die gemaakt wordt juist is of fout en argumenteer. (b) Het 95% betrouwbaarheidsinterval voor de fractie van alle volwassen Amerikanen die in de week voorafgaande aan de peiling een kerk bezochten is breder dan het 99%-betrouwbaarheidsinterval. (c) a en b zijn de kleinste en de grootste mogelijke waarden voor de fractie van alle volwassenen die in de week voorafgaande aan de peiling een kerk bezochten. (d) Op basis van het 99%-betrouwbaarheidsinterval kunnen we redelijkerwijze aannemen dat minder dan de helft van de volwassen Amerikanen een kerk in de week voorafgaande aan de peiling bezochten. (e) Op basis van het 99%-betrouwbaarheidsinterval kunnen we redelijkerwijze aannemen dat de fractie van de volwassen Amerikanen die een kerk in de week voorafgaande aan de peiling bezochten tussen a en b ligt.

4 (f) Indien de steekproefgrootte wordt vermeerderd krijg je een groter betrouwbaarheidsinterval. Toetsen van hypothese - Eén proportie 1. Een farmaceutisch bedrijf beweert een geneesmiddel geproduceerd te hebben hetwelk in 24 uren de influenza geneest in 90% van de gevallen. Men beproeft het geneesmiddel bij 200 zieken waarvan er 160 genezen binnen de gestelde tijd. Ga na of de bewering van de firma gerechtvaardigd is op significantieniveau 0, 01 en 0, 05? (1999) 2. Iemand beweert dat 90% van de mensen niet in staat is het verschil te proeven tussen twee soorten limonade. De fabrikanten vinden dat overdreven en doen een test. (a) Bij 500 lukraak gekozen personen waren er 72 die het verschil proefden. Is de bewering overdreven? (b) Wat is de conclusie voor een kleine steekproef? Wat besluit je als er bij 10 lukraak gekozen personen er 2 zijn die het verschil proeven? Verklaar waarom we verschillende resultaten krijgen in a) als in b), niettegenstaande in b) in verhouding meer mensen zijn die het verschil proeven dan in a). (c) Wat is het verband tussen de standaardafwijking in a) en de standaardafwijking in b)? (2000) 3. In een bevolkingsgroep zijn er 5% mensen die een bril dragen. In een andere bevolkingsgroep dragen 6% mensen een bril. We doen een steekproef bij 55 mensen uit één van de twee bevolkingsgroepen. We constateren dat er 3 mensen een bril dragen. Kunnen we op significantieniveau van 0,05 aanvaarden dat we in de eerste bevolkingsgroep onze steekproef gehouden hebben. Wat is het kritische punt? Geef hier de nulhypothese en de alternatieve hypothese. Wat is de kans op een type I fout. Wat is de kans op een type II fout en wat is de power van de test? (2004) 4. Een farmaceutisch bedrijf beweert een geneesmiddel geproduceerd te hebben hetwelk in 24 uren de influenza geneest in 90% van de gevallen. Men beproeft het geneesmiddel bij 200 zieken waarvan er 171 genezen binnen de gestelde tijd. Ga na of de bewering van de firma gerechtvaardigd is op significantieniveau 0,01 en 0,05 (eenzijdige toets)? (2002) 5. Delphine beweert dat de kans dat een opgeworpen punaise met de punt omhoog ligt na het vallen 50% is. Dit is de nulhypothese. Morgane beweert dat het 35% is. Ze zullen hun hypothese testen door de punaise 120 keer op te werpen. (a) Hoeveel keer moet de punaise met de punt omhoog liggen bij het vallen opdat de nulhypothese niet verworpen zou worden op significantieniveau van 5%. (vanaf 51)

5 (b) Bepaal op significantieniveau van 5% de kans op een type II fout.(0.0533) (c) Bereken op significantieniveau van 5% de power van de tetst.(0.9467) (d) Bij welke significantieniveau s kan men testen opdat is de kans op een type II fout kleiner zou zijn dan 10%. (groter dan 0.02739) (2005) 6. Simon steekt 7 balletjes in een vaas. Hij gaat nu bij Jolien en laat haar raden uit twee mogelijkheden: ofwel zitten er 2 blauwe en 5 gele balletjes in de vaas (H 0 ) ofwel zitten er 5 blauwe en twee gele balletjes in de vaas (H 1 ). Jolien mag eerst zonder terugleggen twee balletjes uit de vaas halen. Hij besluit voor de hypothese H 0 te kiezen van zodra er een geel balletjes bijzit. (a) Bereken de kans op een type I fout; (b) Bereken de kans op een type II fout; (c) Bereken de Power van de test. Toetesen van Hypothesen - Twee proporties 1. Een bioloog wil nagaan of ratten die weinig eten langer leven dan ratten die normaal eten. Twaalf ratten krijgen een sober dieet en daarvan zijn er acht die langer leven dan normaal. Tien ratten eten normaal en daarvan is er één rat die langer leeft. (a) Is het volgen van een dieet de moeite waard om langer te leven op significantieniveau 0.05 (voor de ratten)? (b) Wat is van de twaalf ratten het minimum aantal dat langer moet leven opdat de hypothese?een sober dieet verlengt het leven? op significantieniveau 0.05 zou stand houden? (c) Beantwoord dezelfde vragen a. en b. als we in de steekproef alle gegevens met 10 vermenigvuldigen. (1998) (2001) (2003) 2. Voor een bepaalde ziekte wordt een nieuwe therapie uitgetest t.o.v. de oude therapie. Daartoe werden 30 patiënten lukraak toegewezen aan één van beide behandelingen. Na verloop van vier weken telt men hoeveel patiënten volledig genezen zijn. Van de 16 patiënten die de nieuwe therapie volgden, genazen er 12 en van de 14 overige genazen er 6. Is de nieuwe therapie significant beter dan de oude? Maak hierbij een viervelden tabel en geef de formule voor de hypergeometrische verdeling. Wat is hier het gemiddeld aantal genezingen dat men bij de nieuwe therapie (oude therapie) zeker kan verwachten als de nieuwe therapie niet significant beter is dan het oude? (2000) (2004) 3. Om het effect van een nieuw griepvaccin te evalueren heeft men in een dorp aan 891 inwoners de kans gegeven gratis van het vaccin gebruik te maken. Sommige mensen kwamen niet opdagen. De volgende lente heeft men volgende gegevens opgenomen in een contingentietabel. Is er een reden om aan te nemen dat er afhankelijkheid is tussen vaccinatie en het al of niet optreden van griep? (2005)

6 griep geen griep niet ingeënt 24 289 313 ingeënt 13 565 578 37 891 4. Beschouw een klinische studie waarbij een behandeling met een medicament vergeleken wordt met een placebo behandeling. Van de 12 patiënten in de medicament groep zijn er 9 en van de 13 in de placebo groep zijn er 4 patiënten die een verbetering van hun toestand verklaarden. Is dit een significant verschil?