Statistiek basisbegrippen

Vergelijkbare documenten
Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

Samenvattingen 5HAVO Wiskunde A.

Onderzoeksmethodiek LE: 2

Hoofdstuk 1. De steekproefopzet bepalen

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

4 HAVO wiskunde A HOOFDSTUK voorkennis 1. soorten verdelingen 2. de normale verdeling 3. betrouwbaarheidsintervallen 4. groepen en kenmerken

A. Statistiek en steekproeven

Paragraaf 5.1 : Frequentieverdelingen

Hoofdstuk 7: Selectie van steekproeven

Overzicht statistiek 5N4p

Hoofdstuk 13. De omvang van een steekproef bepalen

Y = ax + b, hiervan is a de richtingscoëfficiënt (1 naar rechts en a omhoog), en b is het snijpunt met de y-as (0,b)

Statistische variabelen. formuleblad

Examen PC 2 Financiële Rekenkunde

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

2. In de klassen 2A en 2B is een proefwerk gemaakt. Je ziet de resultaten in de frequentietabel. 2A 2B

VOOR HET SECUNDAIR ONDERWIJS

Feedback proefexamen Statistiek I

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Examen Statistiek I Feedback

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

UITWERKINGEN OPGAVEN HOOFDSTUK 2

Havo A deel 1 H2 Statistiek - Samenvatting

Programma : 1. Presentatie 2. H 5.1 Statistiek zelf gegevens verzamelen en ermee werken 3. Vragen over H4, formules

ALGEMENE ECONOMIE /03

3.1 Procenten [1] In 1994 zijn er 3070 groentewinkels in Nederland. In 2004 zijn dit er nog 1625.

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

8.1 Centrum- en spreidingsmaten [1]

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

Les 1 Kwaliteitsbeheersing. Les 2 Kwaliteitsgegevens. Les 3 Introductie Statistiek. Les 4 Normale verdeling. Kwaliteit

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

WISKUNDE A HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0

WISKUNDE C VWO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0

Data analyse Inleiding statistiek

2 Data en datasets verwerken

Samenvatting Wiskunde Hoofdstuk

College Week 4 Inspecteren van Data: Verdelingen

Wiskunde D Online uitwerking 4 VWO blok 5 les 3

TIP 10: ANALYSE VAN DE CIJFERS

Kerstvakantiecursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven HAVO kan niet korter

Leergang CCP Module 1 Statistiek voor het Credit Management - Drs. J.H. Gieskens AC CCM QT -

Statistiek. Beschrijvend statistiek

Kwantitatieve methoden. Samenvatting met verwijzing naar Excel functies

Statistiek I Samenvatting. Prof. dr. Carette

S1 STATISTIEK. Tabellen & diagrammen Centrummaten & Spreiding

College 4 Inspecteren van Data: Verdelingen

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Begrippenlijst Anders Dit is onderzoek

Alleen deze bladen inleveren! Let op je naam, studentnummer en klas

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Samenvatting Wiskunde Samenvatting en stappenplan van hfst. 7 en 8

Examen Statistiek I Januari 2010 Feedback

De normale verdeling

Checklist Wiskunde A HAVO HML

9.1 Centrummaten en verdelingen[1]

De prijs van een cd is gestegen met 25% ten opzichte van het basisjaar.

Hoofdstuk 5: Steekproevendistributies

Klantonderzoek: statistiek!

College 3 Interne consistentie; Beschrijvend onderzoek

Werkbladen 3 Terugzoeken

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Hoofdstuk 12: Eenweg ANOVA

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Onderzoek. B-cluster BBB-OND2B.2

Statistiek: Herhaling en aanvulling

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf

Normale verdeling. Domein Statistiek en kansrekening havo A

Lessen in kwantitatief onderzoek. Ruud Hoevenagel Leids OnderzoeksKollectief

bijspijkercursus wiskunde voor psychologiestudenten bijeenkomst 6 statistiek/gegevensverwerking los materiaal, niet uit boek [PW]

1BA PSYCH Statistiek 1 Oefeningenreeks 3 1

9. Lineaire Regressie en Correlatie

De Collegereeks Statistiek. statistiek. Statistiek in het dagelijkse nieuws. Statistiek Hoorcollege 1. Descriptieve statistiek ttitik

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen....

DOEN! - Praktische Opdracht Statistiek 4 Havo Wiskunde A

Kansrekening en Statistiek

2.3 Frequentieverdelingen typeren

Hoofdstuk 5 Een populatie: parametrische toetsen

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO

Statistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2

Les 2 / 3: Meetschalen en Parameters

Onderneming en omgeving - Economisch gereedschap

Les 1: Waarschijnlijkheidrekening

Factor = het getal waarmee je de oude hoeveelheid moet vermenigvuldigen om een nieuwe hoeveelheid te krijgen.

Empirische kansen = op ervaring gegrond; bereken je door relatieve frequenties te gebruiken. Wet van de grote aantallen.

Verschillenanalyse effect nieuwe BKR. Samenvatting. Inleiding. datum Directie Kinderopvang, Ministerie SZW. aan

Hoofdstuk 6 Twee populaties: parametrische toetsen

Oplossingen hoofdstuk 7

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

Agrarische grondprijzen in soorten en maten

Methoden van het Wetenschappelijk. Onderzoek. Zin en onzin van statistiek

OEFENPROEFWERK HAVO A DEEL 2

Examen PC 2 vak Financiële Rekenkunde

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Beschrijvende statistiek

Paragraaf 10.1 : Populatie en Steekproef

3. Gebruik die formule om het rekenvoorbeeld in de tekst van het artikel na te rekenen.

Prijsindexcijfers 0f Reclamediensten

Transcriptie:

MARKETING / 07B HBO Marketing / Marketing management Raymond Reinhardt 3R Business Development raymond.reinhardt@3r-bdc.com 3R 1 M Statistiek: wetenschap die gericht is op waarnemen, bestuderen en analyseren van massaverschijnselen. 2 M Klassenverdeling, hier met klassenbreedte 100.000: 3

M Verdere frequenties: M Grafieken: 4 M Grafieken: 5 6

M Grafieken: M Grafieken: 7 M Grafieken: 8 9

M Grafieken: M Grafieken: 10 11 M Het werken met indexcijfers: Om ontwikkelingen in de markt te kunnen analyseren en de ontwikkelingen in tal van verschillende gegevens met elkaar te vergelijken, wordt vaak gewerkt met indexcijfers. Berekeningsmethodiek: 12

M Opgave: PIC 1 = prijsindexcijfers waarbij basisjaar = 2006 PIC 2 = prijsindexcijfers waarbij basisjaar = 2008 Vul de ontbrekende indexen en prijzen in. [tip: eerst prijzen en PIC 1, dan PIC 2 ] M Oplossing: 13 14 M Opgave: Het verbruik van een zeker type energiedrank was in 2006, in geld uitgedrukt, 200 miljoen euro, en in 2012 was dit 360 miljoen euro. Het indexcijfer van het verbruik in stuks in dezelfde periode steeg van 125 in 2006 tot 180 in 2012 (index 2003 = 100). Bereken hoeveel procent de prijs van dit type energiedrank over de periode 2006-2012 blijkbaar is gestegen? [Tip: beschouw de indexcijfers van verbruik als afzetverhoudingsgetallen.] 15

M Oplossing: +25% 16 M Centrummaten: met één enkel getal een typerend beeld aangeven m.b.t. de totale massa; geeft aan rond welk getal waarnemingen zijn gegroepeerd: F Modus: de waarde van de meest voorkomende variabele; Modale klasse: meest voorkomende klasse (hoogste frequentie, bij gelijke klassebreedten), of de klasse met de hoogste frequentiedichtheid (bij ongelijke klassebreedten). F Mediaan: de middelste waarneming nadat alle waarnemingen naar grootte zijn geordend. (Bij oneven aantal: middelste waarneming, bij even aantal: gemiddelde van 2 middelste waarnemingen.) 17 M Centrummaten: F Rekenkundig gemiddelde: G ongewogen: waarden waarnemingen / aantal G gewogen: op basis van wegingsfactoren: 18

M Opgave: Een autoverkoper verkoopt in een zekere periode: 1 auto van 25.000 euro 3 auto s van 35.000 euro 2 auto s van 40.000 euro, en 1 auto van 70.000 euro. A/ wat was in deze periode de ongewogen, rekenkundig gemiddelde prijs van verkochte auto s? B/ wat was in deze periode de gewogen, rekenkundig gemiddelde prijs van verkochte auto s? 19 M Oplossing: A/ ongewogen, 42.500 euro B/ gewogen, 40.000 euro 20 M Spreidingsmaten: voor het verkrijgen van een indruk van de opbouw van waarnemingen. F Spreiding: de mate waarin individuele waarnemingen afwijken van de centrale tendentie (een centrummaat): G variatiebreedte: verschil tussen grootste en kleinste waarneming (de bandbreedte ) G gemiddelde afwijking (deviatie d) >> G standaardafwijking (standaarddeviatie S) >> 21

M Spreidingsmaten: F Deviatie: som van de absolute waarden der afwijkingen van de waarnemingen t.o.v. het rekenkundig gemiddelde, gedeeld door het aantal waarnemingen: Voorbeeld: Waarnemingen: 5, 7, 12, 14, 37, 45 Gemiddelde der waarnemingen: 120 / 6 = 20 Afwijkingen: 5-20 + 7-20 + 12-20 + 14-20 + 37-20 + 45-20 = 84 Gemiddelde afwijking: 84 / 6 = 14 = deviatie d (Vergelijk: 9, 16, 21, 22, 24, 28: deviatie = 5) 22 M Spreidingsmaten: F Standaarddeviatie = wortel uit de variantie, het kwadratisch gemiddelde (van een getallenreeks) 23 M Spreidingsmaten: F Standaarddeviatie: Voorbeeld: Waarnemingen: 5, 7, 12, 14, 37, 45 (x 1, x 2, enz.) Gemiddelde: 120 / 6 = 20, N = 6 Variantie: [ (5-20) 2 + (7-20) 2 + (12-20) 2 + (14-20) 2 + (37-20) 2 + (45-20) 2 ] / 6 = 1408 / 6 = 234,67 Nb: waarnemingen: 9, 16, 21, 22, 24, 28 levert: 24

M Steekproefvormen: F Volkomen a-selecte steekproef = 100% representatieve steekproef. Kan uitsluitend wanneer men beschikt over de gehele onderzoekspopulatie = steekproefkader. Zodoende: vrijwel nooit volkomen a-select. F Systematische steekproef (intervalsgewijs) = methode waarbij gehele adressenbestanden op systematische wijze worden doorlopen (iedere zoveelste element). 25 M Steekproefvormen: F Proportioneel gestratificeerde steekproef waarbij gehele onderzoekspopulatie in een aantal deelpopulaties (strata = lagen) worden verdeeld, waarna uit elk van deze strata, naar evenredigheid qua strata-verdeling, afzonderlijke steekproeven worden getrokken. F Disproportioneel gestratificeerde steekproef waarbij de verhoudingen van de strata in de steekproef ongelijk zijn aan de verhoudingen van de strata in de populatie. 26 M Steekproefvormen: F Geclusterde steekproef (clustersteekproef) waarbij steekproefkader wordt gespitst in groepen (clusters) waarna een a-selecte steekproef van clusters wordt getrokken. Vervolgens wordt ieder element uit ieder getrokken cluster ondervraagd (1-traps clustersteekproef). Ook mogelijk: na trekking van een aantal clusters wordt een a-selecte steekproef van elementen uit ieder getrokken cluster getrokken (2-traps clustersteekproef). 27

M Steekproefvormen: F Random walk methode (startadressenmethode) Manier om respondenten te selecteren voor een steekproef. Volgens toeval wordt een straat met huisnummer getrokken, bijv. 1e huisnummer plus 15, bij eerstvolgende straat rechtsaf, enz. F Quotasteekproef Niet-aselecte steekproef waarbij de populatie op basis van belangrijk geachte variabelen wordt opgedeeld in een aantal strata. De interviewer moet dan een aantal personen in een bepaalde stratum ondervragen. 28 M De normale verdeling 29 M De normale verdeling: de kromme van Gauss: F Uit het voorbeeld blijkt dat de meeste uitkomsten zich rondom 10% bevinden. Wanneer uit de populatie (=N) steeds een groot aantal onafhankelijke waarnemingen (of in ons voorbeeld: steekproeven) wordt getrokken, vormen de uitkomsten samen een symmetrische, klokvormige figuur, waarin modus, mediaan en rekenkundig gemiddelde van de uitkomsten steeds samenvallen. 30

M Steekproef-standaarddeviatie: standaardfout F Duidelijk is ook dat niet alle uitkomsten van de steekproeven gelijk zijn aan de meest voorkomende waarde, en is hier sprake van een zekere variabiliteit in deze uitkomsten. Indien men algemene uitspraken wil doen over de gehele populatie, zal hier rekening moeten worden gehouden met een vorm van deviatie: de zgn. standaardfout s. >> 31 M Steekproef-standaarddeviatie: standaardfout F Standaardfout bij steekproeven: waarbij p = % wel, q = % niet, n = aantal waarnemingen in steekproef; in ons voorbeeld, uitgaande van de centrale tendentie 10%: 32 M Standaardfout en betrouwbaarheid van uitspraak: F Wis- en sterrenkundige Carl Friedrich Gauss (1777-1855) ontdekte aan de hand van tal van sterrenkundige observaties o.a. de volgende patronen die ook in ons voorbeeld (10%) gelden: O 68,3% van alle waarnemingen ligt tussen: 10% +/- 1 x s (nl. oppervlak JCDEK), ofwel: tussen 8% en 12%, en ook: O 95,4% van alle waarnemingen ligt tussen: 10% +/- 2 x s (nl. oppervlak IBCDEFL), ofwel: tussen 6% en 14%, en ook: O 99,7% van alle waarnemngen ligt tussen: 10% +/- 3 x s (nl. oppervlak HABCDEFGM, ofwel: tussen 4% en 16%. 33

M Standaardfout en betrouwbaarheid van uitspraak: 34 M Standaardfout en betrouwbaarheid van uitspraak: F Wat betreft het bezit van een Apple-notebook, kunnen we nu dus stellen, dat: O met een betrouwbaarheid van bijv. 68,3%, tussen 10% +/- (1 x 2%), ofwel tussen 8% en 12% van de populatie dit bezit; en ook: O met een betrouwbaarheid van bijv. 95,4%, tussen 10% +/- (2 x 2%), ofwel tussen 6% en 14% van de populatie dit bezit; en ook: O met een betrouwbaarheid van bijv. 99,7%, tussen 10% +/- (3 x 2%), ofwel tussen 4% en 16% van de populatie dit bezit. 35 M Standaardfout en betrouwbaarheid van uitspraak: F De factoren 1, 2 en 3 zijn zgn. z-waarden (excenticiteitswaarden). Per betrouwbaarheids-% gelden andere (vaste) z-waarden, waaronder: [ G betrouwbaarheid 0,0% : z-waarde 0 ] G betrouwbaarheid 68,3% : z-waarde 1 G betrouwbaarheid 90,0% : z-waarde 1,68 G betrouwbaarheid 95,0% : z-waarde 1,96 G betrouwbaarheid 95,4% : z-waarde 2 G betrouwbaarheid 99,7% : z-waarde 3 36

M Betrouwbaarheid en precisie van uitspraak: F Omdat een steekproef in zekere mate indicatief zou moeten zijn voor de gehele populatie, moet steeds rekening worden gehouden met een zekere marge die de precisie van de uitspraak bepaalt: marge (%) = z-waarde x standaardfout ofwel: m = z x s (waarbij s was: 2(%)) In ons voorbeeld: G bij betrouwbaarheid 68,3%: m = 1 x 2 = 2% G bij betrouwbaarheid 95,4%: m = 2 x 2 = 4% G bij betrouwbaarheid 99,7%: m = 3 x 2 = 6% 37 M Opgave: In een steekproefonderzoek naar het dvd-spelerbezit onder Rotterdammers bleek 40% van de 400 ondervraagden zo n apparaat te bezitten. Tussen welke grenzen ligt dit percentage in de populatie, uitgaande van een betrouwbaarheid van 95,4%? 38 M Oplossing: 35,1% << >> 44,9% 39

M Opgave: De aanbieder van dvd-spelers wil nu een onderzoek doen naar het % dvd-speler-bezitters in een andere grote plaats. Als eis wordt gesteld dat de nauwkeurigheid (de marge) maximaal 5% mag zijn bij een betrouwbaarheid van 95,4%. Hoe groot moet de steekproef zijn om aan deze eisen te kunnen voldoen? [Hint: omdat hier vooraf geen steekproefuitkomst bekend is, zal hier voor de zekerheid moeten worden uitgegaan van de maximale steekproefstandaardfout!] 40 M Oplossing: 400 41 M Opgave: In 2 aan elkaar grenzende gemeenten (gemeente A, 8.000 huishoudens; gemeente B, 10.000 huishoudens) is onlangs steekproefonderzoek onder de huishoudens gedaan naar het gebruik van groene energie. In gemeente A gaven 120 van de ondervraagde 300 huishoudens aan groene energie te gebruiken. In gemeente B bleken 275 van de ondervraagde 500 huishoudens dit ook te doen. Is hier wel of niet sprake van een significant verschil tussen deze uitkomsten? Toon dit d.m.v. berekening aan waarbij een betrouwbaarheidseis wordt gesteld van 99,7%. 42

M Oplossing: geen significant verschil 43 M Steekproefvereisten: F de populatie moet homogeen zijn F de steekproefelementen moeten aselect gekozen zijn (ieder element uit de populatie moet een even grote kans hebben om gekozen te worden) F de steekproef moet voldoende groot zijn (hetgeen afhangt van de gewenste betrouwbaarheid en nauwkeurigheid) F de steekproef moet betrouwbaar zijn (bij herhaling steeds vergelijkbare uitkomsten) F de steekproef moet valide zijn (meten wat gemeten dient te worden) F de steekproef moet nauwkeurig zijn 44 M Relatie betrouwbaarheid / nauwkeurigheid: F hoe groter de betrouwbaarheid ( zekerheid ) van uitspraak, des te minder nauwkeurig (minder precies) deze is(!) F Voorbeeld: steekproefuitkomst 40% onder 600 ondervraagden. Bereken de marges bij betrouwbaarheid 99,7% (z=3) resp. 68,3% (z=1). 45

M Correctie bij relatief grote steekproeven: Indien een steekproef de gehele populatie zou betreffen (n = N), dan is niet echt sprake meer van een steekproef maar van een gehele meting, en kan er geen standaardfout s bestaan: s = 0! De formule voor de standaardfout houdt hier geen rekening mee, zodat met een correctiefactor moet worden gerekend wanneer n 10% N : 46 M Preciese bepaling benodigde steekproefomvang: Voorbeeld: populatie N = 5000; m = 3%; betrouwbaarheid = 90% (--> z = 1,68). Benodigde steekproefomvang? : 47