Oefenvragen bij Statistics for Business and Economics van Newbold

Vergelijkbare documenten
Data analyse Inleiding statistiek

Hoofdstuk 5 Een populatie: parametrische toetsen

Data analyse Inleiding statistiek

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

11. Multipele Regressie en Correlatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 12: Eenweg ANOVA

Statistiek I Samenvatting. Prof. dr. Carette

9. Lineaire Regressie en Correlatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Examen Statistiek I Feedback

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Data analyse Inleiding statistiek

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Hoofdstuk 5: Steekproevendistributies

Inleiding Applicatie Software - Statgraphics

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Voorbeeldtentamen Statistiek voor Psychologie

Hoofdstuk 10: Regressie

Samenvatting Statistiek

4 Domein STATISTIEK - versie 1.2

College 2 Enkelvoudige Lineaire Regressie

SPSS. Statistiek : SPSS

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

werkcollege 6 - D&P9: Estimation Using a Single Sample

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Formules Excel Bedrijfsstatistiek

Kansrekening en Statistiek

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Hoofdstuk 6 Twee populaties: parametrische toetsen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Hoofdstuk 4 Kansen. 4.1 Randomheid

Kansrekening en Statistiek

Statistiek voor A.I.

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden


DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Examen G0N34 Statistiek

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

College 4 Inspecteren van Data: Verdelingen

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

A. Week 1: Introductie in de statistiek.

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

Deel I : beschrijvende statistiek

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

Toegepaste Statistiek, Week 6 1

Onderzoek. B-cluster BBB-OND2B.2

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

1. Reductie van error variantie en dus verhogen van power op F-test

Onderzoeksmethodiek LE: 2

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Kansrekening en Statistiek

werkcollege 6 - D&P10: Hypothesis testing using a single sample

Inhoudsopgave. Deel I Schatters en toetsen 1

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Statistische variabelen. formuleblad

Statistiek ( ) eindtentamen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Statistiek II. Sessie 5. Feedback Deel 5

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Statistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2

1. Statistiek gebruiken 1

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Beschrijvende statistiek

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Kansrekening en Statistiek

Feedback proefexamen Statistiek I

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

HOOFDSTUK VII REGRESSIE ANALYSE

College Week 4 Inspecteren van Data: Verdelingen

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

toetskeuze schema verschillen in gemiddelden

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Les 1: Waarschijnlijkheidrekening

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

SOCIALE STATISTIEK (deel 2)

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

Toegepaste Statistiek, Dag 7 1

. Dan geldt P(B) = a d. 3 8

Transcriptie:

Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd is. Een sample is het deel van de populatie waarover een steekproef wordt gedaan.. Wat is het verschil tussen simple random sampling en systematic sampling? Bij simple random sampling worden objecten random gekozen. Bij systematic sampling wordt elk j-ste item uit de populatie geselecteerd. 3. Wat is het verschil tussen een parameter en een statistiek? Een parameter beschrijft een specifiek kenmerk van de populatie. Een statistiek beschrijft een specifiek kenmerk van een sample. 4. Wat zijn non sampling errors? De populatie waarvan de steekproef is genomen is niet de relevante populatie. Deelnemers kunnen onnauwkeurige of geen eerlijke antwoorden geven. Deelnemers geven geen antwoorden. 5. Wat is het verschil tussen descriptive statistics en inferential statistics? Descriptive is het samenvatten en presenteren van data op een informatie manier. Inferential is het gebruiken van de gegevens om voorspellingen en schattingen te maken. 6. Numerieke variabelen kunnen twee vormen aannemen, welke? Discrete variabelen en continue variabelen. 7. Wat is het verschil tussen kwalitatieve en kwantitatieve gegevens? Bij kwalitatieve gegevens is er geen meetbare betekenis tussen het verschil in aantallen en bij kwantitatieve gegevens wel. 1

8. Welke meetniveaus worden voor kwalitatieve gegevens gebruikt? Nominaal en ordinaal 9. Welke meetniveaus worden voor kwantitatieve gegevens gebruikt? Interval en ratio 10. Wat zijn tabellen en grafieken die voornamelijk worden gebruikt voor nominaal meetniveau? Staafdiagram, kruis tabel, cirkeldiagram, pareto diagram 11. Wat zijn grafieken die voornamelijk worden gebruikt om numerieke variabelen te beschrijven? Frequentieverdeling, histogram, ogive, stamdiagram, scatterdiagram Hoofdstuk 1. Wat zijn numerieke maten en op welke vragen geven ze antwoord? Het gemiddelde, de mediaan en de modus. Op vragen over de locatie van het centrum van een set gegevens.. Welke maten worden gebruikt bij categorische gegevens? Mediaan of modus 3. Welke maten worden gebruikt bij numerieke gegevens? Gemiddelde of mediaan 4. Hoe weet je naar welke kant de scheefheid van de verdeling is? Scheefheid is positief als de verdeling scheef naar rechts is, negatief als de verdeling scheef naar links is.

5. Hoe weet je of de verdeling symmetrisch is? Dan is de scheefheid nul en is de verdeling klokvormig. 6. Wat is de vijf-nummer samenvatting? Deze verwijst naar de vijf beschrijvende maten: minimum, eerste kwartiel, mediaan, derde kwartiel en maximum. 7. Hoe bereken je de interkwartiel afstand? Het derde kwartiel - het eerste kwartiel: Q3-Q1. 8. Welke grafiek geeft de vorm van de verdeling in termen van de vijf-nummer samenvatting? Box-and-whisker plot (boxplot) 9. Hoe bereken je de variantie? De som van de gekwadrateerde verschillen tussen elke waarneming en het gemiddelde, gedeeld door de steekproefomvang. 10. Wat is het verschil tussen Chebyshey s theorem en de z-score? Chebyshey s theorem: Het aantal van de observaties in een steekproef die binnen k standaardafwijking van het gemiddelde afliggen. Z-score: Een waarde die het aantal standaardafwijkingen aangeeft die een waarde van het gemiddelde af zit. 11. Wat hebben covariantie en correlatiecoëfficiënt met elkaar gemeen? Beiden meten de richting van een lineaire relatie tussen twee variabelen. De correlatiecoëfficiënt geeft ook de sterkte van het verband tussen twee variabelen. 3

Hoofdstuk 3 1. Wat is zijn basis uitkomsten en wat hebben deze te maken met de steekproefruimte? Basis uitkomsten zijn alle mogelijke uitkomsten van een random experiment. Alle basis uitkomsten bij elkaar noemen we de steekproefruimte. Het deel van de basis uitkomsten waar we in geïnteresseerd zijn noemen we een event.. Wanneer zijn de events collectively exhaustive? Als de unie van een aantal events de hele steekproefomvang omvat. 3. Wat is het verschil tussen permutaties en combinaties? Bij permutaties wordt gelet op volgorde van elementen en bij combinaties niet. 4. Wat is het verschil tussen klassieke waarschijnlijkheid en subjectieve waarschijnlijkheid? Klassieke: hoefaak een event zal plaatsvinden, er vanuit gaande dat alle uitkomsten in een steekproef gelijke kansen hebben om te gebeuren. Subjectieve waarschijnlijkheid: in hoeverre een individu gelooft in de kans dat een event zal gebeuren. 5. Wat zijn de 5 kansregels? Complement regel, toevoegingsregel, voorwaardelijke kans, vermenigvuldigingsregel, statistische onafhankelijkheid. 6. Wat zijn mogelijke gevolgen indien verschillende metingen worden gedaan over een zelfde steekproefgroep? Gezamenlijke kans, marginale kans, voorwaardelijke kans, overbetrokkenheid ratio 4

Hoofdstuk 4 1. Wat zijn de vereiste eigenschappen van kansverdeling discrete random variabelen? F(x0) is tussen 0 en 1 voor elke x0, de som van de individuele kansen is 1.. Wat is de verwachte waarde (expected value) van een discrete random variabele X? Het gemiddelde, μ. 3. Hoe berekenen we de standaardafwijking? De wortel van de variantie. 4. Wat zijn de eigenschappen van een binominale kansverdeling? Meerdere steekproeven waarbij steeds twee mutually exclusive uitkomsten mogelijk zijn. De kans op de uitkomst is hetzelfde voor elke proef. De kans op de uitkomst in een proef heeft geen invloed op de kans in andere proeven. 5. Wat zijn de mogelijke uitkomsten van een binomiale verdeling (Bernoulli)? Succes en Falen 6. Wat zijn de eigenschappen van gezamenlijke kansen? P(x,y) ligt tussen 0 en 1. De som van de gezamenlijke kansen P(x,y) van alle mogelijke paren moet 1 zijn. 7. Hoe weet je of de gezamenlijke verdeelde random variabelen X en Y onafhankelijk zijn? Wanneer de gezamenlijke kansverdeling het product is van hun marginale kansverdeling. Wanneer de covariantie 0 nul. 8. Wat is een portfolio analyse? De lineaire combinatie van de gemiddelde waarden van de effecten in de portfolio. 5

Hoofdstuk 5 1. Wat is de kans dat een continue random variabele in een bepaalde reeks valt? P(a< X < b)=f (b) F (a). Wat zijn de eigenschappen van kansdichtheid functie? F(x) > 0 voor alle waarden van x. Het gebied onder de kansdichtheidsfunctie voor alle waarden van de random variabele is gelijk aan 1. De kans dat X ligt tussen a en b is het gebied onder de kansdichtheidsfunctie tussen deze punten. De cumulatieve verdelingsfunctie is het gebied onder de kansdichtheidsfunctie tot x0. 3. Hoe ziet de kansdichtheidsfunctie eruit bij een normale verdeling? Een symmetrische klokvormige kromme met het gemiddelde als centrum 4. Wat is de notatie van de normale verdeling? X N (μ,σ ) 5. Wat is de formule voor een normaal verdeelde random variabele en Z? Z = X μ σ Hoofdstuk 6 1. Waarom wordt er vaak gebruik gemaakt van een steekproef? Het is erg moeilijk om elk item in een populatie te meten en ook erg duur.. Wat zegt de central limit theorem? Als n groot is, de central limit theorem zegt dat de verdeling van Z de standaard normale verdeling nadert. 6

3. Wat is de acceptatie interval? Een interval waarbinnen een steekproef gemiddelde een hoge kans van waarschijnlijkheid kent. 4. Wat is de steekproef proportie? De proportie van de populatieleden die een karakteristiek bezitten waarin interesse is. Hoofdstuk 7 1. Wat is het verschil tussen een schatter en een schatting? Een schatter is een random variabele die afhangt van de steekproef informatie. een schatting is een specifieke waarde van die random variabele.. Wat is de bias van een onpartijdige schatter? Nul 3. Wat is de meest efficiënte schatter? De onpartijdige schatter met de kleinste variantie. 4. Hoe wordt de betrouwbaarheidsinterval van een schatting bepaald? a< θ< b,met 100(1 α)% 5. Hoe worden de grenzen van een betrouwbaarheidsinterval aangegeven? Upper confidence limit en Lower confidence limit 6. Op welke manier kan de margin of error verminderd worden? Door de standaardafwijking naar beneden te brengen, de steekproefgrootte omhoog te brengen of een lager betrouwbaarheislevel. 7. Wanneer wordt de student s t verdeling gebruikt? Als de populatie variantie onbekend is. 7

Hoofdstuk 8 1. Wanneer zijn samples afhankelijk? Als de waarden in de ene sample beïnvloedt worden door de waarden in een andere sample.. Waar staat d voor? Het gemiddelde van de verschillen. 3. Wat betekent het als de uitkomst tussen twee drugs μ x μ y positief is? Dat X effectiever is dan Y. 4. Welke variabele gebruik je wanneer de populatievariantie onbekend is? De geobserveerde sample variaties s x en s y. 5. Hoe worden deze geobserveerde sample variaties in de interval formule gebruikt indien als gelijk beschouwd? Door de pooled sample variantie s p. 6. Wanneer mag er gebruik worden gemaakt van het verschil tussen twee populatie proporties? Bij grote samples. 7. Hoe luidt de interval formule van het verschil tussen twee populatie proporties? ( p x p y )±ME 8

Hoofdstuk 9 1. Wat is het verschil tussen de nul-hypothese en de alternatieve hypothese? De nul-hypothese wordt als waarheid beschouwd. Wanneer de nul-hypothese wordt verworpen dan wordt de alternatieve hypothese als waarheid beschouwd.. Wanneer is een hypothese eenzijdig en wanneer tweezijdig? Eenzijdig wanneer de alternatieve hypothese groter of kleiner dan. Tweezijdig wanneer alternatieve hypothese niet gelijk aan. 3. Wat zijn de twee mogelijke fouten bij het toetsen van hypotheses? Type I error: het verwerpen van een kloppende nul-hypothese Type II error: een foute nul-hypothese niet verwerpen 4. Wat gebeurd er als een uitkomst in de rejection region valt? Dan wordt de nul-hypothese verworpen 5. Wanneer wordt op basis van de p-waarde de nul-hypothese verworpen? Wanneer er sprake is van significantie, de p-waarde is < 0.05. 6. Hoe bepaal je de sterkte van een toets? Door 1 β Hoofdstuk 10 1. Hoe formuleren we de hypothesen wanneer je de verschillen tussen twee normale populatiegemiddelden tweezijdig test? H 0 :μ x μ y =0 H 1 :μ x μ y 0 9

. Wat is het verschil in t of z bij een eenzijdige en een tweezijdige toets? Bij een tweezijdige toets wordt de alfa gedeeld door. 3. Met welke verdeling testen we de gelijkheid van de variaties tussen twee normaal verdeelde populaties? Met de F verdeling. 4. Hoe formuleren we de hypothesen wanneer je de gelijkheid van de variaties tussen twee normaal verdeelde populaties test? H 0 : σ x =σ y H 1 :σ x σ y 5. Op welke aanname zijn de toetsen gebaseerd? De aanname dat de onderliggende verdeling normaal is of dat de central limit theorie van toepassing is. Hoofdstuk 11 1. Waar staan b1 en b0 voor in een least squares regressielijn? b1 staat voor de helling en b0 staat voor de intersectie met de y-as.. Welke onderdelen zitten er in de analyse van variantie? Sum of squares total, sum of squares error en sum of squares regression. 3. Wat zegt de determinatiecoëfficiënt over de regressie? Een hogere waarde staat voor een betere regressie 4. Van welke twee hoeveelheden is de variantie van de helling coëfficiënt afhankelijk? De afstand van de punten op de regressielijn en de totale afwijking van de X waarden van het gemiddelde. 10