Enkelvoudige lineaire regressie

Maat: px
Weergave met pagina beginnen:

Download "Enkelvoudige lineaire regressie"

Transcriptie

1 Enkelvoudige lineaire regressie Inleiding Dit hoofdstuk sluit aan op hoofdstuk I-9 van het statistiekboek. Er wordt hier steeds gesproken over het verband tussen één afhankelijke variabele Y en één onafhankelijke variabele X. In practicum I-3 is de procedure Linear Regression al ter sprake gebracht om het verband tussen twee variabelen te onderzoeken. In dit hoofdstuk worden verschillende aspecten van enkelvoudige lineaire regressie aan de hand van het databestand REGRES3.SAV verduidelijkt. Voor een beschrijving van dit bestand verwijzen wij naar bijlage 2, pagina 292 van het statistiekboek. Het enkelvoudige regressiemodel We beginnen met het analyseren van de relatie tussen de onafhankelijke variabele 'aantal bedden per 000 inwoners in algemene ziekenhuizen' (BED) en de afhankelijke variabele 'aantal opnamen per 000 ziekenfondsverzekerden' (ZF_OPN). Voordat het model wordt toegepast op het databestand moet eerst onderzocht worden of het regressiemodel een zinvolle samenvatting kan geven van de data. Enkelvoudige lineaire regressie is gebaseerd op het volgende model: Y=β 0 + β X + ε met ε is N(0,σ 2 ) Hierbij is steeds sprake van één onafhankelijke x-variabele. In het volgende hoofdstuk wordt het verband tussen meerdere onafhankelijke x-variabelen en één afhankelijke y-variabele onderzocht. Het maken van een Scatterplot Zoals in practicum I-3 van dit werkboek is uitgelegd, is het aan te raden, voordat je een lineaire regressie gaat uitvoeren, om te kijken of er mogelijk een verband is tussen de afhankelijke variabele en de onafhankelijke variabele. Om een indruk te krijgen of er sprake is van een lineair verband kun je een puntenwolk (scatterplot) maken. Een puntenwolk is ook zinvol om punten te lokaliseren die sterk afwijken van de overige punten. Deze uitbijters kunnen ontstaan door grote meetfouten, verkeerde codering en/of door situaties die niet verklaard kunnen worden uit het regressiemodel. Een scatterplot wordt aangevraagd middels de menu-optie Graphs Legacy Dialogs Scatter/Dot. Kies voor Simple Scatter en klik op Define. Plaats de afhankelijk variabele op de y-as en de onafhankelijke variabele op de x- as. In het voorbeeld is de afhankelijke variabele ZF_OPN en de onafhankelijke variabele BED. Hoe je m.b.v de Chart Editor de regressielijn door de puntenwolk kan laten tekenen vind je beschreven in hoofdstuk I-3. I9-

2 SPSS uitvoer Scatterplot ZF_OPN versus BED inclusief regressielijn: 50,00 25,00 zf_opn 00,00 75,00 R Sq Linear = 0,43 50,00 0,00 5,00 0,00 bed 5,00 20,00 25,00 De procedure Linear Regression Via de menu-optie Analyze Regression Linear verschijnt het dialoogvenster Linear Regression (zie ook practicum I-3). In het kader onder Dependent geef je de naam op van de afhankelijke variabele (ZF_OPN) en in het kader onder Independent(s) de naam van de onafhankelijke variabele (BED). ENTER geeft de methode aan waarop de regressieanalyse wordt uitgevoerd. Bij het uitvoeren van een enkelvoudige lineaire regressie wordt steeds de methode ENTER gebruikt (dit is overigens de methode die SPSS standaard gebruikt). De regressieanalyse kan worden uitgevoerd met een klik op OK. De volgende uitvoer verschijnt: SPSS uitvoer Linear Regression: Variables Entered/Removed b Model Variables Entered Variables Removed Method BED a. Enter a. All requested variables entered. b. Dependent Variable: ZF_OPN Deze tabel laat zien dat BED de onafhankelijke variabele is en ZF_OPN de afhankelijke. I9-2

3 Model Model Summary b Std. Error Adjusted R of the R R Square Square Estimate.643 a a. Predictors: (Constant), BED b. Dependent Variable: ZF_OPN R: de Pearson correlatiecoëfficiënt (.643). R Square: R 2, proportie door de regressielijn verklaarde variatie van de afhankelijke variabele (.43, de verklaarde variatie). Std. Error of the Estimate: de standaarddeviatie om de regressielijn, deze is gelijk aan de wortel uit de gemiddelde kwadratensom van de residuen (7.4707). ANOVA b Model Sum of Squares df Mean Square F Sig. Regression a Residual Total a. Predictors: (Constant), BED b. Dependent Variable: ZF_OPN De ANOVA ofwel de variantieanalyse tabel: de totale variatie van de afhankelijke variabele wordt gesplitst over twee componenten: een deel dat verklaard wordt door de regressielijn (Sum of Squares Regression) en een deel dat niet verklaard wordt door de regressielijn (Sum of Squares Residual). Van beide componenten wordt het aantal vrijheidsgraden gegeven (df). De gemiddelde kwadratensom (Mean Square) is de som van de kwadraten in afwijking van het gemiddelde gedeeld door het bijbehorend aantal vrijheidsgraden. Voor het residu is dit quotiënt gelijk aan de variantie van de residuen (s 2 ). Dit is een schatting van de variantie van de residuen in de populatie (σ 2 ). Vervolgens wordt de F toets uitgevoerd (F). De nulhypothese luidt dat de regressiehelling β in de populatie gelijk is aan 0. De berekende F- waarde van met en 50 vrijheidsgraden en een overschrijdingskans van.000 (Sig.) leidt tot het verwerpen van de nulhypothese. Model (Constant) BED Unstandardized Coefficients a. Dependent Variable: ZF_OPN Coefficients a Standardi zed Coefficien ts B Std. Error Beta t Sig Bovenstaande tabel toont de schattingen van de regressiecoёfficiёnten β 0 (Constant, 7.904) en β (BED, 5.823) in de populatie (onder kolom B) en hun Standaardfout (kolom Std. Error). De kolom Beta wordt niet behandeld! Aan de hand van de schattingen van de regressieparameters I9-3

4 kunnen we de regressievergelijking opstellen: ZF_OPN= BED. De laatste 2 kolommen van de tabel geven de waarden van de t-toets (t) en de bijbehorende overschrijdingskans (Sig). Aan de hand van de t- waarde wordt de nulhypothese getoetst dat de bijbehorende regressieparameter β 0 respectievelijk β gelijk is aan 0. Voor wat betreft het intercept β 0, wat in de populatie gelijk is aan het verwachte aantal opnamen als er geen bedden zijn, is deze toets in dit voorbeeld niet interessant, omdat er in de praktijk geen enkel ziekhuis bestaat zonder bedden. Wat betreft β is deze toets in een enkelvoudig model ( onafhankelijke variabele) equivalent aan de F toets van de ANOVA tabel. Hierbij geldt dat F= t 2, in ons voorbeeld: (F) = (t 2 ). De beide p-waarden zijn gelijk (.000). Geconcludeerd kan worden dat de nulhypothese β = 0 verworpen wordt, zelfs bij een α van.00. Drukknoppen Linear Regression Procedure Het dialoogvenster Linear Regression kent een aantal drukknoppen. Hieronder volgt een overzicht van deze drukknoppen met hun mogelijkheden m.u.v. de drukknop Options. Deze wordt in het hoofdstuk meervoudige lineaire regressie analyse van dit werkboek besproken. Statistics Estimates: Confidence Intervals: Descriptives: Model Fit : de regressiecoëfficiënten en hun standaarderrors, t-toetsen met bijbehorende overschrijdingskansen (SPSS geeft dit standaard) een 95 % betrouwbaarheidsinterval voor het intercept en de helling gemiddelde, standaardafwijking en correlatiematrix van afhankelijke en onafhankelijke variabele. R, R 2, de standaarddeviatie om de regressielijn, de variantieanalyse tabel met de F-toets en bijbehorende overschrijdingskans. Save Met behulp van de drukknop Save kunnen onder andere voorspelde waarden (Predicted Values: Unstandardized), Cook's distances, betrouwbaarheidsintervallen (Predicted Intervals: Mean) en predictieintervallen (Predicted Intervals: Individual) berekend worden. Ook residuele waarden kunnen berekend worden in het kader onder Residuals. Plots Via deze drukknop worden een Normal Probability Plot, een histogram van de gestandaardiseerde residuen en residuenplots gemaakt. Voor het maken van de residuenplot selecteer je *sresid (gestudentiseerde residuen) als Y variabele en *zpred (gestandaardiseerde voorspelde waarden) als X variabele (zie ook hoofdstuk I-3). I9-4

5 Betrouwbaarheidsintervallen en Predictieintervallen Zoals hierboven is beschreven kan met behulp van de drukknop Save zowel een betrouwbaarheidsinterval als een predictie-interval dat bij een bepaalde x-waarde hoort, berekend worden. Klik op de drukknop Save in het venster Linear Regression. In het kader Prediction Intervals klik je op Mean voor het berekenen van een betrouwbaarheidsinterval en op Individual voor het berekenen van een predictie-interval. Standaard berekent SPSS een 95% betrouwbaarheids- en predictie-interval (het percentage kan ingesteld worden in het venster van de drukknop Save). De voorspelde waarden bereken je door te klikken op Unstandardized onder Predicted Values: Bij de berekening van betrouwbaarheidsintervallen, predictie-intervallen en voorspelde waarden maakt SPSS nieuwe variabelen aan en geeft daar zelf een naam aan, nl.: PRE_ : de voorspelde waarden. LMCI_ en UMCI_: ondergrens en bovengrens voor het 95% betrouwbaarheidsinterval voor elke x-waarde. LICI_ en UICI_ : ondergrens en bovengrens voor het 95% predictie-interval voor een willekeurige y bij een gegeven x- waarde. I9-5

6 De nieuwe aangemaakte variabelen kunnen bekeken worden in het datavenster of in de uitvoerfile middels de menu-optie Analyze Reports Case Summaries. Een voorbeeld: SPSS uitvoer Case Summaries van de verwachte waarden en 95% Betrouwbaarheids- en Predictie intervallen van ZF_OPN behorende bij de verschillende waarden van BED: Case Summaries a BED Unstandardi zed Predicted Value 95% L CI for ZF_OPN mean 95% U CI for ZF_OPN mean 95% L CI for ZF_OPN individual 95% U CI for ZF_OPN individual Total N a. Limited to first 00 cases. Bij BED =2.42 is de verwachte waarde (Unstandardized Predicted Value) gelijk aan Het 95% Betrouwbaarheidsinterval (= 95%L CI for ZF_OPN mean, U CI for ZF_OPN mean) is gelijk aan (78.82, 93.8). Dat wil zeggen dat met 95% zekerheid gesteld kan worden dat het aangegeven interval het populatiegemiddelde bij een waarde van BED van 2.42 omsluit. Het predictie-interval (=95% L CI for ZF_OPN individual, 95% U CI for ZF_OPN individual) bij BED =2.42 geeft met 95% zekerheid dat bij deze waarde voor BED het aantal opgenomen ziekenfonds patienten tussen 50.8 en 2.82 zou liggen. Merk op dat dit predictie-interval breder is dan het bijbehorende betrouwbaarheidsinterval. Ga dit na door zelf de regressieanalyse uit te voeren! De voorspelde waarden en de betrouwbaarheidsintervallen kunnen wij in het scatterplot weergeven door in de Chart Editor (zie I-3) te kiezen voor Elements Fit Line at Total. Hiermee wordt de regressielijn door de puntenwolk getekend. Selecteer in het nu verschenen Properties venster het tabblad Fit Line. Kies als Fit Method voor Linear, en klik onder Confidence Intervals op Mean en daarna onderaan op de drukknop Apply. Het betrouwbaarheidsinterval is nu in de puntenwolk getekend. Klik op Close en herhaal vervolgens de hele procedure maar kies daarbij onder Confidence Intervals voor Individual. Nu verschijnt er in dezelfde puntenwolk ook nog eens het predictieinterval: I9-6

7 I9-7

8 SPSS uitvoer Betrouwbaarheids (C.I.) en Predictie (P.I.)- intervallen: 50,00 25,00 zf_opn 00,00 75,00 R Sq Linear = 0,43 R Sq Linear = 0,43 R Sq Linear = 0,43 50,00 0,00 5,00 0,00 bed 5,00 20,00 25,00 Residuenplot en Normal Probability Plot Uit de puntenwolk van ZF_OPN versus BED valt af te lezen dat de relatie tussen deze beide variabelen bij benadering lineair is. Naast de aanname van lineariteit wordt verondersteld dat de residuen ε onafhankelijk zijn van elkaar en normaal verdeeld zijn met populatiegemiddelde 0 en constante variantie σ 2. Om deze aannamen te controleren wordt via de drukknop Plots in het dialoogvenster Linear Regression een histogram, een normal probability plot en een residuenplot van de gestandaardiseerde residuen gemaakt, door te klikken op Histogram, en op Normal probability plot in het kader onder Standardized Residual Plots. Een residuenplot maak je door variabele *SRESID (gestudentiseerde residuen) als Y variabele te selecteren en *ZPRED (gestandaardiseerde voorspelde waarden) als X variabele. I9-8

9 SPSS uitvoer: Histogram Dependent Variable: zf_opn 2,5 0,0 Frequency 7,5 5,0 2,5 0, Mean =,04E-6 Std. Dev. =0,99 N =52 Regression Standardized Residual Het histogram geeft de frequentieverdeling van de gestandaardiseerde residuen weer. In het voorbeeld is de verdeling van de gestandaardiseerde residuen scheef naar links. Normal P-P Plot of Regression Standardized Residual Dependent Variable: zf_opn,0 0,8 Expected Cum Prob 0,6 0,4 0,2 0,0 0,0 0,2 0,4 0,6 0,8,0 Observed Cum Prob I9-9

10 De normal probability plot zet de cumulatieve verdeling van de standaardnormale verdeling (verticale as) af tegen de cumulatieve gestandaardiseerde residuen (horizontale as) door de bijbehorende percentielen tegen elkaar uit te zetten. Een dergelijke plot wordt ook wel P-P plot genoemd. De lijn geeft aan waar de punten zouden moeten liggen als de aanname van normaliteit juist is. Als de residuen volledig normaal verdeeld zouden zijn, liggen de punten op een rechte lijn die door de oorsprong gaat. In het voorbeeld lijkt dit min of meer het geval te zijn. Scatterplot Dependent Variable: zf_opn Regression Studentized Residual Regression Standardized Predicted Value 8 Deze puntenwolk van *SRESID versus *ZPRED zet de gestudentiseerde residuen uit tegen de voorspelde gestandaardiseerde y waarden (residuenplot). Als de aanname van constante variantie correct is, is er geen enkel verband te ontdekken tussen *SRESID en *ZPRED: bewegen we langs de x-as van links naar rechts dan moeten de gestandaardiseerde residuen gemiddeld 0 blijven; ook de spreiding van de gestandaardiseerde residuen rond 0 moet constant blijven. Het histogram en de normal probability plot sluiten redelijk aan bij de normale verdeling. Meer zorgen baart de toenemende residuele waarde die in de residuenplot te zien is. Outliers en Cook's distance Een maat die aangeeft in hoeverre een case invloedrijk is, is Cook's distance. Een waarde groter dan of veel groter dan de distances van de overige cases is verdacht. Alle cases die op basis hiervan het label 'verdacht' krijgen, dienen onderzocht te worden op fouten. Eventueel moet de analyse herhaald worden na eliminatie van de meest extreme I9-0

11 gevallen. Via de drukknop Save (in het venster Linear regression) kan met een klik op Cook's in het kader Distances de Cook's distances berekend worden. SPSS maakt zelf een nieuwe variabele aan met de naam COO_ die de waarden van de Cook's Distances bevat. De variabele COO_ kan in het data venster bekeken worden. Gebruik de procedure Analyze Reports Case Summaries om in de uitvoerfile een overzicht van de waarden van deze variabele af te laten drukken. Ook is het nuttig om via Descriptives het maximum en minimum van de Cook s distances te krijgen om te kijken of er sprake is van outliers. SPSS uitvoer Cook s Distances: Case Summaries a Cook's REGIO Distance Total N a. Limited to first 00 cases. De uitvoer laat zien dat case 52 (REGIO=52) een mogelijke uitbijter is. Zoals eerder opgemerkt is kunnen uitbijters ontstaan door grote meetfouten, verkeerde codering en/of situaties die niet door het regressiemodel verklaard kunnen worden. De relatie tussen ZF_OPN en BED wordt nogmaals onderzocht, nu met weglating van case 52.Sluit case 52 van de analyse uit met behulp van Data Select Cases. Klik op If Condition is satisfied en vervolgens op IF. Geef in het kader dat nu verschijnt de voorwaarde REGIO NE 52. (NE betekent: not equal). Sluit dit venster af en laat de regressieanalyse opnieuw uitvoeren. Variables Entered/Removed b Model Variables Entered Variables Removed Method BED a. Enter a. All requested variables entered. b. Dependent Variable: ZF_OPN I9-

12 Model Model Summary Std. Error Adjusted R of the R R Square Square Estimate.784 a a. Predictors: (Constant), BED Model Regression Residual Total a. Predictors: (Constant), BED ANOVA b Sum of Mean Squares df Square F Sig a b. Dependent Variable: ZF_OPN Model (Constant) BED Coefficients a Unstandardized Coefficients a. Dependent Variable: ZF_OPN Stan dardi zed Coeff icient s B Std. Error Beta t Sig Vergelijk bovenstaande uitvoer zonder case 52 met de uitvoer mét case 52 op pagina 3 van dit hoofdstuk. De hoeveelheid verklaarde variatie (R Square) is gestegen van 4.3% naar 6.5%. I9-2

13 Beknopte aanwijzingen met betrekking tot de oefeningen van hoofdstuk I-9. Lees dit hoofdstuk eerst goed door!! Voor een beschrijving van de bestanden verwijzen wij naar bijlage 2 van het statistiekboek. Oefening 9. Met de hand. Oefening b: Voer een enkelvoudige lineaire regressie uit en laat de voorspelde waarden berekenen m.b.v. de drukknop Save. Oefening g: Gebruik de drukknop Plots van de procedure Linear Regression. 9.5.h,i, en j: Vraag Cook s distances, Unstandardized Predicted Values, S.E. of mean predictions, en Mean en Individual Intervals op via de drukknop Save van de procedure Linear Regression. Oefening 9.6 Met de hand. Oefening b: In de file LOGN_5_.DAT staan 5000 getallen uit een lognormale verdeling met gemiddelde 5 en standaarddeviatie (deze file bestaat uit één variabele). Bekijk de opbouw van de file m.b.v. een tekstverwerkingsprogramma Lees dan deze datafile in via File Open, waarbij je als bestandstype.dat selecteert. Volg vervolgens de instructies van de Text Import Wizard. Gebruik het delimited formaat Geef de variabele in SPSS een naam, bijv. X. Trek uit deze gegevens een steekproef van 000 cases m.b.v. Data Select Cases Random Sample of Cases (zie ook oefening 3.8) Maak een histogram met de procedure Frequencies. Laat de frequentietabel niet afdrukken omdat de variabele X uit 000 waarnemingen bestaat. Pas vervolgens op de getallen van variabele X een logaritmische transformatie toe met de opdracht Transform Compute Variable: COMPUTE LOG_X=LG0(X) Maak van de getransformeerde waarden (= variabele LOG_X) een histogram. I9-3

14 9.7.c: Bereken de logaritme (grondtal 0) van de variabele METHOD_B: Compute LOG_B=LG0(METHOD_B) Voor vervolgens een lineaire regressie analyse uit met LOG_B als afhankelijke variabele. Oefening 9.8 Lees de file RLKENNIS.SAV in die bestaat uit de kennisscores en studiejaren. 9.8.a: Voer een variantieanalyse uit (zie practicum I-8) daarna een lineaire regressie. 9.8.c: Selecteer de eerste 4 studiejaren m.b.v. Data Select Cases. Geef als conditie: Jaar <=4. Oefening 9.9 Voer de variabelen X, Y, X2 en Y2 in het datavenster in. Gebruik de menuoptie Data Select cases om een case te verwijderen. Oefening 9.0 Het gevraagde onder 9.0.a t/m 9.0.f kun je in één keer laten uitvoeren. Oefening 9. vervalt! I9-4

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

Meervoudige lineaire regressie

Meervoudige lineaire regressie Meervoudige lineaire regressie Inleiding In dit hoofdstuk dat aansluit op hoofdstuk II- (deel 2) wordt uitgelegd hoe een meervoudige regressieanalyse uitgevoerd kan worden met behulp van SPSS. Aan de hand

Nadere informatie

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn. Opdracht 12a ------------ enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn score zal zijn bij een latere test op verstandelijke vermogens? Een studie

Nadere informatie

Bijlage 3: Multiple regressie analyse

Bijlage 3: Multiple regressie analyse Bijlage 3: Multiple regressie analyse REGRESSION /DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING PAIRWISE /STATISTICS COEFF OUTS CI(95) R ANOVA COLLIN TOL ZPP /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

Oplossingen hoofdstuk XI

Oplossingen hoofdstuk XI Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij

Nadere informatie

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze Regressie-analyse Regressie-analyse is gericht op het voorspellen van één (numerieke) afhankelijke variabele met behulp van een of meerdere onafhankelijke variabelen (numerieke en/of dummy-variabelen).

Nadere informatie

Analyse van kruistabellen

Analyse van kruistabellen Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger De groothandel Onderwerp: regressieanalyse met SPSS Bij: hoofdstuk 10 Een groothandel heeft onderzoek gedaan onder de klanten en daarbij geprobeerd met regressieanalyse vast te stellen wat de bepalende

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens Hieronder wordt uitgelegd hoe alle analyses besproken in paragraaf 6.5 van

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4) woensdag 8 oktober 9, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven Statistisch

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

* de percentages goed per klas en volgorde van afnemen. sort cases by klas volgorde. split file by klas volgorde. des var=goedboekperc.

* de percentages goed per klas en volgorde van afnemen. sort cases by klas volgorde. split file by klas volgorde. des var=goedboekperc. * Sprekende voorbeelden. * De invloed van lessen op meerkeuzetoetsen Natuurkunde, klas 5 en 6 * Manfred te Grotenhuis en Nico van de Mortel * we gaan uit van de folder 'temp'op de c-drive, svp wijzigen

Nadere informatie

Deze opdracht lossen we eenvoudig op door in de vergelijking X1 en X2 te vervangen door de geobserveerde waarden van deze variabelen:

Deze opdracht lossen we eenvoudig op door in de vergelijking X1 en X2 te vervangen door de geobserveerde waarden van deze variabelen: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 10 1. Volgende regressievergelijking werd opgesteld na onderzoek: YY ii = 6 + 2.5 XX ii1 + 3 XX ii2 + εε ii Bereken de voorspelde

Nadere informatie

Opgave 1: (zowel 2DM40 als 2S390)

Opgave 1: (zowel 2DM40 als 2S390) TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie? Opdracht 13a ------------ Een-factor ANOVA (ANOVA-tabel, Contrasten, Bonferroni) Bij een onderzoek naar de leesvaardigheid bij kinderen in de V.S. werden drie onderwijsmethoden met elkaar vergeleken. Verschillende

Nadere informatie

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient Opdracht 4a ----------- Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient In 1738 werd in de haven van Stockholm voor een aantal landen voor elk land geregistreerd hoeveel schepen

Nadere informatie

Technische uitwerkingen voor het SPSS practicum Inleiding M&T.

Technische uitwerkingen voor het SPSS practicum Inleiding M&T. Technische uitwerkingen voor het SPSS practicum Inleiding M&T. NB Voor de SPSS opgaven wordt alleen aangegeven hoe het door de opgave gevraagde resultaat kan worden bereikt. C. J. Verduin October 19, 2012

Nadere informatie

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit College 7 Regressie-analyse en Variantie verklaren Inleiding M&T 2012 2013 Hemmo Smit Neem mee naar tentamen Geslepen potlood + gum Collegekaart (alternatief: rijbewijs, ID-kaart, paspoort) (Grafische)

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes

Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes Hieronder wordt uitgelegd hoe alle analyses besproken in paragraaf 7.5 van

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Verdelingsvrije statistiek

Verdelingsvrije statistiek Verdelingsvrije statistiek Inleiding In hoofdstuk II-5 (deel ) worden een aantal verdelingsvrije toetsen (ook wel niet-parametrische toetsen) besproken, die gebruikt worden als de te onderzoeken variabele

Nadere informatie

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'.

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'. ** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE=''. ** EERST MAKEN WE EEN OVERZICHT VAN DE DATA **. freq nl_rinc wrkhrs sex. Frequencies Statistics N Valid Missing NL_RINC Resp:

Nadere informatie

Betrouwbaarheid, validiteit en overeenstemming

Betrouwbaarheid, validiteit en overeenstemming Betrouwbaarheid, validiteit en overeenstemming Inleiding Dit practicum sluit aan op het theoriegedeelte over betrouwbaarheidsanalyse van hoofdstuk II-16 (deel 2). In dit hoofdstuk wordt besproken hoe een

Nadere informatie

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf. Opdracht 10a ------------ t-procedures voor gekoppelde paren t-procedures voor twee onafhankelijke steekproeven samengestelde t-procedures voor twee onafhankelijke steekproeven Twee groepen van 10 leraren

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek Opstarten & gegevens inlezen *Inlezen gegevens Via eerste scherm bij opening SPSS of via File; Open; Data. Opletten of namen van variabelen op de eerste rij staan ( Staat ) Opm.: Bij.TXT bestand altijd

Nadere informatie

(slope in het Engels) en het snijpunt met de y-as, b 0

(slope in het Engels) en het snijpunt met de y-as, b 0 8. Regressie Een introductie Al vaak is genoemd dat statistische modellen allemaal neerkomen op uitkomst = model + error. Dit model kun je ook gebruiken om de uitkomst te voorspellen, met een correlatie

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as.

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as. Opdracht 6a ----------- Dichtheidskromme, normaal-kwantiel-plot Een nauwkeurige waarde van de lichtsnelheid is van belang voor ontwerpers van computers, omdat de elektrische signalen zich uitsluitend met

Nadere informatie

Wat gaan we doen? Help! Statistiek! Wat is een lineaire relatie? De rechte-lijn-vergelijking: Y = a + b X. Relatie tussen gewicht en lengte

Wat gaan we doen? Help! Statistiek! Wat is een lineaire relatie? De rechte-lijn-vergelijking: Y = a + b X. Relatie tussen gewicht en lengte Help! Statistiek! Wat gaan we doen? Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Derde woensdag in de maand,

Nadere informatie

Faculteit der Wiskunde en Informatica

Faculteit der Wiskunde en Informatica Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4), op woensdag 7 januari 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel. Opdracht 2a ----------- Stamdiagrammen, histogrammen, tijdreeksgrafieken De Old Farmers Almanac vermeldt de groeiseizoenen voor de grote steden in de V.S., zoals gerapporteerd door het National Climatic

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4 en 2S39) op maandag 2--27, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Fasen in het onderzoeksproces

Fasen in het onderzoeksproces Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1 Bestand opmaken Variabelen definiëren:

Nadere informatie

1 Inleiding spss; Aanwijzingen.

1 Inleiding spss; Aanwijzingen. 1 INLEIDING SPSS; AANWIJZINGEN. 24 april 2007: A.K. en M.d.L. 1 Inleiding spss; Aanwijzingen. = Start Windows Internet Explorer op. Ga naar www.stat.unimaas.nl. Klik op education. Klik op Statistics for

Nadere informatie

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek NB Voor de SPSS opgaven wordt alleen aangegeven hoe het door de opgave gevraagde resultaat kan worden bereikt. C. J. Verduin 11 december

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

Antwoordvel Versie A

Antwoordvel Versie A Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 3 februari 2012 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 27 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

Beschrijvende statistieken

Beschrijvende statistieken Elske Salemink (Klinische Psychologie) heeft onderzocht of het lezen van verhaaltjes invloed heeft op angst. Studenten werden at random ingedeeld in twee groepen. De ene groep las positieve verhaaltjes

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4) woensdag 27 oktober 2, 9.-2. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Grafieken Cirkeldiagram

Grafieken Cirkeldiagram Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable

Nadere informatie

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking Opdracht 9a ----------- t-procedures voor een enkelvoudige steekproef Voor de meting van de leesvaardigheid van kinderen wordt als toets de Degree of Reading Power (DRP) gebruikt. In een onderzoek onder

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

gemiddelde politieke interesse van hoger opgeleide mensen)

gemiddelde politieke interesse van hoger opgeleide mensen) SPSS-oefening 2: Hypothesetoetsen Opgave Oefening 1 a) Het zijn onafhankelijke steekproeven. De scores voor politieke interesse zijn afkomstig van verschillende mensen aangezien elke persoon slechts in

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) dinsdag 2-08-2003, 4.00-7.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek

tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek Inhoudsopgave Rooster 2 Studiemateriaal 2 Werkvormen 2 Toetsing 3 Planningsgroep 3 Traject 4 1 Rooster Dag Datum

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

Meervoudige variantieanalyse

Meervoudige variantieanalyse Meervoudige variantieanalyse Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-12 (deel2) van het statistiekboek, wordt besproken hoe met SPSS gemiddelden van verschillende groepen met elkaar vergeleken

Nadere informatie

STATISTIEK 2 VERSIE A MAT15403 1308-1. Tentamen Statistiek 2 (MAT-15403) Maandag 5 augustus 2013, 11.00-13.00 uur

STATISTIEK 2 VERSIE A MAT15403 1308-1. Tentamen Statistiek 2 (MAT-15403) Maandag 5 augustus 2013, 11.00-13.00 uur STTISTIEK 2 VERSIE MT15403 1308-1 WGENINGEN UNIVERSITEIT LEERSTOELGROEP MT Tentamen Statistiek 2 (MT-15403) Maandag 5 augustus 2013, 11.00-13.00 uur EZE PGIN NIET vóór 11.00 uur OMSLN! STRT MET INVULLEN

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op woensdag 12 november 2008 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op woensdag 12 november 2008 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op woensdag 2 november 28 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Opdracht 3a ----------- Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Voor de meting van de leesvaardigheid van kinderen wordt als

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Introductie SPSS. Hogeschool Gent. Mei 2010. Inhoudsopgave. 1 Introductie 2. 2 One-sample T-test 11. 3 Two-sample T-test 14. 4 Paired T-test 18

Introductie SPSS. Hogeschool Gent. Mei 2010. Inhoudsopgave. 1 Introductie 2. 2 One-sample T-test 11. 3 Two-sample T-test 14. 4 Paired T-test 18 Introductie SPSS Hogeschool Gent Mei 2010 Inhoudsopgave 1 Introductie 2 2 One-sample T-test 11 3 Two-sample T-test 14 4 Paired T-test 18 5 Anova 21 6 Categorische Data-analyse 26 6.1 Binomiaaltoets.................................

Nadere informatie

Residual Plot for Strength. predicted Strength

Residual Plot for Strength. predicted Strength Uitwerking tentamen DS mei 4 Opgave Een uitwerking geven is hier niet mogelijk. Het is van belang het iteratieve optimaliseringsproces goed uit te voeren (zie ook de PowerPoint sheets): screening design

Nadere informatie

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie. Handleiding SPSS tabellen en kruistabellen In een paar stappen van spss data naar bruikbare informatie. A) Het openen van een databestand File \ open \ data Kies de naam van je databestand, bijvoorbeeld

Nadere informatie

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse 10.1 Eenwegs-variantieanalyse: Als we gegevens hebben verzameld van verschillende groepen en we willen nagaan of de populatiegemiddelden van elkaar verscihllen,

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer Endinet Regressie-analyse Energiekamer Laboratory for Industrial Mathematics Eindhoven Postbus 513 5600 MB Eindhoven tel.: 040 247 4875 fax: 040 244 2489 e-mail: lime@tue.nl WWW: http://www.lime.tue.nl

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op donderdag 0-03-2005, 4.00-7.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek II voor TeMa (2S195) op maandag 8-5-26, 9.-12. uur Bij het tentamen mag gebruik worden gemaakt van een (grafisch)

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 5 februari - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 9 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op maandag 08-03-2004, 9.00-2.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,

Nadere informatie

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN Interim Toegepaste Biostatistiek deel december 2009 Versie A ANTWOORDEN C 2 B C A 5 C 6 B 7 B 8 B 9 D 0 D C 2 A B A 5 C Lever zowel het antwoordformulier als de interim toets in Versie A 2. Dit tentamen

Nadere informatie

Hoofdstuk 4. Beschrijvende statistiek. 4.1 Beschrijvende statistiek voor één variabele

Hoofdstuk 4. Beschrijvende statistiek. 4.1 Beschrijvende statistiek voor één variabele Hoofdstuk 4 Beschrijvende statistiek Alle commando s voor statistische berekeningen en analyse bevinden zich onder de optie Analyze in het hoofdmenu. Hieronder worden de verschillende commando s besproken

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2S390) op maandag 19-11-2001, 14.00-17.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Hoofdstuk 8: Multipele regressie Vragen

Hoofdstuk 8: Multipele regressie Vragen Hoofdstuk 8: Multipele regressie Vragen 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted

Nadere informatie

4 Meervoudige lineaire regressie

4 Meervoudige lineaire regressie 4 Meervoudige lineaire regressie In het vorige hoofdstuk is enkelvoudige lineaire regressie besproken. Hierbij was er slechts één onafhankelijke variabele. In de praktijk zijn er echter gevallen waarin

Nadere informatie

Bij het maken van deze opgave worden de volgende vragen beantwoord:

Bij het maken van deze opgave worden de volgende vragen beantwoord: Opdracht 1a ----------- Introductie Bij het maken van deze opgave worden de volgende vragen beantwoord: Hoe start ik S-PLUS op? Hoe lees ik gegevens in vanuit een ASCII-bestand in een tabel? Hoe kan ik

Nadere informatie

feb 2013 Instituut CMI SPSS les 2

feb 2013 Instituut CMI SPSS les 2 feb 2013 Instituut CMI SPSS les 2 Onderzoek toont aan.. Mobiele nieuwssites populairst onder 18-34 jarigen 18 tot 34 jarigen maken over de gehele dag het meest gebruik van mobiel internet. Dit blijkt uit

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

College Week 4 Inspecteren van Data: Verdelingen

College Week 4 Inspecteren van Data: Verdelingen College Week 4 Inspecteren van Data: Verdelingen Inleiding in de Methoden & Technieken 2013 2014 Hemmo Smit Dus volgende week Geen college en werkgroepen Maar Oefententamen on-line (BB) Data invoeren voor

Nadere informatie

Technische uitwerkingen voor het SPSS + R practicum Experimenteel en Correlationeel Onderzoek

Technische uitwerkingen voor het SPSS + R practicum Experimenteel en Correlationeel Onderzoek Technische uitwerkingen voor het SPSS + R practicum Experimenteel en Correlationeel Onderzoek NB Voor de SPSS en R opgaven wordt alleen aangegeven hoe het door de opgave gevraagde resultaat kan worden

Nadere informatie

Moleculaire LevensWetenschappen stroom 1.2

Moleculaire LevensWetenschappen stroom 1.2 MLW Moleculaire LevensWetenschappen stroom 1.2 Methoden en Statistiek werkboek 2005-2006 Inhoudsopgave Blz. Rooster 1 Studiemateriaal 2 Werkvormen 2 Toetsing 2 Planningsgroep 2 Hoorcolleges 3 Werkcolleges

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie