Toegepaste Statistiek, Dag 7 1

Vergelijkbare documenten
Data analyse Inleiding statistiek

Hoofdstuk 10: Regressie

College 2 Enkelvoudige Lineaire Regressie

9. Lineaire Regressie en Correlatie

11. Multipele Regressie en Correlatie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

HOOFDSTUK VII REGRESSIE ANALYSE

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Oefenvragen bij Statistics for Business and Economics van Newbold

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Hoofdstuk 3 Statistiek: het toetsen

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

mlw stroom 2.1: Statistisch modelleren

Statistiek 2 deel A 30 minuten over statistisch toetsen

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

1. Reductie van error variantie en dus verhogen van power op F-test

Kansrekening en Statistiek

College 2 Enkelvoudige Lineaire Regressie

Feedback examen Statistiek II Juni 2011

8. Analyseren van samenhang tussen categorische variabelen

1. Statistiek gebruiken 1

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Statistiek II. Sessie 5. Feedback Deel 5

Tentamen Biostatistiek 3 / Biomedische wiskunde

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Hoofdstuk 2. Aanduiding 1: Aanduiding 2: Formule 1: Formule 2: s2 x = Formule 3: s x = Formule 4: X nieuw = X oud ± a betekent ook

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Ene variabele. Nonparametrische toetsen. Kolmogorov-Smirnov. Kolmogorov-Smirnov. Andere variabele. Onderzoekspracticum.

Statistiek ( ) eindtentamen

Sterrenkunde Praktikum 1 Fouten en fitten

Hoofdstuk 6 Twee populaties: parametrische toetsen

Kansrekening en Statistiek

Statistiek voor A.I. College 2. Donderdag 13 September 2012

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Toegepaste data-analyse: oefensessie 2

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Toegepaste Statistiek, Week 3 1

Hoofdstuk 8: Multipele regressie Vragen

Inhoudsopgave. Deel I Schatters en toetsen 1

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Kansrekening en Statistiek

Opgaven hoofdstuk 12 Enkelvoudige lineaire regressie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

Hoofdstuk 12: Eenweg ANOVA

Oriëntatie Econometrie Tijdreeksmodellen en Voorspellen. Marius Ooms. 23 April 2002, Amsterdam

Examen Statistiek I Feedback

4 Domein STATISTIEK - versie 1.2

Hoofdstuk 2: Verbanden

Gegevensverwerving en verwerking

Toegepaste Wiskunde 2: Het Kalman-filter

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

2.9 Het adolescentieonderzoek Opgaven 72

Kansrekening en Statistiek

Examen G0N34 Statistiek

Statistiek: Vorm van de verdeling 1/4/2014. dr. Brenda Casteleyn

College 6 Eenweg Variantie-Analyse

Voorbeeldtentamen Statistiek voor Psychologie

Experimenteel en Correlationeel Onderzoek (ECO)

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Tentamen Voortgezette biostatistiek / Biomedische wiskunde

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Toegepaste biostatistiek

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

Experimenteel en Correlationeel Onderzoek

Meten en experimenteren

Kansrekening en Statistiek

3de bach HI. Econometrie. Volledige samenvatting. uickprinter Koningstraat Antwerpen A 11,00

Gebruik van Correlatiecoëfficiënt in onderzoek

Hoofdstuk 5 Een populatie: parametrische toetsen

Les 7-8: Parameter- en Vergelijkingstoetsen

Transcriptie:

Toegepaste Statistiek, Dag 7 1 Statistiek: Afkomstig uit het Duits: De studie van politieke feiten en cijfers. Afgeleid uit het latijn: status, staat, toestand Belangrijkste associatie: beschrijvende statistiek Stochastiek: Afgeleid uit het Grieks: Vaardigheid in het gissen (voorspellen) stochazesthai, gissen Belangrijkste associatie: verklarende statistiek Het doen van, en het omgaan met, onzekere uitspraken Onzekerheid kwantificeren binnen een model Giskunde? Wiskunde: Het doen van, omgaan met, gewisse (zekere) uitspraken met name, zekerheid binnen een model vb. klassieke mechanica, zwaartekracht

Toegepaste Statistiek, Dag 7 2 1 Ordinale variabele G. 2 Nominale variabelen C (behandelingen) en B (soorten). Ordinale variabele normaal verdeeld binnen iedere combinatie van C- en B-categorie EN variantie hangt niet af van de categorieën. In formule: G {c i, b j } = µ + α ci + β bj + γ ci,b j + ε waar de verdelingsfunctie van ε niet afhangt van c i en b j, EN normaal is met gemiddelde 0. Hoofdeffecten: termen α ci en β bj Interactie/Wisselwerking: term γ ci,b j Voorbeeld hypotheses: H 0 : α c hangt niet van de categorie c af. Alternatieve hypothese: de α c niet allen gelijk. Gebruikelijker in de contekst met interactieterm: H 0 : er is geen interactie, de γ-coëfficiënten zijn gelijk (aan 0) Alternatieve hypothese: er is interactie In het geval er interactie is, niet meer toetsen op de hoofdeffecten Twee-weg variantie-analyse (ANOVA). Zie pag. 103 Voorbeeld Example.xls (op I-schijf)

Toegepaste Statistiek, Dag 7 3 Twee-weg variantie-analyse met replicatie Evenveel proefnemingen (2 of meer) per combinatie c i, b j Makkelijk te interpreteren Excel output Twee-weg variantie-analyse zonder replicatie Modelformule: G {c i, b j } = µ + α ci + β bj + ε waar de verdelingsfunctie van ε niet afhangt van c i en b j, EN normaal is met gemiddelde 0. Per combinatie c i, b j wordt er slechts één proefneming gedaan Gevolg: Te weinig informatie om interactie te beoordelen Voorbeeld: Werkzaam bestanddeel Toedieningswijze I II III IV drank 50 35 25 40 pil 20 25 15 30 capsule 45 10 30 35 H 0 : Hoofd-effecten toedieningswijze zijn gelijk (aan 0) of H 0 : Hoofd-effecten werkzame bestanddeel zijn gelijk (aan 0)

Toegepaste Statistiek, Dag 7 4 Nonparametrische versie van Twee-weg variantie-analyse zonder replicatie Friedman-toets (pag.106) Tabel: Urine uitscheiding in ml bij drie personen en vier soorten plaspillen Pillensoorten Persoon I II III IV A 50 35 25 40 B 20 25 15 30 C 45 10 30 35 We zijn niet geïnteresseerd in de blokvariabele Persoon H 0 : de pillen zijn gelijkwaardig Modelformule: G {X, J} = µ + α X + β J + ε waar ε bij gegeven persoon X onafhankelijk is van soort J. Gevolg van H 0 : β I = = β IV In rij X is iedere volgorde G X,I,..., G X,IV even waarschijnlijk. Volg berekening in dictaat.

Toegepaste Statistiek, Dag 7 5 Regressie-analyse, pag. 109 2 ordinale variabelen geïnteresseerd in een (lineaire) afhankelijkheid Y afhankelijke variabele, X verklarende variabele Modelformule: Y = a X + b + ε ε onafhankelijk van de X-waarde, toevallige afwijking, normaal verdeeld met variantie σ 2 b : intercept a : helling, slope Gebruikelijke analyse geeft schatting van a en b Gebruikelijke H 0 : a = 0, d.w.z. Y onafhankelijk van X Bij data Y i, X i, i = 1,..., n worden a en b geschat door kleinste kwadraten oplossing van probleem Minimaliseer (Y i a X i b) 2 i=1 Oplossing (som steeds over alle proefnemingen): Residuen: n â = Σ(X i X n ) (Y i Ȳn) Σ(X i X n ) 2 ˆb = Ȳ n â X n e i = Y i â X i ˆb, Residuele variantie (schatting van σ 2 ): s 2 R = 1 n 2 Σe2 i i = 1,..., n

Toegepaste Statistiek, Dag 7 6 Correlatie (pag. 114): Gebruikelijk als er niet zo n afhankelijke/verklarende relatie is voor de 2 ordinale variabelen Y en X. Gebruikelijke modelaanname: X normaal verdeeld, en er is a zo dat bij iedere gegeven X-waarde, Y a X normaal verdeeld is met gemiddelde en variantie onafhankelijk van de X-waarde. C XY = 1 n 1 n i=1 (X i X n )(Y i Ȳn) covariantie s 2 X = 1 n n 1 i X n ) 2 i=1 variantie s 2 Y = 1 n n 1 i Ȳn) 2 i=1 variantie Pearson product-moment correlatie r = C XY s X s Y r ligt altijd tussen 1 en 1 in. Als gelijk 1 of 1 dan Y i = a X i + b exact met (a < 0, resp a > 0) C XY = 1 n 1lengte(x) lengte(y) cosinus( (x, y)) met x i = X i X n en y i = Y i Ȳn lengte(x) = n 1 s X, lengte(y) = n 1 s Y Dan blijkt r = cosinus( (x, y)) Toetsing: H 0 : X en Y onafhankelijk (ofwel a = 0, ofwel de populatiecorrelatie is 0)

Toegepaste Statistiek, Dag 7 7 Spearman rang-orde correlatie Kijkt in hoevere hogere X-waarden samengaan met hogere of lagere Y -waarden Transformeer de waarden: Vervang de waarde X i door zijn rangnummer in volgorde van grootte, R i, in de rij X 1,..., X n Vervang de waarde Y i door zijn rangnummer in volgorde van grootte, S i, in de rij Y 1,..., Y n Bereken d i = R i S i r s = de Pearson product-moment correlatie van R en S is wiskundig gelijk aan r s = 1 6 n i=1 d 2 i n 3 n