Gegevensverwerving en verwerking
|
|
- Floris van den Pol
- 5 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie - Ordinatie - DFA - Classificatie Websites : => electronic statistic textbook allserv.ugent.be/ ~katdhond/ => reservatie PC zalen / ~tdeprez => lesnota s
2 Lessenrooster + practica ann.vanreusel@ugent.be Excel practicum Diskette meebrengen Bibliotheek 1 sleutel artikel scriptie meebrengen ARC account verlengen of aanvragen ten laatste tegen vrijdag Staalname Zeeleeuw Lijst namen geboortedatum, paspoortnr en te verwittigen personen + coördinaten
3 Wetenschappelijk onderzoek Doel Hypothese Vraagstelling testbaar Staalname of Experiment => verwerven van data Verwerking data d.m.v.statistiek => testen van hypothese = > presentatie Interpretatie => bespreking en vergelijking met literatuur
4 Statistiek is enkel middel om wetenschappelijke gegevens te interpreteren (is geen doel op zich) Onmogelijk om volledige populaties te onderzoeken. Daarom worden stalen of monsters genomen Niet altijd mogelijk om in situ waarnemingen te doen Daarom worden experimenten uitgevoerd Statistiek is een middel om na te gaan in hoever waarneming betrouwbaar is (opgaat voor totale populatie). Hulpmiddel om patronen te herkennen en te beschrijven
5 Voorbeelden In situ - Staalname (ad random) gemeenschapsanalysen populatiedynamica.. - observaties gemeenschapsanalysen gedragsstudies functionele morfologie. In situ Labo - experimenten -manipulaties
6 - type data: variabelen Discreet of continue? Vb tellingen versus metingen Nominaal Vb Kleur, geslacht,.. - schalen Ratio schaal Interval schaal Ordinale schaal Nominale schaal Constante intervalgrootte, 0 punt (vb 30 cm is helft van 60 cm) Constante intervalgrootte, geen 0 punt Vb tijdschaal 0 punt is arbitrair Vb 40 is niet twee x zo warm als 20 Ranking Minder informatie Nominale data
7 Voorstellen van data in datamatrix: rijen en kolommen Aan- en afwezigheid Station 1 Station 2 Station 3 Station 4 Station 5 Station 6 soort soort soort soort Aantallen : densiteiten Station 1 Station 2 Station 3 Station 4 Station 5 Station 6 soort soort soort soort Procentuele abundanties : frequenties Station 1 Station 2 Station 3 Station 4 Station 5 Station 6 soort1 43,8 52,6 12,2 34,4 0,0 16,7 soort2 25,0 11,2 37,7 18,8 0,0 66,7 soort3 0,0 0,0 25,8 6,3 0,0 16,7 soort4 31,3 36,2 24,3 40,6 100,0 0,0 Gekodeerde abundanties (klassen) Station 1 Station 2 Station 3 Station 4 Station 5 Station 6 soort soort soort soort : : : : > 100
8 1e exploratie datamatrix Gemeenschappelijke (meestal ongewenste) kenmerken van dataset : - ruis : variatie tgv meetfouten - overlap of redundantie : 2 of meer variabelen geven zelfde informatie - uitbijters : sterk afwijkende data Variatie : - meetfouten - genetische variatie tussen organismen - invloed omgevingsfactoren Measures for central tendency + measures of dispersion Parameters die gemeenschap beschrijven of karakteriseren schatting of statistiek Griekse letters Latijnse letters
9 Grafische voorstelling van data Samenvatting van data in frequentie tabellen Aantal keren dat een bepaalde meting of telling wordt waargenomen binnen een staal waarbij al dan niet wordt gebruik gemaakt van grootte klassen of intervallen (continue of discrete distributie)
10 Normaal verdeling De frequentiedistributie van een grote biologische dataset ziet er meestal*uit als een normale verdeling niet algemeen zoals oorspronkelijk aangenomen maar toch erg frequent vooral bruikbaar in statistiek = gekoppeld aan wet van centrale tendens : tendens dat meeste observaties symmetrisch rond het gemiddelde liggen
11 Normale verdeling kan beschreven worden aan de hand van gemiddelde µ en standaard deviatie? Het populatiegemiddelde is top van de distributie µ=? x i N De breedte van de distributie wordt weergegeven door de standaard deviatie = afstand van top waar kurve overgaat van convex naar concaaf => geeft weer hoeveel metingen gemiddeld verschillen van het gemiddelde µ. De standaarddeviatie is de vierkantswortel van variantie?? (x i - µ) 2 = N
12 SD heeft zelfde eenheid als gemiddelde?? (x i - µ) 2 ² = N Variantie is som van kwadraat * van alle afwijkingen van het gemiddelde, gedeeld door aantal waarnemingen * kwadraat anders zou som 0 zijn In geval van een normaal verdeling vallen 95 % van alle waarnemingen binnen 1.96 maal de standaard deviatie. 95 % betrouwbaarheidsintervallen 99 % valt binnen 3.29 x SD
13 Schatting van standaarddeviatie Delen door N-1 ipv door N s =? (x i - µ) 2 N-1 Delen door N zou een onderschatting betekenen, vooral wanneer N klein is N-1 is aantal vrijheidsgraden df van een staal of aantal onafhankelijke eenheden om tot gemiddelde µ te komen.? (x i - µ) 2 s² = N-1
14 Hoe ver is gemiddelde een betrouwbare schatting? Stel we nemen een oneindig aantal stalen voor een populatie Voor elk staal wordt een gemiddelde berekend Deze gemiddelde waarden gaan op hun beurt opnieuw een normaal verdeling vertonen central limit theorem Deze normaal verdeling is wel smaller aangezien hoge en lage waarden teniet worden gedaan bij berekening van gemiddelde. De standaard fout of standard error (SE) is maat voor hoeveel gemiddelden gaan verschillen van werkelijk populatiegemiddelde S SE = N
15 SE is net zoals SD buigpunt van de curve. Opnieuw kunnen betrouwbaarheidsintervallen berekend worden. 95 % van gemiddelden vallen binnen 1.96 x SE De schatting van gemiddelde waarden heeft echter eerder t distributie dan normaal distributie SE = s N Vorm van t distributie is gerelateerd aan aantal vrijheidsgraden. Hoe meer df hoe meer t distributie => normaal distributie
16 Betrouwbaarheidsintervallen voor populatiegemiddelde daarom berekend aan de hand van getabelleerde kritische waarde voor t distributie 95 % CI = µ ± t N-1, 5 % x SE Hoe groter de staalgrootte, hoe kleiner betrouwbaarheidsintervallen. Immers hoe groter N, hoe kleiner SE en hoe kleiner t
17 Overige maten voor centrale tendens Mediaan : middelste waarneming in een geordende dataset (50 % punt) Mode : meest voorkomende waarde in een dataset
18 Geometrisch gemiddelde: n x 1 x 2 x 3..x n Antilog 1/n? log x i Het geometrisch gemiddelde is steeds kleiner dan het aritmetisch gemiddelde, tenzij alle data dezelfde waarde hebben aritmetisch geometrisch aritmetisch geometrisch
19 Grafische voorstelling : vervolg Box and whisker plots 2100 mediaan, quartielen en range 1650 gemiddelde, SE, SD Max = Min = ±1.00*Std. Dev. Std. Dev. = VAR2 75% = % = Median value: Med = VAR2 ±1.00*Std. Err. Std. Err. = Mean = gemiddelde, SD, 1,96 SD Gemiddelde, SE, 1.96 SE ±1.96*StDev 1280 ±1.96*Std. Err ±1.00*Std. Dev. Std. Dev. = ±1.00*Std. Err. Std. Err. = VAR2 Mean = VAR2 Mean =
20 Grafische voorstelling : vervolg PH 4 3 No of obs Upper Boundaries (x <= boundary) Expected Normal Normal Probability Plot PH Expected Normal Value Value
21 Cumulatieve frequentiedistributie
22 Transformaties : log (x+1) - maakt frequentiedistributies minder skewed naar rechts => hoogste waarden worden minder hoog Ruwe data densiteiten Log (x+1) getransformeerde data
23 Transformaties : log (x+1) Om een datamatrix met veel 0 waarden te transformeren, wordt een klein getal aan de oorspronkelijke waarden toegevoegd Voor tellingen voegt men meestal 1 toe zodat b = log (0+1)=0 RAW Log X Log X+1 0 #NUM! , ,699 0, ,000 1, ,000 2, ,000 4, ,000 5, ,000 6, ,000 7, ,000 8,000
24 Betere fit voor normaal verdeling 2.5 Normal Probability Plot ruwe data 1.5 Expected Normal Value Value 2.5 Normal Probability Plot log transformatie 1.5 Expected Normal Value Value
25 De varianties worden onafhankelijk van gemiddelden Box & Whisker Plot Box & Whisker Plot RUW 3.0 LOG (x+1) RUW1 RUW2 0.6 ±Std. Dev. ±Std. Err. 0.0 Mean LOG1 LOG2 ±Std. Dev. ±Std. Err. Mean Algemeen gebruikt voor drie redenen : statistisch aantrekkelijk dat data normaal verdeeld zijn Om minder gewicht te geven aan dominante soorten en meer gewicht aan kwalitatieve aspecten Voor omgevingsvariabelen: als weergave van de lineaire respons van soorten tov het logaritme van omgevingsvariabelen
26 Tweede en vierdemachtswortel transformaties => maakt variantie onafhankelijk van het gemiddelde Box & Whisker Plot Box & Whisker Plot ruw square root foorth root ±Std. Dev. ±Std. Err Mean VAR2 SQRT2 FTHRT2 ±Std. Dev. ±Std. Err. Mean Vergelijkbaar maar minder drastisch dan de logtransformatie Machtstransformatie p = 0 aan- afwezigheid p = 0.5 vierkantswortel p = 0.25 vierdemachts wortel
27 Arc sinus (vierkantswortel)transformatie => spreidt grote en kleine waarden meer uit => drukt middelste waarden samen PROPORTIONS ARCSINE SQUARE ROOT TRANSFORMATION % ( 2 /?? arcsin( x / =(2/3,141592)*ASIN((X/100)^(1/2)) Deze transformatie wordt aanbevolen voor procentuele data Data moeten varieren tussen 0 en 1 The arc sinus (vierkantswortel) wordt vermenigvuldigd met 2/? Om de resultaten van de arcsinus (x) uit te drukken in radialen van 0 tot 1
28 Standardisatie van variabelen uitgedrukt in verschillende eenheden Vb een verschil van 1 eenheid in ph is duidelijk verschillend van een verschil van 1 microgram fosfaat Vervang metingen door een rank nummer Vervang elke meting door de afwijking tov de gemiddelde waarde berekend over alle metingen (= centring) Standardiseer naar een gemiddelde van 0 en variantie 1 Yki yki yavg) / SD? (? PSU m C Saliniteit 1/Secchi diepte Temperatuur Saliniteit 1/Secchi diepte Temperatuur w w w30a w30a w30b w30b w30c w30c w w w w w25a w25a w25b w25b w w w w w w w w w w avg avg SD SD
Gegevensverwerving en verwerking
Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie
Nadere informatieGegevensverwerving en verwerking
Gegevensverwerving en verwerking Staalname Bibliotheek - aantal stalen/replicaten - grootte staal - apparatuur - beschrijvend - variantie-analyse Experimentele setup Statistiek - correlatie - regressie
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door
Nadere informatieHoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent
Hoofdstuk 3 : Numerieke beschrijving van data Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Numerieke beschrijving van data p 1/31 Beschrijvende
Nadere informatieHoofdstuk 10: Regressie
Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.
Nadere informatieSPSS Introductiecursus. Sanne Hoeks Mattie Lenzen
SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen
Nadere informatieInleiding Applicatie Software - Statgraphics
Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een
Nadere informatieCursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015
Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»
Nadere informatieOefenvragen bij Statistics for Business and Economics van Newbold
Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd
Nadere informatieInleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek
Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje
Nadere informatie9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
Nadere informatieFormules Excel Bedrijfsstatistiek
Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor
Nadere informatieHoofdstuk 7: Statistische gevolgtrekkingen voor distributies
Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatiewerkcollege 6 - D&P9: Estimation Using a Single Sample
cursus 9 mei 2012 werkcollege 6 - D&P9: Estimation Using a Single Sample van frequentie naar dichtheid we bepalen frequenties van meetwaarden plot in histogram delen door totaal aantal meetwaarden > fracties
Nadere informatieFrequentiematen voor ziekte: Hoe vaak komt de ziekte voor
Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor 4 juni 2012 Het voorkomen van ziekte kan op drie manieren worden weergegeven: - Prevalentie - Cumulatieve incidentie - Incidentiedichtheid In de
Nadere informatieintroductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets
toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd
Nadere informatieStatistiek I Samenvatting. Prof. dr. Carette
Statistiek I Samenvatting Prof. dr. Carette Opleiding: bachelor of science in de Handelswetenschappen Academiejaar 2016 2017 Inhoudsopgave Hoofdstuk 1: Statistiek, gegevens en statistisch denken... 3 De
Nadere informatieG0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing
G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag
Nadere informatieHoofdstuk 5 Een populatie: parametrische toetsen
Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen
Nadere informatieHoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1
Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch
Nadere informatieInhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox
van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox Bram Ramaekers Bianca de Greef KEMTA Masterclass Inhoud Data Kaplan-Meier curve Hazard rate Log-rank test Hazard ratio Cox regressie
Nadere informatieAanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling
Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl
Nadere informatieHet gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.
Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen. 1. (a) In de appendix van deze vraag, is een dataset gegeven met de corresponderende
Nadere informatieCollege 2 Enkelvoudige Lineaire Regressie
College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:
Nadere informatieVoorbeeldtentamen Statistiek voor Psychologie
Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij
Nadere informatieintroductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 5: Sampling Distributions 5.1: The
Nadere informatieStatistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2
INHOUDSOPGAVE Leswijzer...3 Beschrijvende Statistiek...3 Kansberekening...3 Inductieve statistiek, inferentiele statistiek...3 Hoofdstuk...3. Drie deelgebieden...3. Frequentieverdeling....3. Frequentieverdeling....4.5
Nadere informatieStatistische variabelen. formuleblad
Statistische variabelen formuleblad 0. voorkennis Soorten variabelen Discreet of continu Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Bij een discrete
Nadere informatieStatistiek voor A.I. College 1. Dinsdag 11 September 2012
Statistiek voor A.I. College 1 Dinsdag 11 September 2012 1 / 39 Literatuur Website: http://phil.uu.nl/statistiek/ Applied Statistics for the Behavioral Sciences - 5th edition, Dennis E. Hinkle, William
Nadere informatieExamen G0N34 Statistiek
Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium
Nadere informatieCollege 4 Inspecteren van Data: Verdelingen
College Inspecteren van Data: Verdelingen Inleiding M&T 01 013 Hemmo Smit Overzicht van deze cursus 1. Grondprincipes van de wetenschap. Observeren en meten 3. Interne consistentie; Beschrijvend onderzoek.
Nadere informatieCollege Week 4 Inspecteren van Data: Verdelingen
College Week 4 Inspecteren van Data: Verdelingen Inleiding in de Methoden & Technieken 2013 2014 Hemmo Smit Dus volgende week Geen college en werkgroepen Maar Oefententamen on-line (BB) Data invoeren voor
Nadere informatieHOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES
HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden
Nadere informatieEnkelvoudige ANOVA Onderzoeksvraag Voorwaarden
Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd
Nadere informatieSPSS. Statistiek : SPSS
SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik
Nadere informatieHoofdstuk 12: Eenweg ANOVA
Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake
Nadere informatie4 Domein STATISTIEK - versie 1.2
USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum
Nadere informatieLes 1: de normale distributie
Les 1: de normale distributie Elke Debrie 1 Statistiek 2 e Bachelor in de Biomedische Wetenschappen 18 oktober 2018 1 Met dank aan Koen Van den Berge Indeling lessen Elke bullet point is een week. R en
Nadere informatieToegepaste Statistiek, Week 6 1
Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën
Nadere informatieOnderzoek. B-cluster BBB-OND2B.2
Onderzoek B-cluster BBB-OND2B.2 Succes met leren Leuk dat je onze bundels hebt gedownload. Met deze bundels hopen we dat het leren een stuk makkelijker wordt. We proberen de beste samenvattingen voor jou
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses
Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling
Nadere informatietoetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.
Nadere informatieExamen Statistiek I Feedback
Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).
Nadere informatieClassification - Prediction
Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training
Nadere informatieInleiding statistiek
Inleiding Statistiek Pagina 1 uit 8 Inleiding statistiek 1. Inleiding In deze oefeningensessie is het de bedoeling jullie vertrouwd te maken met een aantal basisbegrippen van de statistiek, meer bepaald
Nadere informatie1. Reductie van error variantie en dus verhogen van power op F-test
Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De
Nadere informatieStatistiek. Beschrijvend statistiek
Statistiek Beschrijvend statistiek Verzameling van gegevens en beschrijvingen Populatie, steekproef Populatie = o de gehele groep ondervragen o parameter is een kerngetal Steekproef = o een onderdeel van
Nadere informatieHOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN
HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.
VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT
Nadere informatieMeervoudige ANOVA Onderzoeksvraag Voorwaarden
Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd
Nadere informatieToetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling
Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Moore, McCabe & Craig: 3.3 Toward Statistical Inference From Probability to Inference 5.1 Sampling Distributions for
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en
Nadere informatieStatistiek: Centrummaten 12/6/2013. dr. Brenda Casteleyn
Statistiek: Centrummaten 12/6/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie 1) Nominaal niveau: Gebruik de Modus, dit is de meest frequente waarneming 2) Ordinaal niveau:
Nadere informatiec Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6
c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek (2S390) op maandag ,
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek (2S390) op maandag 20-11-2000, 14.00-17.00 uur ƒbij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieInleiding tot de meettheorie
Inleiding tot de meettheorie Meten is het toekennen van cijfers aan voorwerpen. Koeien Koeien in een kudde, studenten in een auditorium, mensen met een bepaalde stoornis, leerlingen met meer dan 15 in
Nadere informatieMeten en experimenteren
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006 Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie
Nadere informatieHoofdstuk 2 : Grafische beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent
Hoofdstuk 2 : Grafische beschrijving van data Marnix Van Daele Marnix.VanDaele@UGent.be Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Grafische beschrijving van data p. 1/35 Soorten meetwaarden
Nadere informatieDe Collegereeks Statistiek. statistiek. Statistiek in het dagelijkse nieuws. Statistiek Hoorcollege 1. Descriptieve statistiek ttitik
9/8/009 De Collegereeks Statistiek Statistiek Hoorcollege 1 Descriptieve statistiek ttitik Informatiekunde Universiteit Utrecht Dr. H. Prüst (37): Descriptieve statistiek (H 1,,3) (HP) 3(38): Score & Kans
Nadere informatie8. Analyseren van samenhang tussen categorische variabelen
8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde
Nadere informatieFormuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i
Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de
Nadere informatieOnderzoeksmethoden: Statistiek 1
0 123458898391081904749010998490849 074907079`794793784908`094389983.. Onderzoeksmethoden: Statistiek 1 Joepie, ons computerprogramma levert output Wat doen we hiermee? Marjan van den Akker 1 2 Output
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieFiguur 1: Normale verdeling. Bij een normale verdeling geldt dat ongeveer:
Kwaliteitscontrole door middel van Biologisch ijken Patrick Jak ( PMC.Jak@Vumc.nl ) en Herman Groepenhoff ( H.Groepenhoff@vumc.nl ) VU Medisch Centrum, Amsterdam. Een belangrijk hulpmiddel bij biologisch
Nadere informatiePopulaties beschrijven met kansmodellen
Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.
Nadere informatieHoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren
Hoofdstuk 18 Verbanden tussen variabelen vaststellen en interpreteren Analyse van verbanden Analyse van verbanden: bij de analyse van verbanden stel je vast of er een stabiel verband bestaat tussen twee
Nadere informatietoetskeuze schema verschillen in gemiddelden
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets week 5: het toetsen van
Nadere informatieKansrekening en statistiek wi2105in deel 2 16 april 2010, uur
Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop
Nadere informatieStatistiek voor A.I.
Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het
Nadere informatieVertaling van enkele termen uit de kansrekening en statistiek alternative hypothesis alternatieve hypothese approximate methods benaderende methoden asymptotic variance asymptotische variantie asymptotically
Nadere informatieMethoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2
Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte
Nadere informatieExtra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van
Extra Opgaven 1. Een persoon doet een HIV-test. Helaas is de uitslag positief. De test is echter niet perfect. De persoon vraagt zich af wat de kans is dat hij nu ook echt HIV heeft. Gegeven is: de kans
Nadere informatieA. Week 1: Introductie in de statistiek.
A. Week 1: Introductie in de statistiek. Populatie en steekproef. In dit vak leren we de basis van de statistiek. In de statistiek probeert men erachter te komen hoe we de populatie het beste kunnen observeren.
Nadere informatieInterim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN
Interim Toegepaste Biostatistiek deel december 2009 Versie A ANTWOORDEN C 2 B C A 5 C 6 B 7 B 8 B 9 D 0 D C 2 A B A 5 C Lever zowel het antwoordformulier als de interim toets in Versie A 2. Dit tentamen
Nadere informatieStatistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1
Statistiek II Sessie 1 Verzamelde vragen en feedback Deel 1 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 1 1 Staafdiagram 1. Wat is de steekproefgrootte? Op de horizontale as vinden we de respectievelijke
Nadere informatieLes 2: Toetsen van één gemiddelde
Les 2: Toetsen van één gemiddelde Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie & Biotechnologie 22 oktober 2018 Het statistisch testen van één gemiddelde is een veel voorkomende toepassing
Nadere informatieWe berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies
Nadere informatieGegevensverwerving en verwerking
Gegevensverwervng en verwerkng Staalname Bblotheek - aantal stalen/replcaten - grootte staal - apparatuur - beschrjvend - varante-analyse Expermentele setup Statstek - correlate - regresse - ordnate -
Nadere informatieEnkelvoudige lineaire regressie
Enkelvoudige lineaire regressie Inleiding Dit hoofdstuk sluit aan op hoofdstuk I-9 van het statistiekboek. Er wordt hier steeds gesproken over het verband tussen één afhankelijke variabele Y en één onafhankelijke
Nadere informatieANTWOORDEN Statistiek
ANTWOORDEN Statistiek cursuscode 200300427, cursusjaar 2004-2005, blok 2 maandag 31 januari 2005, 15:00-17:30 uur, Trans 10, zaal 0.17 Schrijf je naam en student-nummer op elk vel papier dat je inlevert.
Nadere informatie11. Multipele Regressie en Correlatie
11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in
Nadere informatieWe illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten
Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van
Nadere informatieStatistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn
Statistiek: Spreiding en dispersie 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Met spreiding willen we in één getal uitdrukken hoe verspreid de gegevens zijn: in hoeveel
Nadere informatieOnderzoeksmethodiek LE: 2
Onderzoeksmethodiek LE: 2 3 Parameters en grootheden 3.1 Parameters Wat is een parameter? Een karakteristieke grootheid van een populatie Gem. gewicht van een 34-jarige man 3.2 Steekproefgrootheden Wat
Nadere informatieMeten en experimenteren
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 5 oktober 007 Catherine De Clercq Statistische verwerking van gegevens Kursus statistiek voor fysici door Jorgen D Hondt
Nadere informatieToegepaste Statistiek, Week 3 1
Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is
Nadere informatieToegepaste Statistiek, Dag 7 1
Toegepaste Statistiek, Dag 7 1 Statistiek: Afkomstig uit het Duits: De studie van politieke feiten en cijfers. Afgeleid uit het latijn: status, staat, toestand Belangrijkste associatie: beschrijvende statistiek
Nadere informatieHOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK
HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK 1 1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen I.
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 9 Woensdag 7 Oktober 1 / 51 Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie 2 / 51 Kansrekening en Statistiek? Bevordert luieren de fantasie? Psychologie
Nadere informatieOplossingen hoofdstuk 8
Count Count Oplossingen hoofdstuk 8 1. Plaats de volgende eigenschappen bij de gegeven verdelingen. De eigenschappen kunnen voorkomen bij meerdere verdelingen. Plaats bij elke eigenschap het hierbij horende
Nadere informatieb. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.
Opdracht 12a ------------ enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn score zal zijn bij een latere test op verstandelijke vermogens? Een studie
Nadere informatieBij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R
14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten
Nadere informatie5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:
5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van
Nadere informatiemlw stroom 2.1: Statistisch modelleren
mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht
Nadere informatieProfessionaliseringstraject onderzoeksvaardigheden voor docenten. prof. dr. Saskia Brand-Gruwel
Professionaliseringstraject onderzoeksvaardigheden voor docenten prof. dr. Saskia Brand-Gruwel Leerdoelen Na het volgen van dit professionaliseringtraject: heeft u kennis en inzicht in de gehele onderzoekscyclus;
Nadere informatie