Impactevaluatie. Mogelijkheden en aandachtspunten

Vergelijkbare documenten
College 4 Experimenteel Onderzoek en Experimentele Controle

Experimenteel Onderzoek en Experimentele Controle

De Relatie Tussen Persoonskenmerken en Ervaren Lijden bij. Verslaafde Patiënten met PTSS

Effecten van contactgericht spelen en leren op de ouder-kindrelatie bij autisme

Positieve, Negatieve en Depressieve Subklinische Psychotische Symptomen en het Effect van Stress en Sekse op deze Subklinische Psychotische Symptomen

Intercultural Mediation through the Internet Hans Verrept Intercultural mediation and policy support unit

Beïnvloedt Gentle Teaching Vaardigheden van Begeleiders en Companionship en Angst bij Verstandelijk Beperkte Cliënten?

Fidelity of a Strengths-based method for Homeless Youth

De Rotterdamse Ambtenaar: Bevroren of Bevlogen. Over de Invloed van Procedurele Rechtvaardigheid, Empowering Leiderschap en

De Relatie tussen Lichamelijke Gezondheid, Veerkracht en Subjectief. Welbevinden bij Inwoners van Serviceflats

Tahnee Anne Jeanne Snelder. Open Universiteit

Running head: OPVOEDSTIJL, EXTERNALISEREND PROLEEMGEDRAG EN ZELFBEELD

Effecten van een op MBSR gebaseerde training van. hospicemedewerkers op burnout, compassionele vermoeidheid en

Developing an adaptive, diagnostic test of. English writing skills

MENTALE VEERKRACHT ALS BUFFER TEGEN DOCENTEN STRESS 1. Mentale Veerkracht als Buffer tegen Docenten Stress-Reactiviteit: een ESM-studie

Running head: INVLOED VAN GENDERROL EN WAARDEN OP FAALANGST 1. Zelf- en Ander-Gerefereerde Faalangst: De Invloed van Genderrol Oriëntatie, Waarden

CSRQ Center Rapport over onderwijsondersteunende organisaties: Samenvatting voor onderwijsgevenden

Evidence Based Management? Maxime Congres Groep Maatwerk The Vigor Unit

COGNITIEVE DISSONANTIE EN ROKERS COGNITIVE DISSONANCE AND SMOKERS

Assessing writing through objectively scored tests: a study on validity. Hiske Feenstra Cito, The Netherlands

Relatie tussen Persoonlijkheid, Opleidingsniveau, Leeftijd, Geslacht en Korte- en Lange- Termijn Seksuele Strategieën

3e Mirror meeting pren April :00 Session T, NVvA Symposium

Deze test werd ontwikkeld en aangewend om het medicatiemanagement en de verschillende aspecten hiervan te evalueren in de ambulante zorg.

Running head: MINDFULNESS, CONTINGENTE ZELFWAARDERING EN DEPRESSIE 1. De Invloed van een Gecombineerde Mindfulnessbehandeling op

De Invloed van Innovatiekenmerken op de Intentie van Leerkrachten. een Lespakket te Gebruiken om Cyberpesten te Voorkomen of te.

Het Verband Tussen Negatieve Levensgebeurtenissen, 5-HTTLPR en Reactieve. Agressie. Pien S. Martens. Open Universiteit Heerlen

Verklaring van het beweeggedrag van ouderen door determinanten van. The explanation of the physical activity of elderly by determinants of

Invloed van het aantal kinderen op de seksdrive en relatievoorkeur

Inleiding Wat zijn paradata en welke data voor welk gebruik. verzamelen?

Evaluation of Measurement Uncertainty using Adaptive Monte Carlo Methods

Feedback WG System Operations 21 November 2012

Samenvatting Methoden van Onderzoek

Cognitieve Bias Modificatie van Interpretatiebias bij Faalangstige Studenten

Het Effect van Gender op de Relatie tussen Persoonlijkheidskenmerken en Seksdrive

De Relatie tussen Mindfulness en Psychopathologie: de Mediërende. Rol van Globale en Contingente Zelfwaardering

Falende Interpretatie? De Samenhang van Faalangst met Interpretatiebias

Dagelijkse Stress en Snackgewoonte: de. Modererende Rol van Persoonlijkheid. Daily Stress and Snack Habit: the. Moderating Role of Personality

Dysphagia Risk Assessment for the Community-dwelling Elderly


Samenvatting M&T1 Dooley, Social Research Methods

Process Mining and audit support within financial services. KPMG IT Advisory 18 June 2014

Het Verband Tussen Persoonlijkheid, Stress en Coping. The Relation Between Personality, Stress and Coping

Karen J. Rosier - Brattinga. Eerste begeleider: dr. Arjan Bos Tweede begeleider: dr. Ellin Simon

Knelpunten in Zelfstandig Leren: Zelfregulerend leren, Stress en Uitstelgedrag bij HRM- Studenten van Avans Hogeschool s-hertogenbosch

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

De Invloed van Perceived Severity op Condoomgebruik en HIV-Testgedrag. The Influence of Perceived Severity on Condom Use and HIV-Testing Behavior

AdVISHE: Assessment of the Validation Status of Health- Economic Decision Models

UITBESTEDING DOOR VERZEKERAARS: EFFECTEN OP HET SOLVABILITEITSBESLAG. # Het begint met een idee

Het Effect van Voortgangsfeedback aan Behandelaars op de Uitkomsten van Psychologische Behandelingen; een Pilot Onderzoek

Master thesis. Naam student: S. Friederichs Studentnummer: Afstudeerrichting: Klinische Psychologie

Verschil in Perceptie over Opvoeding tussen Ouders en Adolescenten en Alcoholgebruik van Adolescenten

Pesten onder Leerlingen met Autisme Spectrum Stoornissen op de Middelbare School: de Participantrollen en het Verband met de Theory of Mind.

DE GEÏNTEGREERDE SPOEDPOST

Systematic and Random Error in a Mixed Mode Online-Telephone Survey:

Longitudinal Driving Behaviour At Incidents And The Influence Of Emotions. Raymond Hoogendoorn

Voorspellers van Leerbaarheid en Herstel bij Cognitieve Revalidatie van Patiënten met Niet-aangeboren Hersenletsel

Invloed van Mindfulness Training op Ouderlijke Stress, Emotionele Self-Efficacy. Beliefs, Aandacht en Bewustzijn bij Moeders

De Effecten van de Kanker Nazorg Wijzer op Psychologische Distress en Kwaliteit van. Leven

Cognitieve Bias Modificatie van Interpretatiebias bij Faalangstige Studenten

de Rol van Persoonlijkheid Eating: the Role of Personality

Introductie in flowcharts

De Rol van Zelfregulatie, Motivatie en Eigen Effectiviteitsverwachting op het Volhouden

Spitzer quality of life index

Hechting en Psychose: Attachment and Psychosis:

Behandeleffecten. in Forensisch Psychiatrisch Center de Rooyse Wissel. Treatment effects in. Forensic Psychiatric Centre de Rooyse Wissel

Lijst van figuren. Lijst van tabellen

Validatie van de Depressie lijst (DL) en de Geriatric Depression Scale (GDS-30) bij Verpleeghuisbewoners

De invloed van veerkracht op de relatie tussen pijn en psychische klachten bij revalidatiecliënten in een verpleeghuis.

Landelijk Diabetes Congres 2016

De Relatie tussen Ervaren Organisatiecultuur en Organizational. Commitment in de Periode na een Overname.

E-learning maturity model. Hilde Van Laer

Vertrouwen, Faalangst en Interpretatiebias bij. Kinderen

Beheersen van stoffenrisico's

Motivationele oriëntatie bij sociale vergelijking: Wanneer, waarom en met wie vergelijken?

D) Alle drie de variabelen kunnen zowel afhankelijke als onafhankelijke variabelen zijn.

College 5 Experimentele en Quasi- Experimentele Proefopzetten

University of Groningen. Who cares? Kamstra, Aafke

Opleiding PECB ISO 9001 Quality Manager.

Seksdrive, Stresscoping en Extrinsieke Ambitie : De Verschillen tussen Mannen en Vrouwen. Sexdrive, Stresscoping and Extrinsic Ambition :

Mahoney en Barthel Functionele beoordeling Beoordeling van de dagdagelijkse activiteiten Chronisch zieke patiënten, ouderen

The downside up? A study of factors associated with a successful course of treatment for adolescents in secure residential care

Executief Functioneren en Agressie. bij Forensisch Psychiatrische Patiënten in PPC Den Haag. Executive Functioning and Aggression

Ferrell, B. A., Artinian, B. M., & Sessing, D. (1995). The Sessing scale for assessment of pressure ulcer healing. J.Am.Geriatr.Soc., 43,

Data fusion & Geo-psychographical database

Development of the diabetes problem solving measure for adolescents. Diabetes Educ 27: , 2001

Welke Factoren hangen samen met Kwaliteit van Leven na de Kanker Behandeling?

Methodes voor dataverzameling en -analyse

Behavioural Insights Applied to Policy Ontsluiten van gedragskennis, een Europees verhaal

Geloof in een Rechtvaardige Wereld en Afkeuring van Geweldsslachtoffers: De Invloed

Adviseren over onderzoeksmethoden: Het meten en analyseren van verandering

Risico s van Technologisch Succes in digitale transformatie S T R A T E G I C A D V I S O R

Competencies atlas. Self service instrument to support jobsearch. Naam auteur

Alcohol policy in Belgium: recent developments

Flood risk developments in the Rhine Basin and its Delta

Evalueren van beleid. Research voor Beleid (Panteia Groep) Auteur: Christel Scholten

Het Effect van Assertive Community Treatment (ACT) op het. Sociaal Functioneren van Langdurig Psychiatrische Patiënten met. een Psychotische Stoornis.

Classification of triangles

Interaction Design for the Semantic Web

PERSOONLIJKHEID EN OUTPLACEMENT. Onderzoekspracticum scriptieplan Eerste begeleider: Mw. Dr. T. Bipp Tweede begeleider: Mw. Prof Dr. K.

Transcriptie:

Impactevaluatie. Mogelijkheden en aandachtspunten Nathalie Holvoet Instituut voor Ontwikkelingsbeleid en -beheer Vlaams Evaluatie Platform sub-groep Evaluatie in Ontwikkelingssamenwerking Nathalie Holvoet

Overzicht 1. Inleiding 2. Impact evaluatie: what s in a name? 3. Experimentele benadering 4. Quasi-experimentele benaderingen 5. Niet-experimentele benaderingen 6. Bezint vooraleer je begint 7. Referenties

1. Inleiding (1) toenemend belang/vraag M&E in OS (cf. NAA) evidence-based beleid resultaatsgericht beheer en budgettering downward accountability aanbod M&E is laag monitoring > evaluatie descriptief > analytisch definitie evaluatie zo systematisch en objectief mogelijk gebruik bestaande methodologie uit sociale wetenschappen

1. Inleiding (2) (impact)evaluatie: publiek goed kenmerken tekort aan valide (impact)evaluatie teleurstellende resultaten van meta-evaluaties (zie Center for Global Development, 2006) potentieel negatieve effecten van niet-valide impactevaluaties

2. Impact evaluatie: what s in a name? (1) impactevaluatie procesevaluatie (see slide 6) voorbeeld Je bezoekt een microkredietproject en op basis van interviews blijkt dat het gemiddelde maandinkomen van de vrouwen die een jaar geleden krediet ontvingen, gedaald is van 1000 shilling naar 900 shilling. Uit interviews met een groep vrouwen die net krediet hebben ontvangen blijkt dat hun gemiddeld maandinkomen over dezelfde periode gedaald is van 1100 shilling naar 950 shilling. Wat is de impact van het kredietprogramma op het gemiddelde maandinkomen van de participanten? a. -100 b. +50 c. -50 d. +900

University of Antwerp

2. impactevaluatie: what s in a name? (2) interventie groep controle groep Voor interventie E 1 C 1 Na interventie E 2 C 2 E 2 - E 1 = bruto-impact (E 2 E 1 ) (C 2 - C 1 )= (netto) impact (1) (eenvoudig) (E 2 E 1 )/E 1 (C 2 - C 1 )/C 1 = (netto) impact (2) (proportioneel)

2. impactevaluatie: what s in a name? (3) causaliteit interne validiteit (Shadish, Cook and Campbell, 2002) interne validiteit betrouwbaarheid van een conclusie/gevolgtrekking over het verschil die een interventie maakt in een specifieke context externe validiteit betrouwbaarheid van een conclusie/gevolgtrekking over de veralgemening (generalisering) van dat effect tot andere populaties, contexten, andere operationaliseringen van de onafhankelijke en afhankelijke variabelen

2. Impactevaluatie: what s in a name? (4) Statistische conclusievaliditeit (statistical conclusion validity) Interne validiteit (enge zin) Constructie-validiteit Externe validiteit (enge zin) validiteit van conclusie over de correlatie tussen een interventie (onafhankelijke variabele) en een resultaat (afhankelijke variabele) validiteit van de conclusie over causaliteit tussen een interventie (onafhankelijke variabele) en een resultaat (afhankelijke variabele) validiteit van de conclusie over relatie tussen een operationele variable en de constructie (representatie) validiteit van de conclusie of een causale relatie ook blijft gelden bij variatie over personen, settings, etc. (extrapolatie)

2. Impactevaluatie: what s in a name? (5) uitspraken over validiteit: niet absoluut perfecte validiteit: onmogelijk trade offs tussen validiteitstypes interne versus externe validiteit valkuilen/bedreigingen per validiteitsprincipe gekend + manieren om deze te beperken (zie annex voor overzicht) per evaluatie: oplijsten van belangrijkste valkuilen keuzes maken inzake in te perken valkuilen specifiek evaluatie-objectief (interne & externe validiteit) beperkingen tijd, middelen, data cf. shoestring evaluation (see Bamberger et al., 2004)

2. impactevaluatie: what s in a name? (6) bedreigingen voor interne validiteit omgekeerde causaliteit ( reversed causality ) andere interventies ( interfering events ) seculiere tendenzen ( maturation of communities ) natuurlijke effecten van veroudering ( maturation of persons ) selectie (zelfselectie, creaming, uitval) test -effect instrument -effect hoe alternatieve verklaringen reduceren? (netto-impact distilleren uit bruto-impact) mogelijkheden met verschillende vereisten en kost

3. Experimentele benadering toevallige toewijzing aan interventie groep en controle groep (randomisation) University of Antwerp E 1 = C 1 dan netto-impact: E 2 C 2 in principe: enkel behoefte aan ex-post data, maar meestal ook preinterventiedata first best voor interne validiteit: zelfselectie maar vaak moeilijk of niet-wenselijk bij ontwikkelingsprojecten probleem met full-coverage interventies niet wenselijk omwille van morele problemen duur + afwezigheid bij start van de interventies experiment echte interventie kan niet alle problemen van interne validiteit oplossen

4. Quasi-experimentele benaderingen (1) second-best, poging om interne validiteit te verhogen via 1. constructie controlegroep 2. statistische technieken (tijdens analyse van data) 3. combinatie van 1&2 4.1. constructie controlegroep Matching ( cross-section ) constructie controle groep op basis van karakteristieken interventiegroep! keuze variabelen voor matching individuele matching: niet noodzakelijk (zie vb. slide 14)

University of Antwerp

4. quasi-experimentele benaderingen (2) regression-discontuinity gebruik van een duidelijke selectie-variabele voor indeling contrôle en interventiegroep experiment generische controles controles= voorafbepaalde normen ivm. verwachte resultaten bv. antropometrische indicatoren, geboortecijfers, sterftecijfers, sex ratios,

4. quasi-experimentele benaderingen (3) voor/na ( reflexive controls) éénvoudige V/N zware veronderstelling & veel valkuilen voor interne validiteit best alleen voor impact assessment over KT (zie bv. slide 17) panelstudies verschillende observaties voor en na interessant in gevallen waar verschillende eenheden op verschillende manier worden blootgesteld aan interventie (zie bv. Slide 18)

University of Antwerp

University of Antwerp

4. quasi-experimentele benaderingen (4) tijdseries veel observaties voor (min. 30) en na geaggregeerde eenheden trendanalyse op basis van observaties vóór interventie + projectie in de toekomst (= controle-groep) gebruik van grafische methodes (zie voorbeeld slide 20) first best om impact van full-coverage programma s te evalueren (eventueel in combinatie met cross-sectional)

University of Antwerp

4. quasi-experimentele benaderingen (5) 4.2. statistische controles ( statistically equated controls ) controle tijdens analyse zelfde effect als matching (zie vb. slide 22) meting effect nauwkeurig beperkt tot gekende en gemeten variabelen verschillende technieken multiple regressie (zie bv. slide 23) University of Antwerp regressie met afhankelijke variabele ( resultaat ), onafhankelijke variabele ( interventie dummy), controlevariabelen effect wordt gemeten via regressie-coëfficient van onafhankelijke variable two-stage regressie (zie bv. slide 24-25) modelleren selectie (afhankelijke variabele: selectie ) (slide 24) modelleren resultaat (afhankelijke variabele: resultaat ) (slide 25) 4.3. combinaties van 4.1 en 4.2.

University of Antwerp

University of Antwerp

University of Antwerp

Nathalie Holvoet

5. niet-experimentele benaderingen University of Antwerp Controle-groep: denkbeeldige constructie door evaluator, op basis van: auto-evaluaties door participanten voldoening participanten empowering effect MAAR probleem van social desirable answering observatie tijdens veldbezoeken interviews met lokale key-persons archieven van projecten (data betreffende participanten, project, financiële data) evaluatie door staf project goede kennis van project implementatie vaak overschatting van projectimpact kennis, ervaring van evaluator belang van kennis van het fenomeen dat wordt geëvalueerd (> methodologie)

6. Bezint vooraleer je begint doeltreffendheid interventie ok? innovatief element? onvoldoende impactevaluaties? (check secondaire data, meta-evaluaties?) interventie kan herhaald worden? voldoende investering van middelen?

7. Referenties Bamberger M., J. Rugh, M. Church and L. Fort (2004) Shoestring evaluation: Designing Impact Evaluations under Budget, Time and Data Constraints, American Journal of Evaluation, vol. 25 (1): 5-37 Center for Gobal Development (2006) When will we ever learn? Improving Lives through Impact Evaluation, Washington, Center for Global Development. Shadish, W., T.D. Cook and D. Campbell (2002) Chapters 2 & 3 (internal & external validity), pp. 37-94 in Experimental and quasi-experimental designs for generalized causal inference, Boston, Houghton Mifflin Rossi P.H., Freeman H.E. and Lipsey (1999) Strategies for impact assessment, p. 235-278 in Evaluation: A Systematic Approach, London, Sage.

Dank nathalie.holvoet@ua.ac.be Nathalie Holvoet

Annex: Threats to different validity types and how to lower them (see Shadish, Cook and Campbell, 2002) STATISTICAL CONCLUSION VALIDITY

Threats (selection) Low statistical power false negative effect size estimates less precise unreliability of measures restriction of range Ways of lowering (selection) sample size reliability of treatment implementation homogeneity of units reliability of measures Improving quality of measures Increasing the number of measurements Use distinctly different treatment doses Avoid floor and ceiling effects

Threats (selection) unreliability of treatment implementation but sometimes deliberate extraneous variance in the experimental setting heterogeneity of units (respondents) inaccurate effect size estimation Ways of lowering (selection) homogeneity of treatment implementation sample size Control for distracting factors Measure sources of extraneous variance and use statistical controls in analysis homogeneity on characteristics correlated with major outcomes external validity restriction of range Use appropriate tests

INTERNAL VALIDITY University of Antwerp

Threats (selection) Ways of lowering (selection) ambiguous temporal precedence experimental design selection self-selection creaming history (interfering events) randomisation (experimental design) two-stage statistical regression (Heckmann) exposed & control group exposed to same history (= location) diffusion external validity

Threats (selection) maturation persons communities (secular trends) Ways of lowering (selection) exposed & control group of same age, same location diffusion external validity regression artificats in particular when extreme scorers were selected sometimes deliberate random assignment within the group of extreme scorers attrition (de-selection) early monitoring response burden

Threats (selection) testing instrumentation important in longitudinal design Ways of lowering (selection) assessment of testing effect through specific designs interval between tests avoid switching instruments during studies

CONSTRUCT VALIDITY University of Antwerp

Threats (selection) inadequate explication of constructs mono-operation bias Ways of lowering (selection) improve explication avoid constructs that are too general avoid using one construct to reflect more than one construct avoid wrong constructs multiple operationalisation mono-method bias use of different methods confounding constructs with levels of constructs use several levels of treatment specification of the level of treatment

Threats (selection) reactive self report changes reactivity to the experimental situation Ways of lowering (selection) use external (not self-report) measures use techniques that encourage accurate responding make dependent variables less obvious (no pre-test) reduce interactions of experimenter and participant deception by using false hypotheses (ethical!) use quasi-control participants ensure confidentiality and anonymity

Threats (selection) Ways of lowering (selection) novelty or disruption effects include innovation and disruption in the construct compensatory equalisation monitor treatment interview staff, administrators compensatory rivalry resentful demoralisation unstructured interviews, direct observation to detect avoid awareness about treatment (if ethical) unstructured interviews, direct observation to detect avoid awareness about treatment (if ethical)

Threats (selection) treatment diffusion Ways of lowering (selection) avoid physical proximity avoid communication between exposed & control group monitor and measure treatment implementation in both groups

EXTERNAL VALIDITY University of Antwerp

Threats (selection) interaction of the causal relationship with units interaction of the causal relationship over treatment variations interaction of the causal relationship with outcomes Ways of lowering (selection) variability in units in present study + explicit testing for interaction (exante) statistical conclusion validity additional studies in other units + meta-evaluation variability in treatment (ex-post) statistical conclusion validity additional studies for other treatment variations + meta-evaluation variability in outcomes additional studies for other outcomes + meta-evaluation

Threats (selection) interaction of causal relationship with settings context-dependent mediation Ways of lowering (selection) variability in settings (multi-site studies) additional tests in the other settings + meta-evaluation variability in contexts additional tests in the other contexts