Multivariate Data Tools in Analysis



Vergelijkbare documenten
Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Classification - Prediction

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

Disclosure Belangen Spreker

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

Met factoranalyse worden heel veel variabelen ingekort tot een aantal variabelen.

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

Verband tussen twee variabelen

LES 2: Data-cleaning en -transformatie 1. Frequentietabel

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

College 3 Meervoudige Lineaire Regressie

Bijlage 3: Multiple regressie analyse

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Het Verband Tussen Persoonlijkheid, Stress en Coping. The Relation Between Personality, Stress and Coping

TYPE EXAMENVRAGEN VOOR TOEGEPASTE STATISTIEK

Faculteit der Wiskunde en Informatica

SPSS. Statistiek : SPSS

Voorbeeld regressie-analyse

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, uur

De Bijdrage van Opleiding Ouders, Beroep Ouders en Sociaal-economische Status in de. Voorspelling van het Intelligentieniveau van het Kind.

Pilot vragenlijst communicatieve redzaamheid

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

(slope in het Engels) en het snijpunt met de y-as, b 0

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

Wat is nieuw in Enterprise Guide

Validatie van de Depressie lijst (DL) en de Geriatric Depression Scale (GDS-30) bij Verpleeghuisbewoners

Enkelvoudige lineaire regressie

11. Multipele Regressie en Correlatie

Evaluation of Measurement Uncertainty using Adaptive Monte Carlo Methods

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1

Fasen in het onderzoeksproces

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

4 Domein STATISTIEK - versie 1.2

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

De Invloed van Dagelijkse Stress op Burn-Out Klachten, Gemodereerd door Mentale. Veerkracht en Demografische Variabelen

3.1 Itemanalyse De resultaten worden eerst op itemniveau bekeken. De volgende drie aspecten dienen bekeken te worden:

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Meervoudige lineaire regressie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

MISSING DATA van gatenkaas naar valide uitkomsten

Assessing writing through objectively scored tests: a study on validity. Hiske Feenstra Cito, The Netherlands

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014

9. Lineaire Regressie en Correlatie

Classification of triangles

10. Verantwoord prioriteiten stellen: een oplossing voor onbetrouwbare belangscores

TECHNISCHE UNIVERSITEIT EINDHOVEN

Residual Plot for Strength. predicted Strength

FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE. Toets Inleiding Kansrekening 1 8 februari 2010

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden


Wat te doen met die lange variabele- labels in SPSS?

COGNITIEVE DISSONANTIE EN ROKERS COGNITIVE DISSONANCE AND SMOKERS

Beïnvloedt Gentle Teaching Vaardigheden van Begeleiders en Companionship en Angst bij Verstandelijk Beperkte Cliënten?

Introductie in flowcharts

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

DANKBAARHEID, PSYCHOLOGISCHE BASISBEHOEFTEN EN LEVENSDOELEN 1

Technische appendix bij DNBulletin Voor lagere werkloosheid is meer economische groei nodig. Variable Coefficient Std. Error t-statistic Prob.

Het samenstellen van een multipele indicator index. Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011

Opgave 1: (zowel 2DM40 als 2S390)

Relatie tussen Persoonlijkheid, Opleidingsniveau, Leeftijd, Geslacht en Korte- en Lange- Termijn Seksuele Strategieën

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hartpatiënten Stoppen met Roken De invloed van eigen effectiviteit, actieplannen en coping plannen op het stoppen met roken

Oplossingen hoofdstuk XI

10. Moderatie, mediatie en nog meer regressie

2 2. STATISTICA Data Management

Motivationele oriëntatie bij sociale vergelijking: Wanneer, waarom en met wie vergelijken?

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Statistiek 2 deel A 30 minuten over statistisch toetsen

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Workshop Qualtrics & SPSS

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Gezinsinkomen en kansenongelijkheid Cijfers bij beschouwend artikel Didactief mei 2018

mlw stroom 2.1: Statistisch modelleren

1. Reductie van error variantie en dus verhogen van power op F-test

De Samenhang tussen Dagelijkse Stress, Emotionele Intimiteit en Affect bij Partners met een. Vaste Relatie

Hoofdstuk 8: Multipele regressie Vragen

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid

Systematic and Random Error in a Mixed Mode Online-Telephone Survey:

University of Groningen Educational value of digital examination

AE1103 Statics. 25 January h h. Answer sheets. Last name and initials:

TECHNISCHE UNIVERSITEIT EINDHOVEN

Partiele factoren CUR226. Piet van Duijnen

LinkedIn Profiles and personality

Onderzoek. B-cluster BBB-OND2B.2

Betrouwbaarheid, validiteit en overeenstemming

Examenvragen KBM (herexamen)

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Examenvragen KBM/EMS 09-15

Transcriptie:

Techniques: univariate ANalysis Of VAriance (ANOVA) bivariate analysis Multivariate ANalysis Of VAriance (MANOVA) Describing and analysing relationships between at least two variables o Factor Analysis o Multiple Regression Analysis o Multiple Discriminant Analysis o Conjoint Analysis o Cluster Analysis o Multidimensional Scaling Decision tree Level of measurement Types of variables Causality Structure metric (interval,ratio) dependent structure techniques interdependence non-metric (nominaal,ordinaal) independent functional techniques dependence General approach Define research problem (research questions;fundamental relations;conceptual model;general level of variables) Develop analysis plan (techniques;objective and design;sample size;types of variables;acquired info) Evaluate assumptions (techniques;conceptual;statistical) Estimation of the multivariate model (apply assumptions;option within techniques;overall fit of model;acceptable level of statistical criteria) Interpretation of the output (technique used;underlying dimensions /separate variables;answering research questions) Validate the multivariate model (generalizability;2 samples;split sample) Conclusions and recommendations (in terms of research questions) Data analysis Acquire data Rough data files Evaluate data files o Graphically o Errors check for logic define ranges more than one answer for one single question o Missing data (missende variabelen zijn pas onbelangrijk als ze random zijn) Generalize? Underlying reasons? (data entry;routing;refusal or incomplete) Final sample Approach missing values Use only complete data Delete cases or variables Imputation methods (estimation;metrical data;replacement methods) o Outliers (uitschieters) Distinguishing data (cause: data entry;value range;exceptional observation) not representative for population Detection (describing and/or removal) o Statistical assumptions Normal distribution (shape of data; univariate normal distribution) Graphical test (histogram;normal probability plot) Homoscedasticity (variable relations;equal distribution variances of variables;graphical test) Linearity (correlation or association;equal distribution variances of variables) Graphical test (scatter plot) Statistical test (regression) www.vormit.nl 27 februari 2002 Pagina 1 van 8

Relationship Relationship Structure Measurement Technique Interdependence Variable >>>>>>>>>>>>>>>>>>> Factor Analysis Cases/Respondent >>>>>>>>>>>>>>>>>>> Cluster Analysis Object metric Multidimensional Scaling non-metric Correspondence Analysis or Multidimensinal scaling Relationship Values predicted Measurement scale Predictor variable Technique Dependence 1 dependent value in a single relationship >1 dependent value in a single relationship Metric >>>>>>>>>>>>>>>>>> Non-metric >>>>>>>>>>>>>>>>>> Multiple Regression or Conjoint Analysis Multiple Discriminant Analysis or Linear Probability Non-metric >>>>>>>>>>>>>>>>>> Canonical Correlation Metric Metric Canonical Correlation Non-metric Multivariate Analysis of Variance Factor Analysis Objectives of Factor Analysis: Reduce the data to a more manageable set identify underlying dimensions of correlations identify new, smaller set of uncorrelated variables identify smaller set of salient (prominent) variables from a larger set Factor analysis is used for: Segmentation Product Research Advertising studies Pricing studies Application of Factor Analysis Cluster variables (var A,B make var C) Structure group of variables Inter-analysis Reduce number of variables Design of Factor Analysis Calculation of the input data (correlation matrix) Number,measurement properties and allowable of variables (min. 5 variables per factor) Necessary sample size (5 observations per variable) Statistical assumptions Interrelated variables (minimale correlatie van 0,3) Use of metric data multivariate normality is not required (als je stopt na de factoranalyse) sufficient correlations between data (zonder significante samenhang geen factoranalyse, KMO-test >0,6 en Bartlett's Sign. α < 0,05) homoscedasticiteit van de variabelen (gelijke variantie spreiding) Criteria for determining the number of factors (Factor: een aantal variabelen die veel met elkaar gemeen hebben) Latent root (eigenwaarde>1, bij 20-50 variabelen) A-priori criterion (aantal factoren volgt uit eerder onderzoek of uit een theorie) Percentage of variance o Als eigenwaarde = 1, dan verklaar je evenveel variantie als de informatie die één variabele heeft o Variantie = Eigenwaarde/factoren Scree Plot: Verklaarde variantie ten opzichte van de factoren Heterogeniteit van de respondenten Interpretation of the factors Compute unrotated factor matrix (Hoogste correlaties omcirkelen) Select rotational method (rearrange information) for better solutions (herverdelen variantie) o orthogonal (loodrecht) rotation (Varimax), ivm vermijding multicollineariteit (correlatie) tussen onafhankelijke factoren o oblique (vrije) rotation (Oblimin) Re-specifying the factor model www.vormit.nl 27 februari 2002 Pagina 2 van 8

Communalities: zegt iets over de waarde van variabelen binnen de 5 factoren Validation Generalizability o replicability of results o stable factor structure Influence on results o Impact of outliers Subsequent (vervolg) analysis (Bij vervolganalyses mogen de variabelen niet correleren) Regression analysis Cluster analysis R-type factoranalysis voegt variabelen samen Q-type factoranalysis voegt objecten of respondenten samen Regression Analysis Regression Analysis: method to analyze relationships between metric dependent variable an one or more independent variables Explaining Forecasting Research design of Regression Analysis Basic model (y=a+b1x1+b2x2.bnxn+e) level of measurement (dummy variables for non-metric data with L-levels => L-1 dummy variables) selection of dependent variable (research objective) selection of independent variables (concepts;influence on dependent variable) sample size (1:15-20) Statistical Assumptions of Regression Analysis Normality (variabelen zijn normaal verdeeld) Homoscedasticity (gelijke variantie spreiding) Linearity (tussen afhankelijke en on-afhankelijke variabele) Level of measurement (metric data) Little multi-collinearity(onderlinge afhankelijkheid, liever niet te hoog omdat anders het unieke van de onafhankelijke variabele niet naar voren komt) Hoe hoger R² (verklaarde variantie), hoe hoger de kans op multicollineariteit (In hoeverre is er samenhang tussen de variabelen) Sample size 1 variable :15-20 Tollerantiewaarde = 1-R² ; Tollerance factor = 1-R² < 0,1 => multicollineariteit ; Variance Inflation Factor = 1/(1-R²) Direct Method or Enter method: alle onafhankelijke factoren komen terug in de vergelijking (mate van invloed van alle variabelen is relevant) Stepwise Methoden forward inclusion (variabele met meeste toegevoegde wordt toegevoegd) backward inclusion (f-toets) (begint met totaal model, var met minste toegevoegde waarde wordt verwijderd) stepwise selection (variabelen met meeste waarde toevoegen daarna verwijderen van voorgaande variabelen als ze geen toegevoegde waarde meer hebben) Regressie coefficienten: aan welke knoppen draaien om wat te veranderen ( % independent vs % dependent) ß-coefficient, gestandaardiseerde regressie coefficient en ligt tussen -1 en 1 (tussen verschillende onderzoeken) R² geeft de kwaliteit (verklaarde variantie) weer van het onderzoeksmodel R²-adjusted is basis R² met correctie op het aantal respondenten en onafhankelijke variabelen (vergelijken samples) F-test, Is R² significant >0, anders stoppen T-toets, wijkt de onafhankelijke variabele significant af van 0, anders variabele weglaten R² = 0,6 is hoog (sociaal wetenschappelijk onderzoek is nooit hoger) R² (Sig<0,05) wijkt significant af van 0, dan pas regressie analyseren Conclusie sheet 20, factor 1 heeft de hoogste toegevoegde waarde sheet 21 factor 3 en 5 hadden weinig bijgedragen aangezien we R² van 58% hebben tov oorspronkelijke 59% sheet 23 alle onafhankelijke variabelen hebben een significante toegevoegde waarde < 0,05 (Dit was ook de stepmethode) www.vormit.nl 27 februari 2002 Pagina 3 van 8

Conjoint Analysis Conjoint Analysis (Waarde die respondenten hechten aan attributen toe te dichten,op levelniveau waardes toekennen (soorten vlaai-bodems)) rating (vlaaien, belangrijkheid verschil) ranking (waarde toekennen) attribuut=bodem attribuut-level=soort bodem,soort versiering Combinaties van attribuut-levels=combinatie van soort bodem en soort versiering Bij elk attribuut even veel levels kiezen Realistische combinaties adaptieve conjoint analysis: Vragenlijst wordt afhankelijk van de antwoorden dynamisch aangepast (Vlaaionderzoek) Methode Traditional (pen en papier) Adaptive Choice based Max. attributes 9 30 6 Level individual individual Aggregated Model additive additive additive + interaction Research Design of Conjoint Analysis Composition rule o Additive model (voorkeuren bij elkaar optellen, statisch) o Interactive (voorkeuren hebben verschillende wegingen) Type of presentation o Trade-off (eenvoudige,alleen ranking van 2 attributen) o full-profile (ranking en rating on a profile card) o pairwise comparison methode (ranking en rating) Customer preference with o full-profile method o pairwise comparison method Statistical Assumptions of Conjoint Analysis Understanding of weight process Model specifications Overall fit hierachy of data rating scale of data Interpretation Individual level Aggregated level Relative interest (Het attribuut met de hoogste som van levels is het belangrijkste) Validation Internal (appropriate composition rule) External (representativeness) www.vormit.nl 27 februari 2002 Pagina 4 van 8

Binnen een cluster zitten respondenten met dezelfde kenmerken Clusteranalysis = segmentation;buying behavior;new product opportunities Variabelen die onderling correleren worden in een factor samengebracht Clusteranalyse Data simplification Relationship identification Research design Outliers positief ivm niche-markt negatief als je ze niet kunt identificeren Similarity measures (groepen van gelijke kenmerken) Standardized data (gecorrigeerd op dezelfde schaal) Correlational measures Distance measures (gestandaardiseerde data) Mahalanobis D² Association measure Chi² toets Statistische aannames Representatieve populatie Cluster Analysis Multicollineariteit (hoge samenhang tussen variabelen, je hebt dan niet de verklaarde variantie van de variabelen afzonderlijk) toewijzing van variabelen kunnen onterecht worden toegewezen aan een cluster Clusteranalyse: Hierarchische (optimaal aantal clusters) agglomeratieve methode, respondenten indelen in clusters (100 respondenten = 100 clusters), vervolgens clusters samenvoegen die hoge correlaties hebben totdat we 1 cluster overhouden (boom-structuur) o single linkage (minimale afstand) o complete linkage (maximale afstand) o average linkage (gem afstand tussen de variabelen van clusters) o Ward's method (som van de kwadraten van de variabelen tussen clusters )(meest gebruikt) o Centroid method (afstand tussen cluster centroids)(op een na meest gebruikt) Divisive methode Non-hierarchische (specificeer het aantal clusters en objects worden vervolgens in clusters ingedeeld) Interpretation De methode om het optimaal aantal clusters te verifieren sequential threshold (starten met 1 cluster centroid) parallel threshold (starten met 4 cluster seeds) combination Clusters zijn homogeen en de verhouding tussen clusters dient heterogeen te zijn based on average scores, cluster centroids fill up variables with relevant variables outside cluster process Labelingbof the clusters, profiling Validation (generalizability) Split sample Use of checking variables Agglomeratiecoëfficiënt: afstand waarbij clusters zijn samengevoegd Grootste toename in afstand is hoogste % change Profielen én tabellen bekijken www.vormit.nl 27 februari 2002 Pagina 5 van 8

Multiple Dicriminant Analysis discriminant-analyse: (Bij discriminantanalyse staat de specificatie van de groepen vast) Voorspellen groepslidmaatschap (een afhankelijke variabele wordt ingedeeld max 2 elkaar uitsluitende goepen, 2 groepen betekend 1 model) Inzicht in verschillen tussen onafhankelijke variabelen (Model beschrijven dat zo goed mogelijk het verschil aangeeft tussen twee groepen (nominale schaal) Afhankelijke techniek die lijkt op regressie-analyse Kijken naar het dicriminerend effect van groepen (onafhankelijke variabelen) op de afhankelijke variabele (onderverdeling in groepen) Aannames: normaliteit lineariteit meetniveau multicollineariteit niet wenselijk, omdat je niet het discriminerende efffect van onafhankelijke variabelen kunt bepalen research design discriminant analysis variables o dependent non-metric o independent metric sample size 1:20 Dicriminantlading = factorlading 2 methoden om discriminant functie te bepalen Overall fit Simultaan of Enter (Standaardiseren om verschillende schalen tussen vragen te vergelijken, beta) alle onafhankelijke variabelen worden meegenomen totale effect van variabelen in de set statistische relevantie via Wilk's lambda (Hoe hoger Wilk's Lambda des te slechter is het discriminerend effect is; Laagste Wilk's lambda correspondeert met hoogste significantie) Stepwise (een voor een worden onafh var toegewezen, variabele met hoogste significante disriminerende effect wordt het eerst meegenomen) Calculate Z-score (grenswaarde) Compare Observations to Z-score elke keer één variabele met de hoogste discriminantie toevoegen statistische significantie via Mahalanobis D² Determine Predicting Capacity (classification;hitratio (correct geclassificeerd);mahalanobis D²) Devide respondents into groups based on cutting score (weighted average of group controids) Interpretation Same group size Zce=Za+Zb/Z different groupsize Zcu=NaZb+NbZa/Na+Nb Discriminant weights Discriminant loadings Partial F-values Rotation (Varimax) Potency index (discriminating capacity) Canonische correlatie: discriminerend effect (groter dan 40% ; kleiner dan 10% is zwak model) Validation: analysis sample (calculating D-function) hold-out sample (using classification matrix) hold-out sample, niet je volledige dataset gebruiken maar een aantal om je model te toetsen Construction of group profiles (groepen goed bekijken en of je je complete set van onafhankelijke variabelen hebt meegenomen) www.vormit.nl 27 februari 2002 Pagina 6 van 8

Multi-Dimensional Scaling multidimensional scaling ofwel perceptual mapping positionering, grafische weergave, interdependence-techniek relatieve positie van producten of bedrijven weergeven positionering of segmentatie clusteren van producten Three main decisions: Selection of object (nature and relevancy) Similarity or preference data (paarsgewijze vergelijking) individual or group level analysis gelijkenis (kaartjes van biersoorten, respondent maakt groepen op basis van attributen) research design: decompositionele methode: niet uitsplitsen naar attributen, alleen totaaloordeel In hoeverre prefereert de consument product a of b vb parfum, wasmiddel compositionele methode: totaal oordeel en attributen Vaak combinatie van beide methoden Belangrijk bij multidimensional scaling is dat alle producten meeneemt (wel of geen witbier meenemen in bieronderzoek) meetniveau: metrisch of non-metrische info metrisch maken (chi2 toets) Overall fit: Aantal dimensies: subjectief bekijken Net als bij factoranalyse screeplot maken en zo min mogelijk factoren meenemen (knik in curve) %verklaarde variantie stress-maat is het verschil tussen werkelijke afstand en berekende afstand (stresswaarde 0,02 is redelijk) Overall fit-index >0,60 Projectie van het ideale punt: relatieve afstand tov ideale punt richting tussen object en ideale punt Interpretatie Subjectief (decompositionele of compositionele methode) Objectief (compositionele methode) Totale set van producten bekijken en representatieve populatie Validation: generalizability (objects;consumers) 2 samples decompositional en compositional approach www.vormit.nl 27 februari 2002 Pagina 7 van 8

Doel Toepassing - O.b.v. oordeel resp voorkeur/gelijkenis - Imago/positioneren - Beoordelingsdimensies Onderzoeksontwerp Aannames Statistisch model Overall fit Interpretatie / conclusie Validatie Multivariate Data Tools in Analysis Factoranalyse Regressie analyse Discriminant analyse Conjunct meten Cluster analyse Multidimensional scaling - Bepaling - Bepaling verband - Analyse significante - Inzicht krijgen in wijze - Objecten groeperen in - Analyse dimensies onderliggende tussen 1 afh var verschil in groepen waarop consum. waarde categorie/clusters o.b.v. v/e meerdimens structuur (criterium) & > onafh var - Classificeren in toekennen aan gemeens ruimte en rel positie - Datareductie (predictoren) vaststaande groepen prod/dienst kenmerken/variabelen van objecten hierin - Clusteren variabelen - Structereren groepen variabelen - Reductie # variabelen - metr. meetniv - steekproefomvang 5:1 Normaliteit Homoscedasticiteit Lineariteit Alleen vereist indien statistische toetsen Structuur: KMO ( > 0,6) Barlett (signi) Correl. (>= 0,3) Aantal factoren - Eigenwaarde >1 - a-priori - % R 2 - Screetest/plot Factormatrix, -lading - communaliteit Rotatie: Herschikken info Orthogo = varimax Oblique = oblimin Repliceren Split sample Vervolg analyse Regressie/ Cluster an. - Voorspellen afh var o.b.v. onafh - Vergelijken onafh var - Verklaren rel belang onafh irt afh var - y=a + bx +e - metr. Meetniveau - st.omv. 15:1 - st.omv. step 20:1 Normaliteit Homoscedasticiteit Lineariteit Meetniveau Geen multicollineariteit (corr. Matrix/tollerantie) R 2 en signi. F-toets (model) T-toets (variabelen) Direct: -Enter method Stepwise: -Forward inclus -Backward inclus -Stepwise select Regressie coeff (b) β- coeff, teken en grootte antwoord op doelstelling significantie model R 2 Repliceren Split sample Voorspell groepslidm - segmentatie analyse - kredietwaardigheid - succes/faal kansen Inzicht onderscheidende predictoren Z=a + WX W nx n onafh=metrisch afhank=non metirsch -st.omv 20:1 (theorie) -(praktijk) #onafh var =# pers kleinst groep Normaliteit Homoscedasticiteit Lineariteit Meetniveau Geen multicollineariteit # functies=# groep 1 Wilks λ (signi) gehele model Bepaal discr functie: - Simultaan/Stepwise Bepaal fit: - hitratio Model significant Discrim gewichten Discrim ladingen Hitratio Canonische correlatie 2 Analyse sample Holdout sample\ - New Prod Dev. - Winstkansanalyse - Conjuncte simulatie analyse - Segmentatie analyse - Conjoint methodol: Traditioneel/adaptive/choi ce based - Onderzoeksstimuli: Concreet/visuele/real combi/ # attr, levels - Model: additief/ interactief - dataverz:trade off/full profile/pairwise comp. - Inzicht in aard beoordelingsproces - Modelspecificaties Schat conjoint model: - rangorde - ranking - Indi niveau + geaggregeerd (trad/adapt) - Geaggregeerd niveau (choice based) - grootst range levels Interne validatie Externe validatie Segmentatie van - consumenten - bedrijven obv bijv. productattributen - Outliers kunnen storend zijn - Gelijkenis coefficienten - Correlatie maten - Afstand maten (!) - Associatie maten (ordi, nomi) Representativiteit Geen multicollin tussen cluster variabelen gewenst Selectie cluster formatie procedure: - Hierarch cl proc - Non-hierar proc Hierarc: agglomm Linkage/Ward/Centroide Niet hier: (cl seeds) Sequential tresh/ parallel tresh/ combi Hierarchisch: # clusters obv agg. coeff Hier / non hierarch O.b.v gem score profiel Labeling clusters (naam geven) Split sample Inzetten controle var Decompositionele - Voorkeur vs gelijkenis - Bepaal posit/ # dim/ voorkeursdata in mds Vector vs punt - Composition ben /correspond anal D: metr meetniv D: obj vergelijkb D: vergel percep resp D: alle obj beoord Corresp: kwanti data, nomi dus posi getal, Chi 2, verband rij-kol, samenhang objattributen D: subjec/object in tweedimensionale ruimte D: generalis D: 2 steekproeven D: decom en comp www.vormit.nl 27 februari 2002 Pagina 8 van 8