INLEIDING. tot de ECONOMETRIE. Prof. Dr. E. Omey



Vergelijkbare documenten
Gegevensverwerving en verwerking

Toepassing: Codes. Hoofdstuk 3

Verslag Regeltechniek 2

Uitwerkingen tentamen Statistiek 2 voor TeMa Maandag

Een levensloopregeling voor software

Onderzoeksmethoden en techieken I

effectief inzetten? Bert Dingemans

Tentamen van Wiskunde B voor CiT (151217) Tentamen van Statistiek voor BIT (153031) Vrijdag 27 januari 2006 van 9.00 tot uur

ALCOHOLKENNIS DOORGESPEELD

officiële bijdrage aan het CMMI. Jan Jaap Cannegieter

PROEFEXAMEN SOCIALE STATISTIEK

Regressie en correlatie

Regressie en correlatie

Variantie-analyse (ANOVA)

Van beschrijvende naar verklarende statistiek

1 Rekenen met complexe getallen

Toelichting advies gemeenteraad bij aanvraag aanwijzing als lokale publieke media-instelling

Bronnen & Methoden bij Marktscan medischspecialistische zorg 2015

Rekenen met rente en rendement

Tentamen Econometrie 1, 4 juli 2006, uur Dit tentamen duurt 2 uur! Toiletbezoek is niet toegstaan.

Bij een invalshoek i =(15.0 ± 0.5) meet hij r =(9.5 ± 0.5). 100%-intervallen. Welke conclusie kan de onderzoeker trekken?

Middenkaderfunctionaris bouw & infra (Netwerkschool)

Waardeoverdracht. Uw opgebouwde pensioen meenemen naar uw nieuwe pensioenuitvoerder

Ontvlechting van ICT vereist nieuwe samenwerking

Onderzoeksmethoden en techieken I

i i Datzelfde aggregaat in een vorig jaar 0 stellen we voor door

Cats. Den Haag, ~ '' Kenmerk: DGB

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

is gelijk aan de open-klemmen spanning van het netwerk. De impedantie Z th

EH SmartView. Een slimme kijk op risico s en mogelijkheden. Monitoring van uw kredietverzekering. Euler Hermes Online Services

Meten en experimenteren

De Collegereeks Statistiek. Stel je wilt wat weten over. Complexe begrippen: construct. Homogeniteit. Verder met. Statistiek

Ondersteuning en hulp bij leren

MEERJAREN OPBRENGSTEN VO 2013 TOELICHTING

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

3.7.3 Welke meetinstrumenten zijn geschikt voor het vastleggen van motorische vaardigheden?

anwb.nl/watersport, de site voor watersporters

Het Nederlands Persmuseuml

Process mining: leuk voor de liefhebber of noodzaak?

MRT/RT MKT/KT. Wormwielreductoren.

zijn, kunnen we stellen dat de huidige analyses vooral toegespitst zijn op een ordergerichte situatie.

6. Behandeling van kinderen met spastische cerebrale parese gericht op verbetering van handvaardigheid

lus+ De klachtencommissie en de rol van de vertrouwenspersoon ongewenste omgangsvormen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Examen Neurale Netwerken (2L490), op woensdag 28 juni 2006, uur.

Gemeentefonds verevent minder dan gedacht

Integere programmering voor cyclische personeelsplanning

DE HAVO-LEERLING STUDIEVAARDIG

VOOR EEN GOED RESULTAAT IS HET ABSOLUUT NOODZAKELIJK DEZE LEGINSTRUCTRIES NAUWKEURIG TE VOLGEN.

Standaardisatiemethoden. 9 10Abby Israëls. Statistische Methoden (10003)

flits+ Geen idee Ongeveer de helft? Wanneer is de vraag... Uh..? Ik weet het! bpfhibin.nl Ik verkoop mijn huis Wie dan leeft... Zien we dan wel weer

Beleggen in duurzame aandelen bij Robeco

VOOR HET SECUNDAIR ONDERWIJS. Correlatie: exploratieve methoden. Werktekst voor de leerling. Prof. dr. Herman Callaert

EH SmartView. Een slimme kijk op risico s en opportuniteiten. Monitoring van kredietverzekering. Euler Hermes Online Services

Heerhugowaard Stad van kansen

Samenvatting Farmaco-epidemiologie april 2011

opleidingen Creditmanagement en activabeleid (13 dagen) ook modulair te volgen Risico-analyse (*) (1 dag)

~~i~il' 1025 VS Amsterdam. Geacht bestuur,

Bureau of lessenaar. Een onderzoek naar de meting van bureaucratie in onderwijsinstellingen. Definitief eindrapport

Statica in een notendop

Prijs ƒ 3.- "OCTllCO' HA AD

Uitgebreide aandacht warmtapwatersystemen. Door afnemende warmtevraag voor ruimteverwarming, neemt het belang van het

Gebiedsgericht Voorraadbeleid van Woningcorporaties. Een analyse van planningsbenaderingen in Vogelaarwijken. Arne van Overmeeren

aantallen in van de prooiresten gewicht min of meer mogelijk, doch als de gebitsmaten van een groot aantal gevangen dat de gewichtsfaktor

DE SPORTCLUB: NIET ALLEEN VOOR MAAR OOK VAN DE JEUGD

De Waarde van Toekomstige Kasstromen

In vier stappen naar een succesvolle informatievoorziening

De waarde van de CIO

1. In de hoofdstad van Ivoorkust, Yamoussoukro, meet men de lengte van 100 mannen (in cm) :

7. Behandeling van communicatie en mondmotoriek

opleidingen ERKEND OPLEIDINGSINSTITUUT VLAAMSE OVERHEID

1. SAMENVATTING EN CONCLUSIES

Handreiking Behorende bij Verslag over de Uitvoering Abw, IOAW, IOAZ en WIK 2003

Applicatieportfoliomanagement

Onderhoud en beheer van infrastructuur voor goederenvervoer

VOOR HET SECUNDAIR ONDERWIJS. Exploratieve statistiek. Infoboekje. Prof. dr. Herman Callaert

C.P. van Splunter. Grote afwijkingen. Bachelorscriptie, 21 april Scriptiebegeleiders: prof.dr. F. Redig prof.dr. E.A.

Centraal Bureau voor de Statistiek Keten Economische Statistieken

Elementen van. Prof. dr. Raymond De Bondt. Alta

Inhoudstafel Regressie: exploratieve methoden

Onderzoek! Ontdek! Onderneem! WELKOM BIJ DE EUREKA!CUP Eureka!Cup is een programma van Stichting Techniekpromotie

One size fits not all

DETERGENTEN IN UW DAGELIJKS LEVEN

GEMEENTE HELLEN DOORN lichand.: 1 FEB A1 B Stuk itreťw.: Werkpr.. Kopie aan: Archief' ü 1 N reeks/vlvcrtr.:

Publicatieblad van de Europese Unie. (Besluiten waarvan de publicatie voorwaarde is voor de toepassing)

STUDIEBOEK. wiskunde. Meester Kenneth Zesde leerjaar

Reinier van der Kuij

Dit is de digitale schoolgids van. IKC Het Sterrenbos

Installatiehandleiding

CP-richtlijn: Uitwerking van aanbeveling 4.2

I I f I I I I I I i i i i i i i

ACCU-CHEK. Compact Plus. Gebruiksaanwijzing SYSTEEM VOOR DE BEPALING VAN BLOEDGLUCOSE

Automatic-schakelaar Komfort Gebruiksaanwijzing

Inhoud leereenheid 1. Van informatiemodel naar informatiesysteem. Introductie 15. Leerkern 16. Terugkoppeling 37 Uitwerking van de opgaven 37

Nieuwsbrief van de maand juni 2010 van de cliëntenraad sociale zekerheid te Hulst.

Yield Management & Short Selling

Websiteoptimalisatie aan de hand van online zoek en klikgedrag analyse

De standaardafwijking

Voorschriften voor MARS Documentversie 2.52

Statistiek Hoorcollege 7. Correlatie en Predictie 10/20/2009. De Collegereeks Statistiek. Volgende week. Deze week. Keuze van de statistische toets

Beroepsregistratie en vooraanmelden voor beroepsregistratie. in de jeugdhulp en jeugdbescherming

Transcriptie:

Prof. Dr. E. Omey INLEIDING tot de ECONOMETRIE Utgeverj Den Arend 3rd Edton Utgeverj DEN AREND bvba Mechelsesteenweg 138/1 B-2820 Bonheden Belgum Wetteljk Depot: D/2004/5027/11 ISBN 90 5610 288 5

VOORWOORD Deze tekst werd geschreven ten behoeve van studenten en andere geïnteresseerden de eng nzcht wllen verwerven n de hedendaagse econometre. Studenten de een basscursus wskunde en wskundge statstek gevolgd hebben zullen vrjwel moeteloos de tekst kunnen volgen. In het nledende hoofdstuk één bestuderen we de centrale doelstellngen van de econometre en gaan we deper n op enkele methodologsche aspecten. In hoofdstuk twee volgen enkele schattngscrtera om de parameters van een al dan net lnear model te schatten. De meeste aandacht gaat evenwel naar de klenste kwadraten methode ennaar de kwaltet van gevonden modellen. Een belangrjk facet bj het opstellen van een model bestaat ut een goede selecte van verklarende varabelen. In hoofdstuk dre wordt het bvaraat (lnear) model volledg besproken. In detal komen de onderwerpen: schatten, betrouwbaarhedsntervallen, toetsen van hypothesen en het voorspellen aan bod. In hoofdstuk ver bespreken we enkele moeljkheden de kunnen optreden bj onze analyse. We analyseren o.a. heteroscedastctet, multcollneartet en autocorrelate. In hoofdstuk vjf tenslotte volgen enkele begnselen van tjdreeksanalyse. We bestuderen de verschllende componenten van een tjdreeks en bekjken dan n detal de analyse van de trenden sezoenscomponent. De analyse van dt handboek wordt geïllustreerd va een aantal utgewerkte voorbeelden. Tevens wordt getoond hoe de berekenngen gemaakt kunnen worden met EXCEL. Het gebruk van EXCEL bj de gewone beschrjvende statstek kan worden bestudeerd va een nteracteve cursus de grats dgtaal beschkbaar s va de webste van EHSAL, Brussel. Andere utgewerkte case-studes en voorbeelden worden afzonderljk gepublceerd en maken geen deel ut van dt handboek. De aandachtge lezer kan echter zelfstandg vele voorbeelden en case-studes vnden n tal van tjdschrften en studedomenen na een klene wandelng n een bblotheek. Tot slot nog een woord van dank. Een handboek schrjven en beslssen wat op te nemen en wat net, neemt veel tjd n beslag! Tevens gaan tal van dscusses over nhoud, volgorde, symbolen en notates het feteljke schrjven vooraf. De hudge tekst werd geboren tjdens gesprekken met Prof. R. Vanstraelen (UFSIA) en werd meermaals aangepast nadat de nhoud werd getoetst aan de studenten van EHSAL. De opmerkngen, correctes en ervarng van Prof. K. De Bruyn en Prof. F. Cole zorgden voor de defnteve vorm van de tekst. Edward A.M. Omey Denze, Augustus 2004 2

HOOFDSTUK 1 HET STUDIEDOMEIN VAN DE ECONOMETRIE 1.1. WAT IS ECONOMETRIE? Wanneer we het woord "econometre" letterljk nterpreteren, dan zouden we kunnen spreken van "economsche meetkunde". Alhoewel het meten een belangrjk onderdeel s van econometre, toch s haar horzon veel breder, zoals trouwens tot utng komt n de volgende ctaten: "Econometrcs, the result of a certan outlook on the role of economcs, conssts of the applcaton of mathematcal statstcs to economc data to lend emprcal support the models constructed by mathematcal economcs and to obtan numercal results." "Econometrcs may be defned as the quanttatve analyss of actual economc phenomena based on the concurrent development of theory and observaton, related by approprate methods of nference." "Econometrcs may be defned as the socal scence n whch the tools of economc theory, mathematcs, and statstcal nference are appled to the analyss of economc phenomena." "Econometrcs s concerned wth the emprcal determnaton of economc laws." "The art of the econometrcan conssts n fndng the set of assumptons that are both suffcently specfc and suffcently realstc to allow hm to take the best possble advantage to the data avalable to hm." "Econometre s te zen als wetenschappeljk onderzoek dat erop gercht s de resultaten van economsche veronderstellngen en redenerngen aan te vullen met kwanttateve nformate, verkregen ut emprsche gegevens." De econometre s een redeljk jonge wetenschap. Als baanbreker van het (economsch) emprsch onderzoek beschouwt men dkwjls H.L. Moore, de reeds n 1919 een "Emprcal Laws of demand and supply and the flexblty of prces" publceerde n The Poltcal Scence Quarterly. De benamng econometre werd gelanceerd door de Noorse hoogleraar R. Frsch de zch nspreerde op de term bometre - dt s het geheel van statstsche onderzoekngen over levende wezens. Een mjlpaal n de ontwkkelng van de econometre was de stchtng van de "Econometrc Socety" n 1930. Ze werd opgercht onder mpuls van R. Frsch, I. Fscher, J. Schumpeter e.a., met als voornaamste doelstellng het bevorderen van de economsche wetenschap n haar relate tot de wskunde en de statstek. Tevens verschjnt snds 1933 het wereldbefaamde tjdschrft Econometrca. In het hoofdartkel van Econometrca N 1 beschreef J. Schumpeter The common sense of econometrcs en verdedgt hj de stellng dat econometre en econome een perfect paar vormen: economsche feten doen zch voor onder de vorm van numereke kwantteten en numereke verhoudngen ertussen. Nu maakt men gebruk van econometrsche techneken en denkwjzen n een brede waaer van economsche en andere 3

toepassngsgebeden. Omwlle van de beschkbaarhed van geschkte software zjn er nu veel mnder beperkngen en kan men n tegenstellng tot vroeger, grote databanken onderzoeken. Het vak econometre bezt dus n wezen een nterdscplnar karakter. Met zou het kunnen omschrjven als een synthese van kenns nopens econome, statstek en wskunde. Toepassngen van econometre en andere kwanttateve techneken vndt men net alleen terug n dverse algemeen-economsche vakken, maar ook n de meer gespecalseerde gebeden van marketng, ndustreel beheer, accountancy, transporteconome, fnancële modellen, enz. Zoals reeds gesuggereerd, bestaat econometre ut een amalgaam van economsche theore, wskundge econome, economsche statstek en wskundge statstek. De economsche theore houdt zch hoofdzakeljk bezg met het vooropstellen van hypothesen en het afleden van stellngen, de vooral kwaltatef zjn van aard. Zo s er bjvoorbeeld n mcro-econome een stellng de zegt dat, ceters parbus, een prjsdalng van een goed ledt tot een toenameb van de vraag naar dat goed. De economsche theore stelt dus een omgekeerd verband vast tussen de prjs van en de vraag naar dat goed. Maar zj houdt zch geenszns bezg met het onderzoeken van de numersche waarde van dt verband. De economsche theoretcus zal, op bass van een gegeven prjsdalng van een goed, dus net kunnen zeggen met hoeveel eenheden de vraag naar dat goed zal stjgen. Het s de taak van de econometrst om dt soort schattngen te doen, of, anders utgedrukt, het s de econometre de de economsche theore zal toetsen. De hoofdbekommerns van de wskundge econome bestaat ern de economsche theore op een formele, wskundge wjze weer te geven, zonder rekenng te houden met de meetbaarhed of de emprsche toetsng van de theore. Zoals hoger reeds vermeld, s het de taak van de econometrst om de theore emprsch te onderzoeken. Herbj zal hj vaak gebruk maken van de formules de door de wskundge economst voorgesteld zjn, maar hj zal deze formules n een zulkdange vorm geten dat ze zch lenen tot emprsche verfcate. De economsche statstcus houdt zch voornameljk bezg met het verzamelen, verwerken en voorstellen van economsche gegevens onder de vorm van grafeken en tabellen. In enkele gevallen zal hj zch ook wagen aan de berekenng van een gemddelde of van een standaardafwjkng, maar verder gaat zjn taak net. De gegevens de verzameld worden vormen de ruwe grondstof voor het egenljke econometrsch werk. Ondanks het fet dat de wskundge statstcus vele nstrumenten ter beschkkng stelt van de econometrst, toch heeft deze laatste vaak behoefte aan specale analytsche techneken. Bj het verzamelen van (economsche) gegevens kunnen we meestal net vertrekken van een gecontroleerd experment en zjn we afhankeljk van gegevens de net altjd onmddelljk kunnen worden gecontroleerd. Bovenden bevatten deze gegevens vaak een aantal meetfouten, zodat de econometrst een beroep moet doen op specale techneken ten ende rekenng te houden met deze afwjkngen. 4

1.2. METHODOLOGIE VAN DE ECONOMETRIE De hoofdljnen van de econometrsche aanpak kunnen we weergeven aan de hand van het volgende schema. Het schema omhelst 3 centrale pjlers met telkens 5 nveau's. nveau 1 Theore Empre Methodologe systeem en economsche theore empre en feten wskunde en kansrekenen nveau 2 economsch model data statstek nveau 3 econometrsch model bewerkte data econometrsche methoden nveau 4 operatoneel econometrsch model schattngsfase nveau 5 verfcate voorspellng evaluate Pjler I s vooral gercht op theoretsche modellen. Om deze te kunnen verfëren hebben we nood aan geschkt cjfermateraal (pjler II) en geschkte techneken (pjler III). We zullen de verschllende ngredënten van dt schema nu van naderbj bestuderen. 1.2.1. Pjler I 1. Nveau 1: economsche theore Elke econometrsche analyse begnt met het afbakenen van het probleem dat men wl bestuderen. Va een lteratuurstude kan men onderzoeken welke varabelen nuttg zjn bj het probleem dat op tafel lgt. Bj het ontwkkelen van een economsche theore worden varabelen gegroepeerd en worden algemene regels bestudeerd. Deze kunnen dan voorgesteld worden n een economsch model. Dergeljke algemene regels kwamen reeds utgebred aan bod tjdens de cursussen econome. Zo vermoeden we dat de vraag naar een normaal produkt daalt naarmate de prjs stjgt. Het marktaandeel van een krant hangt af van de marketngnspannngen de men doet. Het loon van een werknemer hangt af van de leeftjd, het beschkbare dploma, de sector, de ervarng, Keynes bjvoorbeeld onderzocht het consumptegedrag en stelde vast dat de mensen genegd zjn hun consumpte te verhogen wanneer hun nkomen stjgt, maar dat deze consumptetoename klener s dan de toename van hun nkomen. 2. Nveau 2: specfcate van een model Het specfëren van een economsche theore onder de vorm van een wskundg model s een belangrjke opdracht van de econometre. De specfcate omvat twee facetten: - hoeveel varabelen, en welke varabelen nemen we op n het model; - hoeveel relates, en welke relates nemen we op n het model. In econome worden vraag en aanbod modelmatg meestal grafsch als volgt voorgesteld: 5

vraag en aanbod P Q Dt model kan gebrukt worden om tal van economsche fenomenen toe te lchten en te verdudeljken. Het s moeljk te geloven dat dt model zch n de realtet zo manfesteert. Keynes bestudeerde het verband tussen consumpte C en nkomen Y, maar hj laat ons n het ongewsse over de precese vorm van dt verband. De wskundge economst zou bjvoorbeeld de volgende formule kunnen voorstellen: (1) C = A + cy met 0 < c < 1 In deze formule s A de autonome consumpte en s c de consumptequote. Grafsch kunnen we (1) voorstellen als een rechteljn. Formule (1) s ee n voorbeeld van een wskundg model. In dt voorbeeld bestaat het model ut één vergeljkng en twee varabelen. Andere modellen bestaan ut één of meer wskundge vergeljkngen met één of meer varabelen. Formule (1) heeft ook een zodange vorm dat we met behulp van cjfermateraal kunnen controleren of de formule correct s of ongeveer correct s: het volstaat cjfermateraal omtrent C en Y te zoeken en grafsch voor te stellen. Als volgend voorbeeld bekjken we de dageljkse vraag V naar een frsdrank. De algemene economsche theore ledt tot een verband van de volgende vorm: (2) V = f (prjs, prjs alternatef, temperatuur, # verkooppunten,...) Om een econometrsch model te bekomen s het noodzakeljk om de functe f ( ) te precseren en te beslssen welke varabelen we zullen gebruken. Het s noodzakeljk om de vroeger opgesomde vragen te beantwoorden. Hoeveel varabelen? Welke? Hoeveel relates? Welke? 3. Nveau 3: econometrsch model Zuver wskundge modellen zjn net steeds nteressant omdat er een exact, een determnstsch verband gelegd wordt tussen twee of meer grootheden. Bj economsche varabelen kan men zelden spreken van determnstsche relates. In formule (1) kunnen er naast het nkomen, nog andere grootheden het consumptenveau beïnvloeden. In formule (2) kunnen we - al dan net bewust - bepaalde varabelen vergeten. Bovenden s het zo, dat onder geljkbljvende omstandgheden, consumenten toch telkens weer anders gaan reageren. Een determnstsch model heeft als kenmerk dat bj geljke nput, de output steeds dezelfde bljft. In de formule y = 2 + 3x vnden we voor x = 7 steeds y = 23. 6

In econome hebben we meestal net te maken met determnstsche modellen. De prjs van een blkje ber bljft dezelfde en toch zal de dageljkse omzet steeds anders zjn! Een van de belangrjke redenen hervoor s het toeval. Daarom spreken we her over stochastsche modellen. Een stochastsch model heeft als kenmerk dat bj een geljke nput de output kan varëren, en dat de varate afhangt van het toeval. Om hermee rekenng te houden zal men de relates (1) en (2) aanpassen met behulp van een foutenterm: (1') C = A + cy + ε (2') V = f(prjs, temperatuur,, ε) In deze formules s ε de storngsterm. Deze storngsterm omhelst het geheel van fouten de kunnen worden gemaakt. Dergeljke relates noemt men stochastsche relates. Het spreekt vanzelf dat we n econometre meestal te maken hebben met stochastsche relates. Het optreden van de foutenterm ε kan n het algemeen gezen worden als bestaande ut verschllende componenten: (a) meetfouten: om allerle redenen s het mogeljk dat grootheden verkeerd of onnauwkeurg gemeten worden. Bj het wegen van de graanopbrengst van een stuk land kan er naccuraat gewogen worden. Bj het bestuderen van het consumptenveau van geznnen kunnen er fouten optreden bj het rapporteren. Bj bevolkngsstatsteken weten we noot exact hoeveel Belgen er zjn, weten we noot exact hoeveel werklozen er zjn. Het geheel van meet- en observatefouten vormt een belangrjke component bj het tot stand komen van de storngsterm ε. We verwjzen herbj ook naar het valderngsprobleem, ze verder. (b) De varabele ε weerspegelt tevens het ndetermnsme n elke bologsche en/of socale omgevng. Bj éénzelfde soort bemestng bjv. kan de graanopbrengst van een stuk land toch verschllen omdat volledge controle onmogeljk s. Dergeljke onvoorspelbare resultaten zjn het gevolg van toevallge fouten. (c) De toevallge varabele ε weerspegelt tevens het geheel van latente varabelen. Dt zjn de talrjke, net explcet opgenomen factoren de een relate kunnen beïnvloeden. Naast de temperatuur kan de stand van de maan ook de vraag naar een frsdrank beïnvloeden. (d) De foutenterm weerspegelt eveneens de fouten de we maken bj de opname n het model van rrelevante varabelen. (e) De foutenterm kan ook te maken hebben met de - al dan net bewuste - keuze van de functonele vorm van de relate tussen de varabelen. We kezen bjvoorbeeld voor het lnear model C = A + cy maar n realtet moesten we werken met het model C = A + cy + dsn(y) 7

1.2.2. Pjler II Om een theore emprsch te mplementeren en te controleren, zullen we de relates tussen de verschllende varabelen n een model kwanttatef moeten schatten. Hertoe zal het van belang zjn de nodge economsche grootheden te meten en de daartoe vereste gegevens te verzamelen. De data denen dkwjls vooraf bewerkngen te ondergaan. 1. Nveau 1: empre en feten Om een economsch model emprsch te onderbouwen hebben we cjfermateraal nodg. Soms kunnen we gebruk maken van gepublceerd cjfermateraal. Een belangrjke bron van gegevens en nformate vormen de statsteken gepublceerd door dverse prvate en publeke organsates en gewesteljke, natonale en nternatonale nstellngen. We vermelden her het N.I.S., de R.S.Z., de R.V.A., de NBB, prvé-banken, dverse mnsteres (economsche zaken, butenlandse betrekkngen, fnancën), EUROSTAT, OESO, IMF enzovoort. Soms kan men bj dergeljke nstellngen ook bjzondere data verkrjgen en net-gepublceerde gegevens. Bedrjven beztten ook dkwjls nterne gegevens onder de vorm van databanken. Verschllende ondernemngen zjn thans gespecalseerd n de verzamelng van allerhande nformate de dan tegen betalng kan verkregen worden. Een exhaustef beeld over alle mogeljkheden nzake dataverzamelng valt evenwel buten het bestek van deze nota's. Bj het gebruk van data moet wel rekenng gehouden worden met de nauwkeurghed van de data: - de meest gepublceerde data suggereren een veel grotere nauwkeurghed dan n werkeljkhed het geval s. Dkwjls zjn de cjfers reeds afgeronde cjfers of gemddelden. - de graad van nauwkeurghed loopt sterk uteen: de ene reeks s nauwkeurger dan de andere. - fouten n de data zjn net steeds symmetrsch: sommge nstellngen ronden altjd af of naar onder of naar boven, en andere nstellngen ronden af naar onder of naar boven al naargelang de cjfers na het kommateken > 0.5 of < 0.5 zjn. In andere gevallen zullen we genoodzaakt zjn om zelf cjfermateraal te verzamelen. Het s mmers ondenkbaar dat alle feten en cjfers door de profesonele organsates worden bjgehouden. In het verleden bjvoorbeeld hebben studenten studes gemaakt over de prjs van een verjaardagskaart, de prjsbepalng van (oude) postzegels e.d. en ze moesten eerst zelf een steekproef samenstellen. Bj het verzamelen van data omtrent een varabele rjst ook dkwjls het probleem van de valdtet: meten we wel datgene wat we theoretsch wensen te meten? Vele varabelen zoals bjv. de kaptaalvoorraad, veranderen net enkel kwanttatef maar ook kwaltatef. De geschkte data of gegevens zjn net altjd aanwezg om een bepaald varabel begrp te meten. Hoe kunnen we bjvoorbeeld wjzgngen meten n de technologe of n de consumentenvoorkeur? In econometre worden daarom dkwjls "proxy"-varabelen gebrukt. De proxy-varabele wordt dan gezen als een benaderng voor de echte varabele de we wensen. Als we bjvoorbeeld het effect van de genoten opledng wllen bestuderen met betrekkng tot het geznsnkomen, dan gebruken we de proxy-varabele aantal jaren schoolse opledng als benaderng voor de echte varabele aantal jaren opledng. De soco-culturele bagage van een leerlng zullen we msschen benaderen met de varabele het beroep van de ouders. 8

Het s dus noodzakeljk om over adequate data te beschkken omtrent alle varabelen n een vooropgesteld model. Gebrek aan geschkte data vormt dkwjls een onoverkomeljke hnderns bj het utwerken van een economsche stude. De data waarmee men werkt n de econometre kunnen onder de volgende twee hoofdvormen voorkomen: tjdreeksen en doorsneden of cross-sectes. Bj tjdreeksen meten we een bepaald varabel begrp op verschllende momenten of voor verschllende perodes: dageljks, maandeljks, per kwartaal, per jaar. Een tjdreeks geeft nformate nopens de ntertemporele varate van bepaalde economsche of bedrjfseconomsche grootheden zoals bjv. de evolute van omzetcjfers, van werklooshedsgraad. Doorsnedegegevens daarentegen meten een bepaald varabel begrp n dezelfde perode maar voor verschllende groepen. Groepen kunnen geznnen, landen, rego's, bedrjven,... zjn. We meten bjvoorbeeld de werklooshedsgraad n de verschllende staten van de Verengde Staten. Tjdreeksen en doorsneden worden n de econometre soms gecombneerd aangewend. Men spreekt dan van poolng. Bjvoorbeeld: de produkte naar bedrjfstakken beschouwd over een reeks van jaren. Een bjzonder type van gecombneerde tjdreeksen en doorsnedegegevens wordt gevormd door panel-data of longtudnale data. Dt zjn doorsnedegegevens over een vaste steekproef van eenheden (bjv. geznnen, bedrjven) de n de tjd regelmatg kunnen worden herhaald. Wj ntervewen bjvoorbeeld 1000 geznnen wekeljks omtrent hun kjkgedrag of hun kesntentes. Dergeljke panel-gegevens zjn gewoonljk mcrodata. Ze zjn moeljk verkrjgbaar. Meestal zjn voor econometrsche studes slechts geaggregeerde data beschkbaar. Aan het aggregeren of samenvoegen van data, evenals van relates, zjn dverse econometrsche aspecten verbonden. Herop kan evenwel nog net deper worden ngegaan. 2. Nveau 2: soorten varabelen Varabelen worden van elkaar onderscheden door een rjk geschakeerd gamma van benamngen. Zo spreekt men bjvoorbeeld van endogene en exogene varabelen, van contnue en dscrete varabelen,... De betekens van deze termen bljkt meestal ut de bepaalde context waarn de varabelen optreden. De meest effcënte classfcate bestaat er n de varabelen te vergeljken met de meetschaal ten opzchte waarvan ze gemeten worden. Men kan een vertal categoreën onderscheden. Kwaltateve varabelen zjn varabelen de een kwaltet weergeven. Deze varabelen kan men net op een znvolle maner voorstellen met getallen waarmee we kunnen rekenen. We onderscheden hern twee soorten: Nomnale varabelen: de meest prmteve meetschaal s de nomnale meetschaal. Hermee duden we enkel een kwaltatef kenmerk aan. Bovenden kunnen we n deze varabelen geen natuurljke rangorde vnden. Voorbeelden. Geslacht, merk van auto, de sector waarn men werkt, enzovoort Ordnale varabelen: met meet ook kwaltateve kenmerken, maar er s tevens een natuurljke volgorde aanwezg. Voorbeelden. Mltare rang, de fscale classfcate van wonngen (socaal, mddelgroot, groot), behaald dploma, schoenmaat, enzovoort. Kwanttateve varabelen zjn varabelen de een kwanttet weergeven. Deze varabelen kan men wel op een znvolle maner voorstellen met getallen waarmee we kunnen rekenen. We onderscheden ook her twee soorten: 9

Intervalvarabelen: deze varabelen zjn kwantfceerbaar, er s een natuurljke volgorde aanwezg en men kan verschllen tussen de waarden van deze varabelen vergeljken. Pure ntervalvarabelen beztten geen natuurljk nulpunt. Voorbeelden. IQ-schalen, temperatuurschalen, enzovoort. Men kan beweren dat het verschl tussen 10 C en 20 C hetzelfde s als het verschl tussen 20 C en 30 C, maar men kan net zeggen dat het bj 20 C dubbel zo warm s als bj 10 C. Ratovarabelen: dt zjn ntervalvarabelen met een natuurljk nulpunt. Het nulpunt geeft weer dat het kenmerk afwezg s. Omwlle van dt nulpunt kunnen we op een znvolle maner rato s of verhoudngen bestuderen. Voorbeelden. Lengte n meter, het gewcht n kg, het nkomen n, enzovoort In de meeste econometrsche studes heeft men te maken met zowel kwaltateve als kwanttateve varabelen. Om kwaltateve varabelen te kunnen gebruken gaan we deze kwanttatef weergeven met behulp van één of meerdere dummyvarabelen. Een dummyvarabele s een varabele de slechts twee waarden kan aanmenen: 0 of 1. De waarden 0 of 1 geven weer of een bepaald kenmerk al of net aanwezg s. Voorbeeld 1 In een stude over werkverzum wenst men een model op te stellen waarbj er rekenng gehouden wordt met de leeftjd en met het geslacht van de verschllende personen ut de databank. De varabele geslacht s echter een kwaltateve varabele. Om deze varabele te kwantfceren maken we gebruk van één dummy- varabele. We stellen: D = 1 bj een man; D = 0 bj een vrouw. In onze databank vnden we dan bjvoorbeeld de volgende gegevens: (32, 1), (48, 0), (41, 1) De eerste persoon s een man van 32; de tweede persoon s een vrouw van 48, enzovoort. Voorbeeld 2 Dummy-varabelen lenen zch tot het onderzoeken van sezoensnvloeden. Wanneer we bjvoorbeeld een trmestreel sezoenspatroon vaststellen, dan kunnen we de sezoenseffecten analyseren m.b.v. dre dummy-varabelen. We stellen nu: D1 = 1 n het eerste trmester en 0 anders; D2 = 1 n het tweede trmester en 0 anders; D3 = 1 n het derde trmester en 0 anders. Het eerste trmester kunnen we nu coderen als (1,0,0). Het verde trmester kunnen we coderen als (0,0,0). De code (0,0,0) komt overeen met het verde trmester. Bemerk dat de code (1,1,0) net kan voorkomen. Voorbeeld 3 Bj ordnale varabelen kunnen we eveneens succesvol gebruk maken van één of meerdere dummy-varabelen. Wanneer we n een stude wensen rekenng te houden met de beroepscategore waarn emand werkt, dan gebruken we bjvoorbeeld de volgende ver categoreën: B1: arbeder; B2: bedende; B3: kaderld; B4: drecte. Deze ver klassen kunnen we op een uneke maner coderen met behulp van dre dummyvarabelen. We stellen bjvoorbeeld: D1 = 1 bj B1 en D1 = 0 anders; D2 = 1 bj B2 en D2 = 0 anders; D3 = 1 bj B3 en D2 = 0 anders. 10

We besluten dat kwaltateve varabelen gekwantfceerd kunnen worden met behulp van één of meerdere dummy-varabelen. Wanneer een kwaltateve varabele overeenstemt met k klassen of categoreën, dan kunnen we coderen m.b.v. k 1 dummy-varabelen. 3. Nveau 3: bewerkngen met data Soms moeten de verzamelde data allerle bewerkngen ondergaan tenende ze brukbaar te maken voor een bepaalde econometrsche utwerkng. Heronder volgen enkele voorbeelden. (a) deflerng: omzetten van nomnale waarden naar reële waarden; (b) verbnden: wanneer cjfers beschkbaar zjn onder de vorm van ndexcjfers, maar de vanaf een bepaalde perode een veranderng ondergngen; (c) effenen of gladstrjken: dt komt neer op het toepassen van een flter om oneffenheden of grote sprongen n een tjdreeks te elmneren. Men maakt herbj soms gebruk van voortschrjdende gemddelden. Wanneer we bjvoorbeeld beschkken over dageljkse gegevens, dan kunnen we wekeljks gemddelden berekenen e.d.. (d) onteffenen: dt komt neer op het toepassen van een flter om de regelmatge bewegng n een tjdreeks te elmneren. Men gebrukt o.m. dfferentes (d.. het verschl tussen opeenvolgende waarden), procentuele veranderngen, groevoeten, enzovoort. (e) andere transformates zoals kwadrateren, logartmen nemen, enz. worden dkwjls gebrukt om verbanden tussen varabelen beter tot utng te laten komen. 1.2.3. Pjler III In de derde pjler komt het arsenaal van wskundge en kanstheoretsche methodes aan bod. 1. Nveau 1: soorten relates Er bestaat een rjk gamma van benamngen voor relates tussen varabelen. Men spreekt bjvoorbeeld over gedragsrelates en nsttutonele relates, determnstsche en stochastsche relates, statsche en dynamsche relates, enkelvoudge en meervoudge relates,... Enkelvoudge relates bestaan ut één vergeljkng n twee (= enkelvoudge bvarate relate) of méér (= enkelvoudge multvarate relate) varabelen. Een eenvoudge enkelvoudge relate s bjvoorbeeld y = b 0 + b 1 x 1 of y = b 0 + b 1 x 1 + b 2 x 2 + + b m x m Hern s y de te verklaren of afhankeljke varabele. De varabelen x 1, x 2,, x m zjn verklarende of onafhankeljke varabelen. De grootheden b 0, b 1,, b m de de varabelen aan elkaar verbnden noemen we de parameters van de relate. De parameter b 0 s de constante term. 11

Meervoudge relates bestaan ut een stelsel van enkelvoudge relates waarn dverse te verklaren varabelen tegeljk verklaard moeten worden. Bj dt soort relates kunnen echter moeljkheden.v.m. dentfcate optreden. Wat de vorm van de relates betreft, kan men het hele arsenaal van wskundge modellen aanwenden: - lneare modellen: (lnear n de parameters) Y = a + bx (rechte) Y = a + bx + cx² (parabool) Y = a + bx + cz + du - exponentële modellen: Y = ae bx, Y = a + be cx - log-lneare modellen: Y = a X b Z c (Cobb-Douglas type) - golfmodellen: Y = a + bx + c sn (dz + e) - logsteke modellen, Gompertz modellen, enzovoort. Dkwjls wordt de keuze beperkt door a pror restrctes vanut de economsche theore. Modellen bjvoorbeeld de constante elastcteten veronderstellen geven aanledng tot relates van het Cobb-Douglas type. In deze cursus besteden we hoofdzakeljk aandacht aan lneare modellen: dt zjn modellen de lnear zjn n de parameters. Bj net lneare modellen proberen we va een geschkte transformate het model te lnearseren. Voorbeelden lneare modellen Y = a + bx² Y = a + bcos(x) + csn(z) lnearseerbare modellen Y = ae bx logartmen nemen geeft ln(y) = ln(a) + bx = a* + bx Y = 1/(a + bx) omwsselen teller en noemer geeft 1/Y = a + bx Y = ax b logartmen nemen geeft ln(y) = ln(a) + bln(x) = a* + bx* andere modellen Y = a + be cx geen geschkte transformate bekend Y = a/(1 + bx c ) geen geschkte transformate bekend 2. Nveau 2: statstek Ter nformate volgt her een beknopt overzcht van enkele veel gebrukte onderdelen van stattstek. Beschrjvende statstek - doel: data doeltreffend samenvatten en grafsch voorstellen; - voorbeelden: centrale parameters, spredngsparameters, correlatecoëffcënten, hstogram, emprsche verdelngsfuncte,... 12

Verklarende statstek - doel: concluses.v.m. een steekproef veralgemenen tot de totale populate en analyse van de benaderngsfouten; - voorbeelden: betrouwbaarhedsntervallen, (steekproef-) fouten-analyse, toetsen van hypothesen,... Testen op verschllen - doel: bepalen of twee of meerdere objecten sgnfcant van elkaar verschllen m.b.t. een karaktersteke egenschap; hypothesen toetsen; - voorbeelden: de t-test, de z-test, de F-test, de KS-test, de chkwadraattest,... Afhankeljkhedstesten - doel: meten van (statstsche) afhankeljkhed tussen twee of meer vele varabelen en de mate van afhankeljkhed; - voorbeelden: correlate-analyse, regresse-analyse, betrouwbaarhedsntervallen opstellen over het effect van één varabele op een andere. Kwaltateve analyse - doel: kwaltateve kenmerken beschrjven en analyseren. - voorbeelden: multdmensonal scalng; clusteranalyse, 3. Nveau 3: econometrsche methodes Wanneer we geopteerd hebben voor één of ander econometrsch model, moeten we nu methodes bestuderen om de parameters van ons model te schatten. Tevens s het wenseljk over crtera te beschkken de nformate geven over de kwaltet van de schattngen en over de kwaltet van de gebrukten modellen en methoden. Al naargelang het crterum dat men hanteert en van de bassveronderstellngen de men maakt, gebrukt men - de klenste kwadratenmethode, - de maxmum-lkelhood-methode, - de momentenmethode, - logt-modellerng, - parametervrje methoden,... Het s herbj utermate belangrjk van te kunnen onderzoeken wat de kwaltet s van de schattngen en van het gehanteerde model. Tevens s het belangrjk de kwaltet van de voorspellngen te kunnen beoordelen. Uteraard gaan we her verder deper op n. 1.2.4. Nveau 4: operatoneel econometrsch model Op het ogenblk dat een econometrsch model aanwezg s, dat er geschkt cjfermateraal voor handen s en dat we beschkken over geschkte methoden kunnen we de dre pjlers ntegreren: we schatten de parameters n het model. Het schatten zelf zal meestal net het moeljkste zjn. Beschkbare software zorgt er mmers voor dat er bjna geen manuele berekenngen moeten gemaakt worden. Het voorberedend werk en de evaluates achteraf vormen de hoofdbrok van het werk. 13

In deze fase zullen we utermate veel aandacht hebben aan de kwaltetsaspecten van ons econometrsch model. We onderzoeken o.m. - de kwaltet van het gebrukte model en de gebrukte varabelen; - de kwaltet van de gevonden parameterschattngen; - de kwaltet van de voorspellngen de we kunnen maken met het model. Daarnaast onderzoeken we de bassveronderstellngen de moe(s)ten gemaakt worden om de gehanteerde techneken te mogen gebruken. 1.2.5. Nveau 5 1. Egenschappen van een goed model a. Eenvoud Een goed model kan omzeggens noot een exacte beschrjvng geven van de werkeljkhed. Om de werkeljkhed volledg nauwkeurg te beschrjven, zouden we een zodang complex model moeten opbouwen dat het praktsch nut ervan vrjwel tot nets herled s. We moeten dus proberen om het model zo eenvoudg mogeljk te houden. Mlton Fredmann drukt het treffend ut als volgt: Een wskundg model s des te krachtger naarmate het meer verklaart met mnder varabelen!. Dt betekent dus dat we het betreffende fenomeen moeten trachten te beschrjven met slechts enkele sleutelvarabelen de de essente van het probleem verklaren. b. Identfceerbaarhed Dt betekent dat alle parameters op een ééndudge wjze moeten kunnen geschat worden. Elke parameter mag slechts één enkele waarde hebben. Deze voorwaarde s zeer belangrjk n modellen waar dezelfde parameter meerdere malen voorkomt. c. Verklarend vermogen Eén van de belangrjkste egenschappen voor een goed model s de hoge mate van overeenkomst tussen de resultaten de door het model gegenereerd worden en de de realtet. Men zou deze egenschap kunnen omschrjven als het verklarend vermogen van het model. d. Theoretsche consstente Een model dat aan hoger vermelde voorwaarden voldoet kan toch slecht zjn. Wanneer het teken van één of meer parameters net n overeenstemmng s met de theoretsche verwachtngen dan wl dt zeggen dat deze varabelen een omgekeerde nvloed utoefenen op het te verklaren verschjnsel. Zo zou bjvoorbeeld (volgens het model) een prjsverhogng voor gevolg hebben dat de vraag naar het betrokken goed stjgt. In zulk geval verdent het aanbevelng om de specfcate van het model met de nodge achterdocht te benaderen. e. Voorspellngskracht Hermee bedoelt men de voorspellngskracht van het model naar de toekomst toe. Men treedt her dus buten de gegevens de gebrukt werden om de parameters te berekenen en zal men nagaan n hoeverre de voorspellngen op bass van het model overeenkomen met de werkeljke toekomstge resultaten. 14

2. Pjler I: verfcate Nadat we een econometrsch model operatoneel hebben gemaakt en va data schattngen hebben gemaakt, s het belangrjk te gaan evalueren. Het soort model dat utendeljk gehanteerd zal worden, hangt af van het specfeke doel dat men voor ogen heeft. Soms worden modellen ngedeeld n dre klassen: beschrjvende modellen, voorspellende modellen, verklarende modellen. De econometre heeft onder andere als taak een keuze te maken tussen econometrsche theoreën en/of modellen. Daartoe denen deze laatste geconfronteerd te worden met de realtet: men spreekt van verfcate. Hoe kan men een theore verfëren? We kunnen twee extreme vses onderscheden: hypothetsme of prognostocsme. a) Bj hypothetsme worden de basshypothesen van een theore geconfronteerd met de realtet. Als deze net met de werkeljkhed overeenstemmen, dan dent de hele theore te worden verworpen. (voorbeeld van een basshypothese: wnstmaxmalsate). b) Bj prognostocsme wordt een theore beoordeeld op bass van de nauwkeurghed van haar voorspellngen. De waarde van een theore wordt bepaald op bass van haar voorspellngskwaltet, dt s de mate van overeenkomst tussen expermentele waarnemngen en de voorspellngen van de beschouwde theore. Wanneer een bepaalde opvattng net voldoet, behoort het uteraard tot de opdracht van de econometre een meer bevredgende theore te ontwkkelen. 3. Pjler II: voorspellen Econometre heeft een - momenteel aan sterk belang wnnende - praktjkgerchte opdracht te vervullen. Deze bestaat ut het verrchten van gefundeerde prognoses en het utwerken (met het oog op beledsevaluates) van smulates. a) prognose: dt s het voorspellen van de waarden van bepaalde varabelen of de wjze van hun veranderng over een bepaalde perode n de toekomst. Herbj denken we bjvoorbeeld aan: - het voorspellen van de werklooshedsgraad; - het voorspellen van de omzet van een produkt. b) smulate: hermee proberen we met een operatoneel econometrsch model de veranderng te bepalen n varabelen tengevolge van voorgenomen beledsstrategeën en/of gewjzgde omgevngsfactoren. Op deze maner kunnen we b.v. de weerslag van een bepaald beled of van een bepaalde beslssng beoordelen. 15

4. Pjler III: evalueren Op nveau 5 evalueren we de gebrukte techneken en methoden. In deze fase kunnen we bjvoorbeeld beslssen dat de bestaande techneken net volstonden en dat er neuwe of andere methoden nodg zjn. Zeker bj net lneare modellen staan de schattngsmethoden nog net helemaal op punt en onderzoeken wetenschappers hoe ze daar een mouw kunnen aan passen. Bj modellen waar de te verklaren varabele een dummy varabele s, s de wetenschappeljke wereld nog volop op zoek naar geschkte schattngstechneken. Meer en meer gaan wetenschappers ook op zoek naar alternateven voor de klasseke klenste kwadratenmethode. Alternateven de nu onderzocht worden zjn parametervrje methoden en methoden gebaseerd op andere afstanden dan de kwadratsche afstanden. 16

HOOFDSTUK 2 SCHATTINGSTHEORIE 2.1. SCHATTINGSCRITERIA 2.1.1. Inledng We begnnen met een eenvoudg voorbeeld. We bekjken de nzet van meststof en de opbrengst per hectare van een bepaald gewas. De opbrengst per ha (Y ) s de te verklaren varabele, de nzet van meststof ( X ) de verklarende varabele. We hebben de varabele X onder controle en kunnen herhaalde proefnemngen utvoeren. Op deze maner verkrjgen we een hele reeks waarnemngen. Wanneer we deze waarnemngen op een grafek plaatsen, verkrjgen we bjvoorbeeld het volgende scatterdagram: Y X Hoe kunnen we nu met behulp van deze observates de relate tussen de varabelen achterhalen, en op een kwanttateve maner vastleggen? We kunnen op zoek gaan n de lteratuur en een relate vooropstellen tussen X en Y. Vervolgens kunnen we de parameters n deze relate gaan schatten. Welke relate utendeljk gekozen wordt, hangt af van de econometrst, de relevante lteratuur en eventuele theoretsche beperkngen of randvoorwaarden. In het algemeen gebruken we relates van de vorm waarbj Y = f ( X,,..., 1 X 2 a, b, c,..., ε) Y = de te verklaren varabele X, X,... 1 2 = de verklarende varabelen ε = een (stochastsche) stormngsterm a, b, c,... = parameters van het model 17

In concrete stuates moeten we een of meer geschkte verklarende varabelen kezen en de functe f vastleggen. Vervolgens moeten de parameters geschat worden. In ons voorbeeld hebben we één verklarende varabele X en s het aan ons om een functevoorschrft te kezen. In veel gevallen lggen de waarnemngen verspred n het scatterdagram en s er net onmddelljk een mooe relate voorhanden. Wanneer de puntenwolk een bjna rechtljng verband vertoont, kunnen we de echte relate tussen Y en X bjvoorbeeld benaderen door een relate van de vorm Y = a + bx + ε Om de parameter(s) te schatten laten we n eerste nstante de storngsterm ε weg en werken met de benaderng Y ˆ = f ( X, X,..., a, b,,...). In ons voorbeeld s dt Y ˆ = a + bx. 2.1.2. Schattngscrtera 1 2 c Hoe kunnen we nu de parameters n dergeljke relates optmaal schatten? Welke parameter- we preces utdrukken wat we bedoelen waarden geven de beste aanslutng van de waarnemngen met de vooropgestelde relate? We vragen her naar een schattngscrterum waarn met best. Er zjn dverse crtera denkbaar om een beste aanslutng te realseren. We bespreken her n het kort enkele mogeljke crtera. We stellen: Y = de -de geobserveerde waarde; Ŷ = de -de waarde de we berekenen op bass van een welbepaalde relate; (dt s de geschatte waarde) e = Y Yˆ = de -de fout de we maken Het s wellcht logsch om crtera te nemen de gebaseerd zjn op de gemaakte fouten e 1. Mnmale totale fout Een eerste crterum s gebaseerd op de gemddelde fout: bepaal de parameters van de relate zodang dat de som van de fouten mnmaal s. e Dt crterum s evenwel net adequaat omdat posteve en negateve afwjkngen elkaar kunnen opheffen. Op deze maner kan geen ondersched gemaakt worden tussen relates met grote afwjkngen en relates met klene afwjkngen. 2. M.A.D.-crterum (Mnmal Absolute Devaton) Om het tekenprobleem van het vorge crterum op te heffen, gebruken we n dt crterum absolute waarden en het crterum ludt nu als volgt: bepaal de parameters van de relate zodang dat de som van de absolute afwjkngen e mnmaal s. In de hedendaagse econometre wordt dt crterum meer en meer gebrukt. Vroeger werd dt crterum weng toegepast omdat het rekentechnsch zeer lastg was om de parameters te bepalen. Dt bezwaar s nu echter grotendeels vervallen. In deze cursus zullen wj ons evenwel beperken tot het herna volgende crterum. 18

3. KK- crterum (Klenste Kwadraten Crterum) In de plaats van absolute waarden, kwadrateren we her de fouten. Het klenste kwadraten crterum kunnen we als volgt formuleren: bepaal de parameters van de relate zodang dat de som van de gekwadreerde fouten SSE = e 2 mnmaal s. Enkele redenen om dt crterum te hanteren zjn: - het tekenprobleem wordt opgelost vermt s we kwadrateren; - omdat we de fouten kwadrateren weegt één grote afwjkng zwaarder door dan meerdere klene afwjkngen; - de utwerken van dt crterum s handg en vrj eenvoudg; - deze methode hangt nauw samen met de (n de statstek welbekende) maxmum-lkelhoodmethode. 4. Andere crtera Andere crtera om parameters te schatten n een relate zjn de momentenmethode, de maxmum-lkelhood-methode, de methode van de sem-gemddelden enzovoort. Bj nog andere crtera defneert men de fouten op een andere maner. We gaan her net deper op n. 2.2. DE KK-NORMAALVERGELIJKINGEN 2.2.1. Het eenvoudg lnear model e Waarn bestaat nu de klenste kwadraatoplossng? Als vertrekpunt veronderstellen we een lneare specfcate met twee parameters: Y = a + bx + ε. Als benaderng gebruken we Y ˆ = a + bx. Wanneer we beschkken over n observates dan vnden we voor de verschllende waarnemngen = 1, 2,..., n achtereenvolgens Y = de -de geobserveerde waarde; Y ˆ = a + bx = de -de waarde de we berekenen op bass van een onze relate (dt s de geschatte waarde) e = Y Yˆ = de -de fout de we maken 19

Volgens het K.K.-crterum moeten we de parameters a en b bepalen zodang dat de som van de 2 2 e = ( Y a bx ) kwadraten SSE = mnmaal s. Deze som s afhankeljk van a en b en we kunnen de mnmale waarde van SSE bepalen door de partële afgeleden van SSE te berekenen en aan nul geljk te stellen. We vnden (1) afgelede naar a geljkstellen aan 0 geeft: ( Y a bx ) = 0 2 (2) afgelede naar b geljkstellen aan 0 geeft: ( Y a bx ) X = 0 2 Omdat (1') (2') e = Y a bx tonen formules (1) en (2) dat e = 0 e X = 0 Deze vergeljkngen noemt men de klenste-kwadraten- normaalvergeljkngen. De vergeljkngen (1) of (1') tonen dat voor het model Y ˆ = a + bx de som van de fouten steeds geljk s aan nul. D e grafsche betekens van (2) of (2 ) s dat de vector van de fouten e, e,..., e ) loodrecht staat op de vector X, X,..., X ) ( 1 2 n ( 1 2 n We lossen nu het stelsel (1), (2) op en bepalen de parameters. Ut (1) volgt dat en d us Y a b X Y na b X = = 0 0 of Y a bx = 0. We vnden bjgevo lg dat Y = a + bx of dat (3) a = Y bx Formule (3) nvullen n formule (2) geeft ( Y Y + bx bx ) X = 0 of (4) Y ) X b ( Y ( X X ) X = 0 We gebruken nu de volgende notates: 2 V ( X ) = ( X X ) = ( X X ) X = de varate bnnen de X-waarden r V ( X, Y ) ) ( X X )( Y Y ) = ( Y = Y X = de covarate van X met Y 20

Bemerk dat V ( X ) = V ( X, X ) en bemerk het verband met de steekproefvarante s²(x ) en de steekproefcorrelatecoëffcënt r( X, Y ) : s ²( X ) = V ( X ) / n (of s²( X ) = V ( X ) /( n 1) en r ( X, Y ) = V ( X, Y ) / V ( X ) V ( Y ) Met deze handge notate kunnen we formule (4) herschrjven als volgt: (5) V ( X, Y ) bv ( X ) = 0 Wanneer V ( X ) 0 dan vnden we va (5) dat (6) b = V ( X, Y ) / V ( X ) V ( X, Y ) Invullen n (3) geeft vervolgens a = Y X V ( X ) De parameterwaarden de we vonden, vonden we met de KK-methode. Deze optmale waarden noemen we de klenste-kwadraatschatters (KK-schatters) en noteren we met een dakje. We vnden dus ( 7) bˆ = V ( X, Y) / V ( X ) (8) aˆ = Y bˆ X De resulterende rela te heeft als vergeljkng: (9) Yˆ = aˆ + bˆ X Deze rechte noemen we de klenste-kwadraat rechte (KK-rechte) of de regresse van Y op X. Met de keuze (7), (8) mnmalseerden we SSE. De bjhorende mnmale waarde s geljk aan 2 e = ( ˆ Y a SSE = bˆ X )² Met behulp van (7) en (8) vnden we SSE = ( Y Y bˆ( X 2 X ))² = V ( Y ) + bˆ V ( X ) 2bV ˆ ( X, Y ) en dus V ²( X, Y ) SSE = V ( Y ) V ( X ) Bemerk anderzjds dat V (Yˆ) geljk s aan ˆ ˆ 2 V ²( X, Y ) V ( Yˆ) = V ( aˆ + bx ) = b V ( X ) = V ( X ) 21

We besluten dat SSE = V ( Y ) V ( Yˆ). Omdat (cf. (1 )) e = 0 vnden we nu eveneens SSE = V (e). De vorge relate kunnen we herschrjven als volgt: (10) V (Y ) = V ( Yˆ) + V ( e) De varate n Y s de som van twee delen: de varate n Y s geljk aan de som van de varate van het deel dat we kunnen verklaren met het model en varate van wat we met het model net kunnen verklaren. Opmerkngen. 1. Bemerk dat (8) toont dat de KK-rechte bepaald door (9) het koppel ( X, Y ) bevat. De gemddelden lggen dus steeds op de KK-rechte. 2. Bemerk tevens dat het verband tussen bˆ en de steekproefcorrelatecoëffcënt: b ˆ = r( X, Y ) s( Y ) / s( X ) 3. De varate van varabelen zal van zeer groot belang zjn bj ANOVA (Analyss of varances) Zo zullen we veelvuldg gebruk maken van: - SST = V (Y ) = de varate n de te verklaren varabele = de te verklaren varate; - SSR = V (Yˆ ) = de varate n Y^ va een regresse bekomen = de verklaarde varate; - SSE = V (e) = de varate n de fouten = de onverklaarde varate Bj lneare modellen met een constante term kan men aantonen (cf. (10)) dat SST = SSR + SSE 4. De KK-schatters kunnen we vnden op voorwaarde dat V (X ) verschlt van 0. Aan deze voorwaarde s net voldaan nden de verklarende varabele constant s! Samenvattng Model: Y = a + bx + ε KK-bena derng: Yˆ = aˆ + bˆ X met bˆ = V ( X, Y) / V ( X ) en aˆ = Y bx ˆ Egenschap V ( Y ) = V ( Yˆ) + V ( e) We nemen we nu enkele andere eenvoudge specfcates en bepalen de KK-schatters. 22

2.2.2. Enkele andere specfcates a. Model Y = a + ε Her s Y ˆ = a (constante functe), e = Y a en SSE = (Y a)² SSE te mnmalseren t.o.v. a ledt tot 2 ( a) = 0. We vnden we a ˆ = Y en SSE = V (Y ) b. Model Y = bx + ε Her s Ŷ = bx (rechte door de oorsprong), s e = Y bx en SSE = ( Y bx )² Mnmalseren t.o.v. b ledt tot Y 2 ( Y bx ) X = 0. We vnden b ˆ c. Mode l Y = a + bx + cz + ε (lnear model met constante term) H er s Y ˆ = a bx + cz en e + Y a bx cz e = 0 e X = 0 e Z = 0 X Y = 2 X = en de normaalvergeljkngen zjn: We kunnen de normaalvergeljkngen herschrjven als volgt: (1) Y = a + bx + cz (2) V ( X, Y ) = bv ( X ) + cv ( X, Z ) (3) V ( Z, Y ) = bv ( X, Z ) + cv ( Z ) Dt s een lnear stelsel met 3 vergeljkngen en 3 onbekenden. Ut vergeljkngen (2) en (3) kunnen we de parameters b en c bepalen op voorwaarde dat de determnant van de matrx van het stelsel net geljk s aan 0. Inden dt net het geval s, hebben we te maken met het probleem van de multcollneartet wat verder utgebed aan bod komt. De determnant van de matrx van het stelsel s her geljk aan V ( X ) V ( X, Z) V ( X, Z) V ( Z) = V ( X ) V ( Z) V ²( X, Z) We merken dat de determnant geljk s aan 0 enkel en alleen als V ²( X, Z ) = V ( X ) V ( Z ) en dt geldt enkel en alleen als r ²( X, Z ) = 1. d. Model Y = bx + cz + ε (lnear model zonder constante term) (oefenng) 23

2.2.3. Multvaraat lnear model We bepalen nu de KK-schatters voor het multvaraat lnear model Y = a + b X + b X +... + b X 1 1 2 2 k k + ε In dt geval vnden we Y ˆ = a + b1 X 1 + b2 X 2 +... + b k X k, e = Y Yˆ en de normaalvergeljkngen zjn: e = 0 e X, = 0 1 e X k, = 0 We kunnen de bovenstaande normaalvergeljkngen herschrjven als volgt: (1) Y = a + b X b X b X 1 1 + 2 2 + k k (2) V ( X 1, Y ) = b1v ( X 1) + b2v ( X 1, X 2 ) +... + bkv ( X 1, X k ) (k+1) V X, Y ) = b V ( X, X ) + b V ( X, X ) +... b V ( X ) ( k 1 1 k 2 2 k k k Wanneer de determnant van de matrx van dt stelsel verschlt van 0, kunnen we dt stelsel oplossen en de KK-schatters bepalen. Inden de determnant wel geljk s aan 0 hebben we te maken met het probleem van de multcollneartet, ze verder. 24

2.2.4. KK-methode va EXCEL Het effectef utwerken van het stelsel van de normaalvergeljkngen zullen wj overlaten aan EXCEL. Wj moeten er wel op toezen dat er voldaan s aan de multcollneartetsvoorwaarde. Om de KK-methode ut te werken n EXCEL plaatsen we de data n aaneenslutende kolommen naast elkaar n een leeg excelblad. Als voorbeeld gebruken we de volgende databank: staat Y X1 X2 X3 1 235 508 394,4 325 2 231 564 457,8 323 3 270 322 401,1 328 4 261 846 523,3 305 5 300 871 478 303 6 317 774 588,9 307 7 387 856 566,3 301 8 285 889 575,9 310 9 300 715 489,4 300 10 221 753 501,2 324 11 264 649 490,8 329 12 308 830 575,3 320 13 379 738 543,9 337 14 342 659 463,4 328 15 378 664 492,1 330 16 232 572 486,9 318 17 231 701 467,2 309 18 246 443 478,2 333 19 230 446 429,6 330 20 268 615 482,7 318 21 337 661 505,7 304 22 344 722 554 328 23 330 766 533,1 323 24 261 631 741,5 317 25 214 390 382,8 310 Van enkele staten noteerden we Y X(1) X(2) X(3) = de utgaven aan onderwjs = aantal stadsbewoners per 1000 nwoners = gemddeld nkomen = aantal jongeren per 1000 nwoners We wllen het volgend lnear model utwerken met de KK-methode: Y = a + bx ( 1) + cx (2) + dx (3) + ε 25

Om de KK-methode ut te werken n EXCEL gebruken we de DATA-ANALYSE-tools van EXCEL. Hern kezen we de opte REGRESSION: We vullen het sc herm n als volgt: - nput Y-range: we klkken de data omtrent Y aan, samen met de ttel Y ; - nput X-range: we klkken alle data omtrent de verklarende varabelen aan, samen met de ttels; - bj de opte labels krusen we het blanco verkantje aan; - bj de output optons klkken we op het blanco bolletje bj output range en onmddelljk daarna klkken we op de horzontale wtte balk ernaast. We kezen nu een lege cel op ons excelblad vanaf dewelke de output zal komen; - bj de resduals (dt zjn de gemaakte fouten) krusen we het eerste bolletje lnksboven aan. De overge nputmogeljkheden laten we voorlopg open. Deze komen later utgebred aan bod. 26

Na het aanklkken van OK bekomen we de volgende summary output de bestaat ut ver delen: deel 1: regresson statstcs: Regresson Statstcs Multple R 0,5567 R Square 0,3099 Adjusted R Square 0,2113 Standard Error 47,3376 Observatons 25 In dt deel krjgen we nformate over de kwaltet van het model als geheel. - het aantal observates bedraagt 25; - de multple R s geljk aan de correlatecoëffcënt tussen Y en Yˆ Bj een goed model s het aangenaam te zen dat R = r( Y, Yˆ) groot s. In ons voorbeeld s de R-waarde geljk aan 55%. Voorlopg s nog geen schedsrechter aanwezg om deze waarde te beoordelen. - de R-square = R² s geljk aan het kwadraat van de R-waarde; - de adjusted R square s gerelateerd aan R² en komt n de cursus verder net meer aan bod; - de standard error (ze later) karakterseert het geheel van de fouten de we maken met het model. 27