Technische encyclopedie

Winkler Prins (1975)

Gepubliceerd op 23-01-2025

ECONOMETRIE

betekenis & definitie

(Fr.: économétrie; Du.: Ökonometrie; Eng.: econometrics), term die wordt gebruikt in twee betekenissen. De econometrie in ruimere zin omvat de wiskundige economie, de econometrie in engere zin, en de mathematische besliskunde of operationele analyse; zij houdt zich bezig met economische theorie in haar relatie tot statistiek en wiskunde. In deze betekenis wordt de term ook in Nederland gebruikt in het Academisch Statuut bij de regeling van de studierichting der econometrie.

De econometrie in engere zin houdt zich bezig met het confronteren van wiskundig geformuleerde economische theorieën met statistisch waarnemingsmateriaal. De hiervoor benodigde statistische schattingsmethoden en toetsen zijn voor een belangrijk deel speciaal ontworpen met het oog op de econometrische toepassing. Dit is het terrein van de statistische methoden der econometrie; daarnaast kent men de toegepaste of empirische econometrie. Om een meer concrete indruk te geven, wordt allereerst een drietal eenvoudige voorbeelden uit de empirische econometrie behandeld.

Engelcurven beschrijven de relaties tussen de inkomens van gezinnen en hun consumptieve uitgaven. De eerste studie op dit gebied werd ondernomen door de Duitser Ernst Engel in 1857. Een van zijn conclusies (wet van Engel) luidde: wanneer het inkomen stijgt, stijgen de uitgaven aan levensmiddelen eveneens, maar dalen procentueel. De statistische gegevens die worden gebruikt zijn meestal doorsneegegevens (cross-section data), d.w.z. dat zij betrekking hebben op een doorsnede van de economie op een bepaald tijdstip. In het hier gegeven, aan J.S. Cramer (1969) ontleende voorbeeld hebben ze betrekking op uitgaven van 173 Duitse gezinnen in de periode oktober/november 1962; de gezinnen bestonden uit een echtpaar met twee kinderen, het gezinshoofd was in loondienst werkzaam, zijn vrouw werkte niet. Over de meest geschikte wiskundige vorm voor een engelcurve bestaat geen eenstemmigheid. Veel gebruikt wordt de zgn. iso-elastische of dubbellogaritmische functie:

log Cjh = ⍺j + βj log Xh + Ujh

Het symbool Cjh staat voor de gekochte hoeveelheid van of de consumptieve uitgaven aan goed j door gezin h, Xh voor het inkomen van gezin h en Ujh voor een afwijking van de kromme die wordt toegeschreven aan de specifieke voorkeuren van het gezin en aan andere toevallige, van het inkomen onafhankelijke omstandigheden. Deze afwijking, meestal storing genoemd, wordt behandeld als een kansvariabele (vanwaar de onderstreping van de symbolen U en C). De parameter ⍺j is onmisbaar in het model maar niet interessant voor de onderzoeker. Daarom wordt hij in verslagen over empirisch onderzoek veelal weggelaten.

De parameter βj staat bekend als de inkomenselasticiteit van goed j (in dit geval constant).

Een meer algemene definitie van de inkomenselasticiteit is:

(∂ log Cjₕ)/(∂ log Xₕ) = (∂Cjₕ)/(∂Xₕ) (Xjₕ)/(Cjₕ)

Een voordeel van deze definitie boven de eenvoudige partiële afgeleide ∂C/∂X is dat de elasticiteit onafhankelijk is van de eenheden waarin de variabelen gemeten worden. Hierdoor wordt internationale en ook intertemporele vergelijking (de waarde van het geld is immers niet constant) aanzienlijk vereenvoudigd. Om die reden genieten elasticiteiten niet alleen bij de beschrijving van engelcurven, maar ook bij die van andere economische relaties een aanzienlijke populariteit. Men dient zich wel te realiseren dat een elasticiteit een grootheid is die het gedrag van een bepaalde groep in een bepaalde periode beschrijft.

Elasticiteiten (en ook andere economische parameters) zijn geen natuurconstanten. Een inkomenselasticiteit, zoals hiervoor gedefinieerd, is te interpreteren als de procentuele toename in de uitgaven aan goed j wanneer het inkomen met 1% toeneemt. Goederen met een inkomenselasticiteit groter dan 1 noemt men luxe goederen, die met een inkomenselasticiteit kleiner dan 1 noodzakelijke goederen; ingeval de inkomenselasticiteit negatief is spreekt men van inferieure goederen. De parameters worden geschat met behulp van regressieanalyse. De gekwadrateerde correlatiecoëfficiënten behorende bij de regressies in de tabel zijn alle kleiner dan 0,12, hetgeen er op wijst dat er aanzienlijke individuele variatie bestaat rond de geschatte krommen.

Consumptiefuncties.

Het voorgaande voorbeeld speelde zich af op het gebied van de micro-economie. Beschouwd wordt nu een onderdeel van de macro-economie: de totale consumptieve uitgaven (dus van alle gezinnen aan alle goederen) als functie van het totale beschikbare inkomen. Men schat de macroconsumptiefunctie met behulp van tijdreeksen ontleend aan de nationale rekeningen. De afzonderlijke waarnemingen corresponderen hier dus met jaren of kwartalen.

Een consumptiefunctie is een belangrijk onderdeel in een macromodel, een stelsel vergelijkingen dat de onderlinge afhankelijkheden tussen de belangrijkste economische grootheden in een land beschrijft. Dergelijke modellen spelen een belangrijke rol bij het voorbereiden van maatregelen om werkloosheid tegen te gaan of groei te bevorderen.

Een eenvoudig voorbeeld van een consumptiefunctie is ontleend aan M.K. Evans (1969). Het symbool C staat hier voor consumptie: totale aankopen van consumptiegoederen en -diensten gemeten in 109 constante dollars (gecorrigeerd voor waardeverandering) per jaar. Met Y wordt bedoeld het totale persoonlijke beschikbare inkomen in 109 constante dollars per jaar. De waarnemingen hebben betrekking op de Verenigde Staten (periode 1929...1962, met uitzondering van 1942...1945). Met de methode der kleinste kwadraten komt men tot de geschatte relatie:

Ct = −4,93 + 0,559 Yt + 0,445 Ct−1 + Ut

(0,065) (0,070)

(tussen haakjes de standaardfouten); U is opnieuw de storingsterm; met t wordt het waarnemingsjaar aangeduid; de kansvariabelen zijn niet onderstreept. De methode der kleinste kwadraten geeft in dit geval vertekende schattingen. Het beschikbaar inkomen Y wordt nl. verdiend door produkten (waaronder consumptiegoederen) te verkopen. Zeer eenvoudig voorgesteld: het geld dat de consumenten deze maand verdienen, geven zij volgende maand uit; over twee maanden kunnen de bedrijven het weer gebruiken om salarissen te betalen. Als men over maandcijfers zou kunnen beschikken waren er geen moeilijkheden, omdat Yt−1 dan geschreven zou kunnen worden op de plaats waar nu Yt staat. Bij het gebruik van jaarcijfers zou dat echter een slechte benadering zijn.

Een storing Ut beïnvloedt Ct via deze consumptiefunctie en indirect (via de hier niet beschreven produktiekant van de economie) ook Yt. Daarom is het niet aan te nemen dat Yt en Ut onafhankelijke kansvariabelen zijn. Als gevolg daarvan geeft de methode der kleinste kwadraten systematisch vertekende schattingen. Ter vermijding van deze simultaneous-equations bias heeft men een aantal andere schattingsmethoden ontworpen, zoals kleinste kwadraten in twee ronden (two-stage least-squares, 2SLS), en maximale aannemelijkheid op basis van volledige informatie (full-information maximum-likelihood, FIML). Gebruik van FIML leverde de schattingen:

Ct = −3,41 + 0,352 Yt + 0,663 Ct−1 + Ut

(0,074) (0,088)

Deze zijn opmerkelijk verschillend, althans wat betreft de directe effecten. Voor de effecten op lange termijn analyseert men deze consumptiefunctie als volgt. Men isoleert deze vergelijking van de rest van de economie en men veronderstelt dat Yt gedurende een voldoende groot aantal jaren constant is en dat de storingen alle nul zijn. Dan convergeert Ct naar een limiet (de coëfficiënt van Ct−1 is in beide gevallen in absolute waarde kleiner dan 1). In de limiet geldt

Ct = Ct−1 .

Men kan deze limiet dus gemakkelijk berekenen door Ct en Ct−1 aan elkaar gelijk te stellen. De hieruit resulterende oplossing luidt voor het eerstgenoemde geval (gewoon kleinste kwadraten):

C = −8,88 + 1,007 Y

en voor het tweede geval (FIML):

C = −10,12 + 1,045 Y

Met name de schattingen van de coëfficiënt van Y (de marginale consumptiequote, marginal propensity to consume, MPC) verschillen voor deze lange-termijnanalyse niet noemenswaard.

In grote modellen splitst men de totale consumptie vaak op in een aantal componenten, zoals levensmiddelen, overige niet-duurzame goederen en diensten, huren, en overige duurzame goederen. Tevens brengt men verfijningen aan door andere verklarende variabelen toe te voegen.

Produktiefuncties.

Teneinde de substitutiemogelijkheden tussen meer arbeidsintensieve en meer kapitaalintensieve produktietechnieken te beschrijven maakt men vaak gebruik van produktiefuncties van de volgende vorm:

V = γ [δKq + (1 − δ)Lq] v/q

Hierin is V de toegevoegde waarde (hoeveelheid produkt gewaardeerd tegen marktprijzen minus BTW en kosten aan grondstoffen, hulpstoffen enz.), K de door kapitaalgoederen geleverde diensten (bijv. machine-uren) en L de hoeveelheid arbeid (bijv. manuren). Teneinde dimensieproblemen te vermijden meet men K en L meestal als indexcijfers. De kromme die ontstaat door K en L te laten variëren bij gegeven V, wordt isoquant genoemd. De kromming ervan wordt als regel gemeten door de substitutie-elasticiteit, gedefinieerd als:

σ = (d log (K/L))/(d log(−∂K/∂L))

In het geval van de bovenstaande produktiefunctie geldt σ = 1/(1 + ϱ). De substitutie-elasticiteit is dus constant; daarom spreekt men van een CES -(constant elasticity of substitution)-produktiefunctie.

Bekend is het limietgeval dat ontstaat wanneer ϱ naar nul gaat. De CES-functie gaat dan over in de zgn. cobb-douglas-produktiefunctie:

V = γKLv(1−δ)

met substitutie-elasticiteit 1. Onder bepaalde veronderstellingen omtrent marktstructuren en ondernemersgedrag kan men uit de CES-produktiefunctie met v = 1 de volgende relatie tussen arbeidsproduktiviteit (V/L) en reëel loon (w/p, w = loonvoet, p = prijsindex voor verkoopprijzen) afleiden:

log V/L = a + σ log w/p

Arrow e.a. (1961) schatten op basis hiervan σ voor bedrijfstakken op grond van internationale gegevens over 19 landen variërend van de Verenigde Staten tot Irak. De meest opvallende schattingen (met standaardfouten) van σ werden verkregen voor de volgende bedrijfstakken:

zuivelprodukten - 0,721 (0,073)

spinnerijen en weverijen - 0,809 (0,068)

tricotage-industrie - 0,785 (0,064)

meubelen - 0,894 (0,042)

ijzer en staal - 0,811 (0,051)

Simultane modellen.

Econometrische relaties bevatten vaak meer variabelen dan in het bovenstaande zijn gebruikt. Markten worden vaak beschreven met aparte vergelijkingen voor de vraagzijde en de aanbodzijde. Modellen die het macro-economisch gebeuren in een land beschrijven tellen al gauw 40...60 vergelijkingen.

Exogene en endogene variabelen.

Exogene variabelen zijn variabelen die buiten het model worden bepaald, bijv. het aantal vorstdagen in een model voor de bouwmarkt. Endogene variabelen worden verondersteld bepaald te worden door mechanismen binnen het model.

Vraag- en aanbodmodellen.

De economische theorie beschrijft marktevenwichten als snijpunten van vraag- en aanbodkrommen. Stel dat de aanbieders van een landbouwprodukt zich gedragen volgens de relatie:

q = ⍺ + βp + γw + u (1)

waarin q de hoeveelheid, p de prijs, w de index voor weersomstandigheden en u de storing. De vragers worden verondersteld zich te gedragen volgens:

q = δ + εp + u (ε < 0) (2)

Waarneembaar zijn de snijpunten waar geldt:

p = κ0 + κw + η (3)

q = λ0 + λw + 𝜗 (4)

κ0 = μ(δ − ⍺), κ = −μγ,

η = μ(vu) (5)

λ0 = μ(βδε⍺), λ = −μεγ,

𝜗 = μ(βvεu) (6)

μ = 1/(βε) (7)

Structurele vorm en herleide vorm van een model.

Men noemt (1) en (2) structuurvergelijkingen (ze beschrijven de structuur van de markt), (3) en (4) herleide-vormvergelijkingen; ze drukken de endogene variabelen (hier p en q) uit in de exogene (hier w) en de storingen.

Schattingsproblemen.

Uit (3) en (5) volgt dat p afhankelijk is van u en v. Daarom levert toepassing van de methode der kleinste kwadraten op (1) geen ‘rake schatters’ op. Wel kan men κ0, κ, λ0 en λ schatten met behulp van regressieanalyse op (3) en (4). Onder de klassieke veronderstellingen op de storingen zijn deze asymptotisch raak (consistent).

Identificatie.

Wanneer men de herleidevormparameters kent (dan wel geschat heeft), kan men daaruit (schattingen voor) ε en δ afleiden, als volgt: ε = λ/κ, δ = λ0εκ0. Daarentegen zijn ⍺, β en γ niet uit (5), (6) en (7) op te lossen. In het voorgaande geval zeggen we dat de vraagrelatie identificeerbaar is, maar de aanbodrelatie niet. Over de vraagrelatie is er meer informatie omdat (op theoretische gronden) wordt aangenomen dat de variabele w erin voorkomt met coëfficiënt nul.

Men kan zeggen dat structuurparameters (zoals ⍺, β, γ, δ, ε) identificeerbaar zijn als ze kunnen worden opgelost, gegeven de herleide-vormparameters (zoals κ0, κ, λ0, λ) en de restricties op de structuurparameters (de nul van w in (2)).

Overigens worden vraag- en aanbodmodellen in de praktijk meestal op andere wijzen geschat.

Macromodellen.

Macromodellen voor Nederland worden vooral geconstrueerd op het Centraal Planbureau. Bekende modellen zijn het jaarmodel voor de korte termijn (Verdoorn c.s.), het jaarmodel voor de middellange termijn (Van den Beld) en het kwartaalmodel (Driehuis). In België worden dergelijke macromodellen eveneens door het Planbureau geconstrueerd (bijv. het RENA-model).

Voorspellen en simuleren.

Macromodellen worden gebruikt om toekomstige ontwikkelingen te voorspellen (bij ongewijzigd beleid) en om de consequenties van beleidsombuigingen door te rekenen. Bij gebrek aan goed gespecificeerde doelstellingsfuncties verkeert het optimeren nog steeds in de theoretische fase.

Statistische methoden.

Gewone regressieanalyse met de methode der kleinste kwadraten is in de econometrie nog steeds de meest gebruikte schattingstechniek. Zoals reeds vermeld is zijn er tegen deze methode bezwaren in het geval van stelsels simultane vergelijkingen. Om deze bezwaren te ondervangen zijn verscheidene andere schattingsmethoden ontworpen. Deze vallen uiteen in twee groepen, al naar gelang ze gebruik maken van beperkte informatie (limited information, LI) of van volledige informatie (full-information, FI). De LI-methoden concentreren zich op één enkele vergelijking van het stelsel, terwijl de FI-methoden het stelsel als een geheel beschouwen. De LI-methoden zijn rekentechnisch veel eenvoudiger. De FI-methoden zijn doeltreffender omdat ze meer informatie gebruiken. Binnen elk van beide groepen kan men schatters construeren volgens alle bekende statistische principes zoals van de kleinste kwadraten, van maximale aannemelijkheid, van de kleinste variantieverhouding, de kleinste afstand, of van Bayes. Bovendien bestaan er nog de k-klasse en de dekpuntmethoden (fixed-point methods) die meer ad hoc ontworpen zijn. De voor- en nadelen van de diverse methoden zijn bestudeerd met behulp van de asymptotische theorie (voor grote steekproeven) en Monte-Carlomethoden (voor kleine steekproeven).

Vertragingen.

Naast de simultane vergelijkingen is ook veel aandacht besteed aan verschillende soorten vertraagde reacties. Ondernemers zullen niet allemaal onmiddellijk op een stijging in de afzet (X) reageren door nieuwe machines te bestellen. Bovendien zullen de levertijden uiteenlopen. Een (sterk vereenvoudigde) investeringsfunctie zou dan ook de volgende vorm kunnen hebben:

It = ⍺(β0Xt + β1Xt−1 + β2Xt−2 + ... + βkXtk) + ut

De coëfficiënten β0, ..., βk kiest men vaak zo dat ze samen 1 zijn. Wegens de gelijkenis met een kansverdeling spreekt men van een vertragingsverdeling (lag distribution). Het bezwaar van de voorgaande formule is dat er (voor k groter dan 2 of 3) al gauw schattingsmoeilijkheden ontstaan ten gevolge van multicollineariteit (het verschijnsel dat de variabelen Xt, X t−1, ..., Xtk onderling betrekkelijk sterk gecorreleerd zijn). Daarom pleegt men restricties op te leggen aan de coëfficiënten β0, ..., βk. Een zeer eenvoudige en bekende is afkomstig van de Nederlander Koyck. Hij veronderstelde βi = (1 − γ)γi voor k → ∞. Men kan dan de voorgaande vergelijking eenvoudig als volgt transformeren:

It γIt−1 = ⍺(1 − γ)Xt + utγut−1

Meer ingewikkelde vertragingsverdelingen zijn de pascalverdeling, de binomiale verdeling, de almonverdeling en de meer algemene klasse van rationale verdelingen. Andere methoden en problemen die men in de econometrie ontmoet zijn niet-lineaire relaties, meetfouten in de verklarende variabelen, robuuste en verdelingsvrije methoden, componentenanalyse, factoranalyse, spectraalanalyse, en voorts modellen met stochastische coëfficiënten en informatiemaatstaven.

< >