Winkler Prins Encyclopedie

E. de Bruyne, G.B.J. Hiltermann en H.R. Hoetink (1947)

Gepubliceerd op 28-12-2022

CORRELATIEREKENING

betekenis & definitie

noemt men in de waarschijnlijkheidsrekening de wiskundige me-

thode om de meerdere of mindere afhankelijkheid van twee of meer veranderlijke waarnemingsgrootheden te onderzoeken. Deze afhankelijkheid of correlatie (ook wel stochastisch verband genoemd) onderscheidt zich van de oorzakelijke of causale afhankelijkheid, doordien de waarde van een van de grootheden door die van de andere niet volkomen bepaald wordt, doch enkel de waarschijnlijkheid wordt beïnvloed, waarmede die grootheid verschillende waarden kan aannemen, m.a.w.: de verdelingswet van een van de grootheden is van de waarde van de andere grootheden afhankelijk. In sommige gevallen staat deze soort afhankelijkheid van tevoren vast (zo is bijv. het totale aantal ogen, met twee dobbelstenen geworpen, stochastisch verbonden aan het aantal, dat reeds met één van de stenen zou zijn geworpen), terwijl in andere gevallen de correlatierekening juist ten doel heeft, die afhankelijkheid uit de uitkomsten der waarneming af te leiden, waarbij evenwel in aanmerking genomen moet worden, dat de correlatierekening ook in dit opzicht nimmer zekerheid kan verschaffen, doch enkel de meerdere of mindere waarschijnlijkheid van het bestaan van een stochastisch verband kan aantonen.

De voornaamste hulpmiddelen, waarmede in de correlatierekening het stochastisch verband wordt uitgedrukt, zijn de correlatievergelijking en de correlatiecoëfficiënt. De correlatievergelijking (ook wel regressievergelijking genoemd) is (voor twee, stochastisch verbonden grootheden X en Y) een betrekking, die uitdrukt, wat de waarschijnlijke waarde van X is, als Y een bepaalde waarde Yj aanneemt, of wel de (van de eerste verschillende) betrekking, die uitdrukt, wat de waarschijnlijke waarde van Y is voor X = X;, terwijl de correlatiecoëfficiënt r een op een bepaalde wijze berekend getal is, dat de meerdere of mindere vastheid van het stochastisch verband aangeeft, d.i. de meerdere of mindere waarschijnlijkheid, dat de uitkomsten van latere waarnemingen omtrent X en Y min of meer van de correlatievergelijking zullen afwijken. Ten aanzien van de regressievergelijking valt nog op te merken, dat deze steeds in eerste benadering als een lineaire vergelijking kan worden beschouwd, in welk geval men van lineaire regressie spreekt. Meer nauwkeurige waarnemingen geven echter in de regel aanleiding tot het opstellen van niet-algebraïsche of althans niet-lineaire regressievergelijkingen. In deze gevallen voert ook de toepassing van de gebruikelijke correlatiecoëfficiënten tot onjuiste gevolgtrekkingen, een euvel, waartegen het Institut International de Statistique herhaaldelijk is opgekomen.

Van de verschillende uitdrukkingen voor de correlatiecoëfficiënt is een van de eenvoudigste r = 𝜇 (σxσy) waarin σx en σv de verstrooiingscoëfficiënten van X en Y ieder afzonderlijk aanduiden en /< de waarschijnlijke waarde is van het product van de afwijkingen van X of Y van hun eigen waarschijnlijke waarde.

Een geheel andere werkwijze bestaat hierin, dat men niet de waarde zelf van de grootheden X en Y, maar haar rangnummers (als beide naar opklimmende waarden gerangschikt zijn) in de berekening opneemt. De Engelse onderzoeker Spearman heeft voor dit onderzoek naar de meerdere of mindere overeenstemming in rangorde (rangcorrelatie genoemd in onderscheiding van de bovenomschrevene of absolute correlatie) een coëfficiënt ingevoerd.

De correlatierekening wordt in steeds toenemende mate op de biologische, psychologische, medische, economische en andere verschijnselen toegepast, waarbij gebleken is, dat de zonder berekening tot stand gekomen gissingen (zelfs van bij uitstek deskundigen) omtrent het uit enig statistisch materiaal voortvloeiend verband tussen verschillende grootheden vaak in belangrijke mate van de door de correlatierekening verkregen uitkomsten afwijken.

GESCHIEDENIS

Als grondlegger van de correlatierekening geldt de Engelse anthropoloog F. Galton (1822-1911), die in 1888 een volledige leerwijze van de correlatierekening ontwierp; deze rekenwijze werd vooral door K. Pearson, hoogleraar te Londen, en G. U.

Yale, hoogleraar te Cambridge, aangevuld en door de Russische wiskundige Tsjoeprow tot een logisch en systematisch geheel vervolledigd.

PROF. G. MANNOURY

Lit.: F. Galton, Correlations and their measurements (1888); A. A. Tschuprow, Grundbegriffe und Grundprobleme der Correlationstheorie (Leipzig 1925); F.

Baur, Korrelationsrechnung (Leipzig 1928), een elementaire inleiding; J. B. D. Derksen, Inleiding tot de Correlatierekening (Haarlem 1935); J.

Tinbergen, Grondproblemen der theoretische statistiek (Haarlem 1936); Tj. Koopmans, Linear regression analysis of economic time series (Haarlem 1936).

< >