(Eng. likelihood), verwant met - maar niet te vereenzelvigen met - waarschijnlijkheid. R.A.
FISHER heeft het begrip a. likelihood ingevoerd ter onderscheiding van het begrip ‘probability’ ( waarschijnlijkheid), omdat deze begrippen op verschillende logische grondslagen rusten. De betekenis van het begrip a. kan wellicht het best duidelijk gemaakt worden aan de hand van een voorbeeld. Werpt men éénmaal met een geldstuk, dan hangt het van de inwendige structuur van dat geldstuk af, met welke kans (θ) kruis boven komt (bij een ‘onvervalst’ geldstuk is θ - ½). We beschouwen nu een ‘proef’ bestaande uit 10 worpen. Wc kunnen dan hetzij 0 maal, hetzij 1 maal, ..., hetzij 10 maal ‘kruis’ verwachten. Deze uitslagen zijn echter niet even waarschijnlijk. Zo is de kans op 3 maal ‘kruis’p3 = (10 x 9 x 8) : (1 x 2 x 3) θ3(1 —θ)10-3 (z. Binomialc verdeling). p3 is blijkbaar een functie van θ, zeg ȹ3(θ) (i.h.a. zij ȹk (θ) de kans op k maal ‘kruis’).
Voert men de uit 10 worpen bestaande proef N maal uit, en krijgt men in F0 gevallen de uitslag 0 maal ‘kruis’, in F0 gevallen de uitslag 1 maal ‘kruis’, ….., in F10 gevallen de uitslag 10 maal ‘kruis’, (zodat F0 + F1 + .. — F10 = N, dan is de kans op deze frequentieverdeling [F0, F1, . ., F10] : W(θ) = C {ȹ0(θ)}F1 . ϑ {ȹ10(θ)}F10. {ȹl0(θ)}F10 . De
factor C geeft aan op hoeveel manieren men N kan verdelen in groepen van F0, F1,, . . . F10 stuks. Met gebruikmaking van de afkorting 1 X 2 X N = N! enz. vindt men voor C: C = N! : (F0! F1! . . . . F10!) . C is blijkbaar niet afhankelijk van θ. Als, gelijk in de meeste gevallen, θ niet van te voren bekend is, moet men verschillende waarden van θ (tussen 0 en 1) mogelijk achten; deze zullen ieder hun eigen kansdichtheid χ (θ) hebben. De differentiaalkans van θ is dan χ (θ) dθ, en de differentiaalkans op het gecombineerde verschijnsel: 1ᵒ een bepaalde waarde van θ (met speelruimte dθ), 2° de frequentieverdeling [F0, F1, .., F1()] met deze θ, is dan dᘯ = χ(θ) dθ.W(θ), met kansdichtheid Φ(θ) = dᘯ : dθ = χ(θ). W(θ). Indien men ervan overtuigd is, dat er slechts van één waarde van 0 sprake kan zijn, en dat andere waarden van θ in het geheel geen kans hebben, vervalt de betekenis van de functie χ(θ).
Wil men nu uit de waargenomen frequentieverdeling [F0, F1, . . ., FI0] tot een schatting van de ‘ware’ θ komen, dan ligt het voor de hand die waarde van θ als de waarschijnlijkste te beschouwen, die de werkelijk waargenomen frequentieverdeling [F0, F1, . . ., FI0] a priori zo waarschijnlijk mogelijk maakt, die m.a.w. ᘯ (θ) maximum maakt. Daar nu de functie χ(θ) of in ’t geheel geen zin heeft, of (doorgaans) een onbekende bouw heeft, postuleert R.A. FISHER, dat die waarde van θ de voorkeur verdient, die de (eventueel als voorwaardelijke kans optredende) factor W(θ) maximum maakt. Deze factor W(θ) wordt door R.A. FISHER ‘likelihood’ genoemd. De meest aannemelijke keuze (maximum likelihood) volgt dan uit dW : dθ = 0 (z.
Maximum). De berekening
wordt meestal vereenvoudigd door, in de plaats van de functie W(θ) zelf, haar logarithme (L log W) te nemen. Als W maximum is, is ook L maximum. De meest aannemelijke keuze wordt dan verkregen uit de vergelijking dL : dθ = 0. In het
beschouwde geval van 10 worpen met een geldstuk is de meest aannemelijke schatting voor θ:
Volgens R.A. FISHER is de meest aannemelijke schatting steeds doeltreffend (efficiënt). M. J. VAN UVEN.