Agrarisch Encyclopedie

Veerman (1954)

Gepubliceerd op 17-11-2021

Statistiek

betekenis & definitie

is kwantitatieve massawaarneming; zij houdt zich bezig met waarneming van de meest uiteenlopende verschijnselen, die zich massaal voordoen en legt de uitkomsten van deze waarneming in cijfers vast. Een statistische massa is een geheel van gelijksoortige, doch variabele eenheden.

Om massa in statistische zin te zijn, dient het geheel der waar te nemen eenheden zo groot te zijn, dat de uitkomsten van de waarneming niet, of althans niet in overwegende mate, door het toeval worden beïnvloed, anders gezegd, dat niet de variabiliteit overweegt t.o.v. de regelmaat. Hoe groter het aantal waarnemingen, hoe groter de kans is, dat de voor het verschijnsel als geheel kenmerkende getalsverhouding voor de dag komt en hoe meer de toevallige afwijkingen tegen elkaar weg zullen vallen (wet der grote getallen). Hoe groot in een concreet geval het aantal waar te nemen eenheden moet zijn om in statistische zin als massa te kunnen gelden, hangt af van de variabiliteit, die het verschijnsel vertoont; hoe groter de variabiliteit van het verschijnsel, hoe groter het aantal waar te nemen eenheden dient te zijn.De werkzaamheden, zoals deze door de statistische bureaus, die men in alle enigszins ontwikkelde landen vindt, worden verricht (z. Centraal Bureau voor de Statistiek) kan men onderscheiden in:

(1) het waarnemen (vaak ten onrechte tellen genoemd) d.m.v. enquêteformulieren; (2) het splitsen van de verkregen gegevens in groepen;

(3) het tellen. De wijze, waarop men de verkregen gegevens splitst, hangt af van het doel van de s. Zo zal men, wanneer men door de betreffende s. een inzicht wil krijgen in de bedrijfsuitkomsten van de landbouwbedrijven van verschillende grootte, de verkregen gegevens splitsen naar bedrijfsgrootteklassen. Het tellen geschiedt bij een statistisch onderzoek van enige omvang thans steeds mechanisch

d.m.v. ponskaarten en Hollerith-machines. De uitkomsten van de telling worden in tabellen neergelegd en in de vorm van deze tabellen, die in absolute aantallen de resultaten van het statistisch onderzoek weergeven, publiceren in de regel de statistische bureaus de verzamelde gegevens.

Bij verder onderzoek op de grondslag van deze gegevens bestaat in de regel de behoefte aan een gemakkelijker overzicht en een betere mogelijkheid voor onderlinge vergelijking van beschikbare cijfers en daarom gaat men veelal over tot het berekenen van gemiddelden (rekenkundig of arithmetisch gemiddelde, mediaan, modus, enz.) of verhoudingsgetallen (percentages, dichtheden, indexcijfers, enz.). Een belangrijk middel om statistische gegevens in overzichtelijker vorm voor te stellen, is de grafische voorstelling. Voor het weergeven van de onderlinge verhouding tussen gelijksoortige, doch overigens zelfstandige grootheden (b.v. de tarweproductie per ha in de verschillende Eur. landen) wordt veelal gebruik gemaakt van staafdiagrammen, naast elkaar geplaatste staven, waarbij de lengte van de staven de grootheid van het verschijnsel weergeeft. Voor het weergeven van de verhouding van een deel van een massa tot de gehele massa wordt veelal gebruik gemaakt van vlakdiagrammen, waarbij een bepaalde meetkundige figuur (b.v. een cirkel) het geheel van de massa voorstelt en de figuur dan zodanig wordt verdeeld (b.v. de cirkel in sectoren), dat de verhouding van de delen van de figuur overeenkomt met de verhouding van de delen van de massa. Op deze wijze kan men b.v. de verhouding van het aantal werkzamen in de verschillende beroepsgroepen tot de totale beroepsbevolking uitdrukken.

Voor het weergeven van de verhouding tussen 2 verschillende grootheden (b.v. opbrengst van een gewas en kunstmestgift, geboortefrequentie en de tijd) waarbij één der grootheden zodanig varieert, dat een continue reeks van waarnemingen ontstaat, zijn het spreidingsdiagram en het lijndiagram of de curve de aangewezen voorstellingsvormen. De curve wordt gebruikt, wanneer bij een bepaalde grootte van de variabele (deze wordt meestal afgezet op de X-as) in principe slechts één waarde van de Y behoort, of, indien verschillende waarden van de Y voorkomen, deze door een gemiddelde kunnen worden voorgesteld. In dat geval kan men de punten, welke de waarden van de Y bij toenemende of afnemende waarden van de X voorstellen, door een lijn verbinden en ontstaat de curve, die dus een bepaald verloop aangeeft. Kunnen bij een bepaalde waarde van de variabele X in principe meer waarden van de Y behoren, dan dient elke waarde in het diagram door een punt te worden voorgesteld en kunnen de punten onderling niet worden verbonden. Dan ontstaat het spreidingsdiagram. Voor het weergeven van de geografische spreiding van statistisch waargenomen verschijnselen wordt meer en meer het cartogram, een grafische voorstelling in kaartvorm, gebruikt.

Wil men in een cartogram absolute aantallen aanduiden, dan geschiedt dit meestal door op de plaats of in het gebied, waar het verschijnsel zich voordoet, figuren te tekenen (cirkels, punten, ete.), die de kwantiteit van het waargenomen verschijnsel aanduiden. Bij het weergeven van verhoudingscijfers (dichtheden, percentages, enz.) maakt men meestal gebruik van arceringen en kleuren, die een toenemende intensiteit vertonen, naarmate het verschijnsel zich in het betreffende gebied in sterkere mate voordoet. Een populaire vorm van grafische voorstelling is de beeldstatistiek, waarbij men door gestyleerde, veelal felgekleurde figuurtjes (z.g. isotypen), die een bepaalde kwantiteit van het betreffende verschijnsel aangeven (b.v. een gestyleerd geldzakje een kapitaal van 1 mill. gulden), statistische grootheden globaal en overzichtelijk aanduidt.

Van groot wetenschappelijk belang is het statistisch correlatieonderzoek. Onder correlatie verstaat men de samenhang tussen 2 of meer statistische reeksen. Wanneer een tweetal statistische reeksen een zelfde verloop vertonen (b.v. de ontwikkeling van de conjunctuur en de migratie van liet platteland naar de steden) dan wijst dit er op, dat tussen beide verschijnselen een bepaalde relatie bestaat. Op deze wijze kan het statistisch onderzoek ons op het spoor brengen van het verband tussen de verschijnselen onderling en daarmee ons wetenschappelijk inzicht vergroten. Vaak kan men zonder nader onderzoek, in het bijzonder wanneer de verschijnselen grafisch worden voorgesteld, wel vaststellen of een zekere mate van correlatie aanwezig is. Wil men de mate van correlatie nauwkeurig vaststellen, dan dient men de correlatiecoëfficiënt te berekenen, een cijfer dat de mate van samengaan tussen een tweetal reeksen aangeeft.

Wanneer het verloop van de betreffende reeksen volkomen hetzelfde Ls, is de correlatie-coëfficient 1, wanneer het verloop geen enkele overeenstemming vertoont 0. Het laatste zal zich zelden voordoen, daar vrijwel altijd wel enige toevallige overeenstemming bestaat. Meestal neemt men dan ook aan, dat aan een correlatie-coëfficient lager dan 0,30 geen betekenis mag worden toegekend. Opgemerkt dient te worden, dat een gelijk verloop van 2 of meer reeksen, dus een samengaan, niet altijd een samenhang, dus een logisch verband tussen de betreffende verschijnselen behoeft te betekenen. Wil een samengaan van statistische reeksen een werkelijke correlatie inhouden, dan moet het bestaan van een bepaald verband tussen de betreffende verschijnselen logisch aantoonbaar zijn (vgl. Landbouwstatistiek).

E. ABMA.