Danny Greefhorst

Director at ArchiXL

Gepubliceerd op 19-06-2017

Herleidbaarheid

betekenis & definitie

De mate waarin de herkomst, selecties en bewerkingen die hebben plaatsgevonden op de gegevens expliciet zijn vastgelegd. (specialisatie van traceerbaarheid)

Dit gaat over de mate waarin bij de gegevens zelf inzichtelijk is waar ze vandaan komen, wanneer en hoe ze tot stand zijn gekomen. Het wordt ook wel “data provenance” of “data lineage” genoemd. Het vraagt het aanleggen van een “audit trail” over de totstandkoming van gegevens. Een dergelijk audit trail is onderdeel van de gegevens zelf, in tegenstelling tot een “standaard” audit trail bij een gegevensverzameling die meer vanuit audit perspectief wordt aangelegd. Herleidbaarheid is in meer algemene zin gericht op het beschikbaar stellen van informatie over de totstandkoming van gegevens. Denk bijvoorbeeld aan het kunnen reproduceren van gegevens op basis van originele invoergegevens of het inzichtelijk maken wat de brongegevens zijn die ten grondslag liggen aan gegevens. Dat is met name relevant daar waar transformaties van gegevens plaats vinden. Het belang van herleidbaarheid is hoger als gegevens afkomstig zijn van externe bronnen; van gegevens uit je eigen organisatie is meestal vrij goed bekend waar ze vandaan komen en hoe ze tot stand zijn gekomen. Het gewenste detailniveau van herleidbaarheid kan per situatie verschillen; in sommige gevallen kan het voldoende zijn om gegevens te kunnen herleiden naar bronbestanden, terwijl in andere situaties herleidbaarheid naar individuele attribuutwaarden relevant kan zijn. Er is ook een best practice op het gebied van data provenance beschikbaar vanuit W3C (zie: https://www.w3.org/TR/dwbp/#provenance).