Woordenboek Internettaal

Martin Bannink (1995)

Gepubliceerd op 11-05-2017

SGML

betekenis & definitie

De afkorting voor 'Standard Generalized Markup Language'. Dit is een manier om teksten inhoudelijk te structureren (in coderingen), zodat je op tal van verschillende manieren iets met die tekst kunt doen.

Het voorgaande klinkt vaag en daarom een voorbeeld, internet, taal bestaat uit circa vijfhonderd trefwoorden met omschrijvingen. Als elk trefwoord voorzien wordt van de code 'dit is een trefwoord', dan kun je bijvoorbeeld met een druk op de knop een trefwoordenlijst genereren zonder alle omschrijvingen. Je kunt ook met deze verkorte trefwoordenlijst alle omschrijvingen laten doorzoeken, om te zien op welke andere plaatsen in de tekst trefwoorden terugkomen, zodat je zonder alles te lezen alle verwijzingen op een rij kunt zetten.

SGML is een taalstructurering, die in opdracht van het Amerikaanse ministerie van Defensie ontwikkeld is. Het Amerikaanse leger kende een onvoorstelbaar aantal handleidingen voor tanks, voor vliegtuigen en ga zo maar door (dit met name voor iedereen die deze apparaten moest onderhouden en repareren). In al die machines zaten wel boutjes en schroefjes die hetzelfde waren en om een juiste hoeveelheid boutjes (voor vliegtuigen, voor tanks enzovoort) per maand te kunnen inkopen, moet je een beetje zicht hebben op de vraag waar die krengen allemaal in zitten. Door de talloze handleidingen allemaal te structureren op dit soort kenmerken werd het eenvoudig om alles op één hoop te gooien en te zien welke boutjes in zowel vliegtuigen als tanks gebruikt werden.

Deze uitleg is gesimplificeerd. In werkelijkheid is er een uitermate verfijnde methode van structurering ontstaan, waar verrassende zaken mee mogelijk zijn geworden. Een ander voorbeeld: als je alle woorden in een woordenboek een reeks van inhoudelijke kenmerken geeft, kun je een even grote reeks van 'subwoordenboeken' maken (met een druk op de knop!). Als alle woorden die van oorsprong Latijns waren als zodanig gemarkeerd zijn, kun je ineens een woordenboek maken van alle Nederlandse woorden met Latijnse herkomst.

Waarom wordt de 'netizen' lastig gevallen met een begrip als SGML? Twee redenen: het is misschien wel het enige dat in de wereld van computers en software succesvol ontwikkeld is volgens de 'top-down' methode, waar zoveel op gespuugd wordt op Internet (zie 'RFC'). Daarnaast is SGML de 'oermoeder' van HTML: de manier waarop bestanden gestructureerd worden op World Wide Web. HTML is een (vereenvoudigde) afgeleide van SGML.