vrijdag 24 augustus 2007

Wat is een thesaurus eigenlijk?

Die vraag horen we regelmatig op feestjes (en we zijn steeds blij verrast als we iemand tegenkomen die wel weet wat het is).

Bij de veelgestelde vragen op onze website staat: "Een thesaurus is een een lijst met woorden / termen over een bepaald domein, gebaseerd op de natuurlijke taal, met een gestructureerde zoekleiding door middel van relaties tussen deze termen." Een thesaurus is dus een verzameling trefwoorden met daartussen, om het zoeken te vergemakkelijken, relaties. Drie soorten relaties komen in vrijwel alle thesauri voor:
  1. synoniemen. Dit zijn relaties tussen woorden die (ongeveer) hetzelfde betekenen. Zoals bijvoorbeeld syndroom van Down en downsyndroom. In thesaurusjargon is dit de Use-Used for-relatie.
  2. hiƫrarchisch. Dit zijn relaties tussen begrippen waarbij het ene begrip een onderdeel vormt van het andere. Zoals bijvoorbeeld: Nederland en Gelderland. Of zorgberoepen en verpleegkundigen. In thesaurusjargon: BT-NT (broader term-narrower term).
  3. associatief. Deze relatie ligt tussen begrippen die wel met elkaar te maken hebben en waar geen van de andere twee relaties tussen ligt. Bijvoorbeeld: doping en sport. Deze relatie heet de RT (related term).

Soms staat in een thesaurus ook nog een uitleg van een begrip, de SN (scope note). Veel thesauri kennen nog meer relaties, maar die komen minder vaak voor.

Geen opmerkingen: