MoM | Thesaurus linguae Latinae

4 januari 2021

De Thesaurus linguae Latinae is een wetenschappelijk woordenboek van het Latijn. Nu zou je kunnen denken: er bestaan toch al woordenboeken Latijn? Inderdaad, het meest bekend is voor Nederlanders het woordenboek van Pinkster, voor Engelsen de Oxford Latin Dictionary, en zo heeft elk taalgebied wel zijn Latijnwoordenboek.

Nu is er een aantal problemen met deze woordenboeken. Ten eerste zijn ze gemaakt op basis van maar een beperkt aantal teksten, meestal bestaand uit werken van  “grote” auteurs als Cicero, Caesar, Vergilius, Ovidius. Ten tweede bouwen ze meestal op elkaar op: zo is Pinkster oorspronkelijk een bewerking van het Duitse woordenboek van Pons, dat weer een bewerking is van Taschen-Heinichen. Op deze manier krijgen we steeds dezelfde lemmata met dezelfde betekenissen, en soms zelfs dezelfde fouten.

Een écht woordenboek

Wetenschappers hadden al eind negentiende eeuw de behoefte aan een nieuw, goed woordenboek, waarin echt alle woorden staan die ooit zijn voorgekomen, om echt alle teksten goed te kunnen begrijpen. Het probleem is namelijk dat de Latijnse literatuur eigenlijk alleen maar in fragmenten is overgeleverd: hele boeken van Livius en Tacitus ontbreken, van de meeste auteurs kennen we alleen maar de namen, van andere hebben we een paar losse zinnetjes zonder context. En dan hebben we eigenlijk vooral de schrijftaal over, boeken geschreven door de elite voor de elite. Maar toch zien we ook iets van de maatschappij daaronder: handboeken voor het dagelijks gebruik van artsen, een reisbericht van een vrouw naar het heilige land, en niet te vergeten graffiti uit Pompeii. Om dit heel diverse materiaal te kunnen interpreteren heb je een heel goed woordenboek nodig. Een woordenboek dat alleen op een paar klassieke auteurs is gebaseerd, helpt niet veel als je de handleiding van een arts van een paar eeuwen later wilt begrijpen, of een moeilijke theologische discussie uit de vijfde eeuw.

Zo ontstond het idee de hele Latijnse literatuur, nee alle Latijnse teksten goed te onderzoeken. Maar wat heet nu alle? Het begin is vrij duidelijk: de oudste fragmenten van het Latijn zijn oude wetteksten, de twaalftafelenwet uit ca. 450 v.Chr., de oudste auteur van wie echt iets substantieels is overgeleverd, is Plautus (ca. 254-184 v. Chr.). Maar tot wanneer zou het moeten gaan? Interessant is de overgang van het Latijn in de Romaanse talen, en vooral ook de laat-Latijnse periode. Als grens werd daarom ca. 600 n. Chr. genomen, met het idee, dat vanaf dan Latijn echt een taal is die je op school moet leren en niet meer als moedertaal kan gelden. De grenzen zijn bepaald, maar hoe nu verder?

Systeemkaartjes

We zijn eind negentiende eeuw, computers zijn nog niet te bekennen. Om een woordenboek te schrijven moet je eerst te weten zien te komen waar een woord eigenlijk voorkomt. Daarom werd er begonnen de hele Latijnse literatuur op systeemkaartjes, Zettel, te schrijven. Als er bijv. vijftig woorden op een kaartje stonden, werd het kaartje vijftig keer gekopieerd. Nu bestonden kopieermachines natuurlijk ook nog niet, dus gebeurde dit door middel van lithografie. Zo hebben we bijv. vijftig kaartjes van de eerste paar regels van Vergilius. Nemen we de eerste zin van Vergilius: arma virumque cano. Nu werd op het eerste kaartje arma onderstreept en rechtsboven arma geschreven. Dit kaartje ging naar de doos voor arma, “wapens”. Op het tweede werd virum onderstreept, rechtsboven werd echter niet virum geschreven, maar de onverbogen vorm vir, “man”. Dit kaartje kwam in de doos vir. Zo vulden zich de doosjes. Ze gingen chronologisch te werk, dus eerst de oudste teksten en dan steeds verder naar 600 n. Chr. toe.

Zettel

Toen ze ongeveer bij de tweede eeuw n. Chr. aankwamen, bleken het toch erg veel kaartjes te worden. Bovendien waren inmiddels de “klassieke” auteurs alle aan de beurt geweest. Uit de latere eeuwen zijn heel veel teksten overgebleven, vooral veel christelijke teksten. Nu hebben die niet een compleet ander soort Latijn geschreven als in de periode ervoor. Om te vermijden dat er alleen al voor het woordje et (“en”) honderden dozen zouden ontstaan, werd er vanaf dit punt een andere methode gebruikt: alleen nog woorden die in de periode ervoor niet of nauwelijks voorkomen, of met een nieuwe betekenis of constructie, zouden een kaartje mogen krijgen. Daarom werd deskundigen voor de verschillende laatantieke auteurs gevraagd de kaartjes voor hun auteur te maken. Op deze manier ontstond in een vrij korte tijd een enorme analoge database voor het hele overgeleverde Latijn, netjes gerangschikt naar lemma en binnen een lemma chronologisch.

Gestaag doorwerken

Hiermee kon dus een woordenboek worden gemaakt. Daarvoor werd een periode van twintig jaar geschat. Dit bleek echter al gauw absoluut utopisch. Eén persoon alleen had dit zeker nooit aan gekund, maar ook in een team bleek dit ondoenlijk.

Toch werd er gestaag doorgewerkt en ongeveer elk jaar kwam er een deel uit. Zo ging het project door tijdens de Eerste Wereldoorlog en tijdens de Tweede. Het overleefde de verdeeldheid van Duitsland en de hereniging. Tot nu toe zijn de letters A-M, O-P en delen van N en R verschenen. Er werkt een internationaal team van wetenschappers aan, sommige voor een jaar, sommige voor jaren of hun hele leven.

De praktijk

Wat doet nu iemand die daar werkt? Hij of zij krijgt een doos met kaartjes, dat kunnen er een paar zijn bij kleine woorden, of meerdere dozen bij grote woorden. Omdat de kaartjes chronologisch staan, komen de oudste teksten het eerst. De kaartjes worden gecontroleerd aan de hand van moderne edities, vaak zijn er ook commentaren of vertalingen bij nodig. Vooral bij fragmenten kan dit een puzzel worden.

Bovendien komen er teksten langs uit allerlei verschillende vakgebieden: juridische teksten, teksten over architectuur, landbouw, astronomie, geschiedkundige werken, gedichten, brieven, christelijke pamfletten, theologische discussies, redevoeringen, komedies etc. Hij moet zich dus ook in deze verschillende deelgebieden gaan inwerken en eventueel experts op deze gebieden om raad vragen.

Op basis van de context bepaalt de medewerker wat voor een betekenis het woord op die plaats heeft. Zo verdeelt hij alle citaten over verschillende groepjes, die hij weer probeert met elkaar in verband te brengen. Zo ontstaat er een soort stamboom en worden ontwikkelingen in het gebruik van een woord duidelijk.

Encyclopedie van het Latijn

Is dit nu een woordenboek zoals Cicero het zou kunnen hebben gebruikt, of Augustinus? Afgezien van het feit dat woordenboeken nog niet bestonden, moet het antwoord nee zijn. Het is een encyclopedie van het Latijn zoals het toevallig overgeleverd is.

Ooit vaak gebruikte woorden staan er helemaal niet in, of maar met een paar voorbeelden. Gewoon omdat niemand ze opgeschreven heeft of omdat de teksten waarin ze stonden verdwenen zijn. Dit geldt vooral voor vakjargon, bijv. in de scheepsbouw, in het leger. Speciale betekenissen van een woord zijn verdwenen. Van dialecten weten we maar een paar woorden. Andere woorden hebben juist heel veel citaten, terwijl ze al snel ouderwets waren, of alleen door bepaalde mensen werden gebruikt, bijv. theologen. Een woord dat iemand op de muur van een WC in Pompeii heeft geschreven wordt net zo serieus genomen als een citaat van Cicero. Ook wat je eventueel als een fout zou kunnen beschouwen komt in de Thesaurus linguae Latinae. Het is een bestandsopname van wat we hebben, niet van wat er ooit is geweest.

Digitale databases

Er zijn toch tegenwoordig toch ook computers? Kan het daarmee niet sneller? Er bestaan inderdaad tekst-databases voor het Latijn, meestal achter betaalmuren, maar dat is een ander verhaal.

Er kleven echter verschillende nadelen aan deze databases. Ook de omvangrijkste database heeft niet alle Latijnse teksten. Vooral onbekende werken ontbreken vaak. De edities in zo’n database zijn niet altijd de nieuwste, en het zogenaamde kritische apparaat, waarin de uitgever uitlegt hoe zijn tekst tot stand gekomen is, ontbreekt. En je moet alle vormen van een lemma invoeren om ook echt alle citaten van een woord te krijgen. Dat betekent bij een werkwoord alle werkwoordsvormen, ook uitzonderingen. Een database is anders gezegd niet gelemmatiseerd. Daardoor zijn ook homoniemen niet van elkaar gescheiden, bijv. populus in de betekenis “volk” of “populier”. Dat is alles bij de analoge database van de Thesaurus linguae Latinae al gebeurd.

Meer dozen met systeemkaarten

Maar het belangrijkste is: we hebben het alleen maar over het verzamelen van de citaten. Het interpreteren en indelen van de citaten kan de computer niet overnemen. Natuurlijk gebruiken de medewerkers van de Thesaurus linguae Latinae dagelijks computers, om even de context van een citaat te bekijken, tijdschriftartikelen te raadplegen en het artikel zelf te schrijven.

Uitleg in het Latijn

Als iemand de Thesaurus linguae Latinae weleens heeft bekeken, zal hem of haar zijn opgevallen, dat het woordenboek helemaal in het Latijn is. Inderdaad zijn niet alleen de citaten, maar ook de betekenissen en de uitleg in het Latijn. Dat klinkt niet zo toegankelijk. Nu is dit een beslissing uit de negentiende eeuw, maar er is veel voor te zeggen. Als ze toen hadden besloten het in een moderne taal te maken, zou de keus op het Duits zijn gevallen. Dat zou in de Engelstalige wetenschappelijke wereld van nu ook niet zo prettig gevonden worden. En inmiddels zou dit Duits bovendien verouderd zijn. Latijn veroudert tenminste niet meer. Bovendien verplicht het schrijven van de betekenissen in het Latijn, dat je niet zomaar een vertaling kunt nemen (bijv. “repudiate” voor repudio, of “repeat” voor repeto) maar echt in dezelfde taal moet uitleggen wat een woord betekent. De Thesaurus linguae Latinae is bedoeld voor mensen die zich intensief met Latijn bezig houden, die moeten dus al goed genoeg Latijn kennen.

Om teksten uit de oudheid echt goed te kunnen begrijpen en vertalen is de Thesaurus linguae Latinae nodig. Hier kan een onderzoeker vinden wat een bepaald woord allemaal kan betekenen, in wat voor contexten het gebruikt wordt, wat de ontwikkeling van een woord is, hoe het geschreven werd, met welke woorden het in de handschriften vaak wordt verwisseld. Het is meer een encyclopedie van de woorden dan een woordenboek. En het is hier gratis toegankelijk.

[De reeks “Methode op Maandag” (MoM), waarin vandaag Josine Schrickx aan het woord was, toont wat de oudheidkundige wetenschappen maakt tot wetenschappen. Overzichten van deze en vergelijkbare stukjes zijn hier en daar. De foto’s waren van Michiel Streijger. Dit bericht verscheen oorspronkelijk op Mainzer Beobachter.]

Deel dit blog:
Historische hernoemingen

Een paar weken geleden deed iemand me een oud kinderboek cadeau, gewijd aan Jan Pieterszoon Coen. Degene die het me Read more

Historische excuses

Wat of ik als historicus en als Amsterdammer nou vond van de historische excuses die burgemeester Halsema onlangs maakte voor Read more

Foto van de dag: de Zon

Zonsondergang op de berg Nemrut [Meer foto’s hier.]

We kunnen de geesteswetenschappen niet langer redden (en dat is ook uw probleem)

Een paar dagen geleden blogde ik over de bedreiging van de oudheidkundige departementen in Sheffield en Halle-Wittenberg. Het gaat nu Read more


Categoriën: Algemeen