Historisch Nederlands: corpora

 

Eindhoven-corpus
[binnenkort online]

Meer weten

 

Meer weten: Corpus Oudnederlands

Het Corpus Oudnederlands omvat een verzameling van al het overgebleven Nederlandse woordmateriaal uit de periode 475-1200 dat als bronnenmateriaal heeft gediend voor het Oudnederlands woordenboek (ONW). Deze materiaalverzameling bestaat uit verschillende componenten: drie grote teksten (Wachtendonkse Psalmen, Leidse Willeram, Mittelfränkische Reimbibel), kleinere Oudnederlandse teksten en tekstfragmenten (waaronder runeninscripties), glossen en losse woorden, Frankisch materiaal en toponymisch materiaal. Het corpus is verrijkt met woordsoort en modern Nederlands lemma om het beter doorzoekbaar te maken.

Meer weten?

 

Meer weten: Corpus Gysseling

Het Corpus Gysseling dat hier ter beschikking wordt gesteld is de verzameling van alle dertiende-eeuwse teksten die als bronnenmateriaal hebben gediend voor het Vroegmiddelnederlands Woordenboek (VMNW). Het corpus is vernoemd naar de Gentse taalkundige Maurits Gysseling, verantwoordelijk voor het Corpus van Middelnederlandse teksten (tot en met het jaar 1300), uitgegeven in de periode 1977-1987, waaruit het grootste gedeelte van het corpusmateriaal geput is. Het corpus is verrijkt met woordsoort en modern Nederlands lemma, om het beter doorzoekbaar te maken.

Meer weten?

 

Meer weten: Corpus Middelnederlands

Het Corpus Middelnederlands is een verzameling van ruim 350 Middelnederlandse teksten in rijm en proza uit de periode 1250-1500. Het corpus bevat in verhouding tot de andere corpora veel literair materiaal. Het overgrote deel van deze teksten is oorspronkelijk gepubliceerd op de cd-rom Middelnederlands. Nieuw ten opzichte van de cd-rom is een aantal artesteksten. Het corpus wordt op termijn verrijkt met woordsoort en lemma.

Meer weten?

 

Meer weten: Brieven als Buit

Uit de ongeveer 40.000 Nederlandse brieven uit de tweede helft van de 17e tot de vroege 19e eeuw die bewaard worden in de National Archives (Kew, UK), is voor dit corpus een selectie gemaakt van 1033 – merendeels particuliere – brieven tussen Nederlanders in verre oorden en hun families en geliefden aan het thuisfront. Alle brieven zijn voorzien van metadata over de brief zelf, de briefschrijver, de ontvanger en de plaats van verzending. Het corpus is verrijkt met woordsoort en modern Nederlands lemma om het beter doorzoekbaar te maken.

Meer weten?

 

Meer weten: Eindhoven-corpus

Het Eindhoven-corpus (VU-versie) is een verzameling Nederlandstalige geschreven en getranscribeerde gesproken teksten uit de periode van 1960 tot 1976. De eerste versie van het corpus bevatte voornamelijk materiaal uit dagbladen, gezinsbladen en opiniebladen. Later is daar een corpus met tekstfragmenten van correspondentie tussen de regering en de Staten-Generaal uit het parlementaire jaar 1975-1976 aan toegevoegd. De huidige versie, op het INT gerealiseerd, bevat amenderingen van Hans van Halteren en verbeteringen aan de spelling en tagging. De oorspronkelijke taalkundige verrijking met woordsoort en lemma is omgezet naar de tagset van het Corpus Gesproken Nederlands. (CGN).

Meer weten?

 

Meer weten: Nederlab

Nederlab is een onderzoeksportaal dat onderzoekers en studenten in staat stelt digitale historische teksten die op allerlei verschillende plaatsen, door verschillende instellingen en op verschillende manieren beschikbaar zijn gesteld, als eenheid te doorzoeken en te analyseren met gebruiksvriendelijke tekstanalysesoftware. Momenteel bevat Nederlab 41 miljoen oude en nieuwe teksten met meer dan 18 miljard woorden – van het vroegste Middelnederlands tot Nederlands uit de eenentwintigste eeuw – die zowel op tekstniveau als op metadataniveau bestudeerd kunnen worden.

 

Op deze website maken wij gebruik van cookies.