Taalmaterialen

Het Instituut voor de Nederlandse Taal stelt tekstverzamelingen, woordenlijsten, wetenschappelijke woordenboeken, spraakcorpora en taal- en spraaktechnologische software beschikbaar via de website taalmaterialen.ivdnt.org.

Via de website taalmaterialen.ivdnt.org stelt het Instituut voor de Nederlandse Taal (INT) bronnen, data en tools beschikbaar voor taalkundig onderzoek en taal- en spraaktechnologie (TST) binnen het hele Nederlandse taalgebied.

Overzicht van alle taalmaterialen

  • Afrikaans Custom Dictionary for Government Domain
  • Afrikaans Genre Classification Corpus
  • Algemeen Nederlands Woordenboek (ANW)
  • Attestation Tool
  • AUTONOMATA-namencorpus
  • AUTONOMATA-POI-corpus
  • AUTONOMATA-transcriptietoolset
  • AutoSearch
  • Autshumato Afrikaans-English Translation Memory
  • Autshumato English-Afrikaans Parallel Corpora
  • Autshumato English-Afrikaans Translation Memory
  • Autshumato English-isiZulu Parallel Corpora
  • Autshumato English-isiZulu Translation Memory
  • Autshumato English-Sesotho sa Leboa Parallel Corpora
  • Autshumato isiZulu-English Translation Memory
  • Autshumato Sesotho sa Leboa-English Translation Memory
  • BasiLex-corpus
  • BasiLex-lexicon
  • BasiScript-corpus
  • BasiScript-lexicon
  • BlackLab
  • BlackLab Frontend
  • BlackLab Server
  • BLISS Spoken Dialogue Dataset
  • Boarnsterhim Corpus (BHC)
  • Brieven als Buit
  • Brieven als Buit – Gouden Standaard
  • BWNT05
  • Cd-rom Middelnederlands
  • CGN-annotaties
  • Children’s Oral Reading Corpus (CHOREC)
  • CHN N-grams
  • CoBaLT
  • CombiLex
  • CombiLex Commercieel
  • COREA-coreferentiecorpus
  • COREA-coreferentieservice
  • Cornetto-LMF
  • Corpus Gesproken Nederlands (CGN)
  • Corpus Gysseling
  • Corpus Hedendaags Nederlands (CHN)
  • Corpus Middelnederlands
  • Corpus Oudnederlands
  • Corpus Ondertitelde UVN-Colleges (COUC)
  • Corpus Pathologische en Normale Spraak (COPAS)
  • DAESO-corpus: parallelle Nederlandstalige monolinguale treebank
  • Database van de Zuidelijk-Nederlandse Dialecten (DSDD)
  • Diachroon seMantisch lexicon van de Nederlandse Taal – DiaMaNT
  • D-TUNA-corpus
  • DuELME
  • DuOMAn Subjectivity Lexicon
  • Dupira
  • Dutch Idiom Database: Native Speakers (DID-NS)
  • Dutch Parallel Corpus (DPC)
  • Eindhoven-corpus
  • e-Lex
  • Etymologiebank
  • Etymologisch Woordenboek van het Nederlands (EWN)
  • Federated Search Lexica
  • Frequentielijsten corpora
  • Frog
  • GiGaNT-Molex
  • Greedy Extraction of Trees for Empirical Linguistics – GrETEL
  • Hulk / Keurmerk Spelling
  • IFA Dialoog-videocorpus
  • IFA-corpus
  • IMDI-server
  • INL Labs
  • INT Historische Woordenlijst
  • INT IMPACT NE-lexicon
  • isiNdebele Custom Dictionary for Government Domain
  • isiNdebele Genre Classification Corpus
  • isiXhosa Custom Dictionary for Government Domain
  • isiXhosa Genre Classification Corpus
  • isiZulu Custom Dictionary for Government Domain
  • isiZulu Genre Classification Corpus
  • JASMIN-spraakcorpus
  • Lassy Groot-corpus
  • Lassy Klein-corpus
  • Lwazi Afrikaans ASR Corpus
  • Lwazi Afrikaans Pronunciation Dictionary
  • Lwazi English ASR Corpus
  • Lwazi English Pronunciation Dictionary
  • Lwazi isiNdebele ASR Corpus
  • Lwazi isiNdebele Pronunciation Dictionary
  • Lwazi isiXhosa ASR Corpus
  • Lwazi isiXhosa Pronunciation Dictionary
  • Lwazi isiZulu ASR Corpus
  • Lwazi isiZulu Pronunciation Dictionary
  • Lwazi Sepedi ASR Corpus
  • Lwazi Sepedi Pronunciation Dictionary
  • Lwazi Sesotho ASR Corpus
  • Lwazi Sesotho Pronunciation Dictionary
  • Lwazi Setswana ASR Corpus
  • Lwazi Setswana Pronunciation Dictionary
  • Lwazi Siswati ASR Corpus
  • Lwazi Siswati Pronunciation Dictionary
  • Lwazi Tshivenda ASR corpus
  • Lwazi Tshivenda Pronunciation Dictionary
  • Lwazi Xitsonga ASR Corpus
  • Lwazi Xitsonga Pronunciation Dictionary
  • Medische Termen Belgisch-Nederlands (MedTermBN)
  • Meertalige Ondertiteldata 2BDutch
  • Memory-Based Morphological Parser (MBMP)
  • Middelnederlandsch Woordenboek (MNW)
  • Moroccorp
  • NAMES Corpus
  • Neologismen Online v3
  • Nerd
  • OMBI Arabisch-Nederlands
  • OMBI Nederlands-Arabisch
  • OMBI Nederlands-Deens
  • OMBI Nederlands-Indonesisch
  • Open Source Dutch Wordnet
  • OpenConvert
  • OpenSoNaR
  • Oudnederlands Woordenboek (ONW)
  • Paco-MT Parallelle Corpora
  • PAROLE-lexicon
  • Philosophical Integrator of Computational and Corpus Libraries (PICCL)
  • RBN-klein
  • Referentiebestand Belgisch-Nederlands (RBBN)
  • Referentiebestand Nederlands (RBN)
  • RND Woordenlijsten
  • Sepedi Custom Dictionary for Government Domain
  • Sesotho Custom Dictionary for Government Domain
  • Sesotho Genre Classification Corpus
  • Sesotho sa Leboa Genre Classification Corpus
  • Setswana Custom Dictionary for Government Domain
  • Setswana Genre Classification Corpus
  • Siswati Custom Dictionary for Government Domain
  • Siswati Genre Classification Corpus
  • SoNaR Nieuwe Media Corpus
  • SoNaR-corpus
  • Spelspiek
  • SumNL-samenvattingencorpus
  • Taalportaal
  • TICCLops
  • Tshivenda Custom Dictionary for Government Domain
  • Tshivenda Genre Classification Corpus
  • Vertaalwoordenschat
  • Vroegmiddelnederlands Woordenboek (VMNW)
  • VU-DNC-corpus
  • Wablieft-corpus
  • WebCelex
  • Woordenboek der Friese Taal (WFT)
  • Woordenboek der Nederlandsche Taal (WNT)
  • Xitsonga Custom Dictionary for Government Domain
  • Xitsonga Genre Classification Corpus