Onderzoek & projecten

Computerlinguïstiek

Computerlinguïstiek is het analyseren van natuurlijke taal met behulp van computers. Het Instituut voor de Nederlandse Taal gebruikt computerlinguïstiek om oude teksten toegankelijk te maken, gesproken en geschreven taal te kunnen laten onderzoeken en spelling te controleren.

Open source

Het Instituut voor de Nederlandse Taal stelt de software en computerlinguïstische tools die het heeft ontwikkeld als open source beschikbaar. Externe gebruikers hebben toegang tot de broncode en kunnen die voor eigen doeleinden aanpassen. Voorbeelden zijn het corpuszoeksysteem BlackLab en de morfologische parser MBMP.

Softwareontwikkeling

Het Instituut voor de Nederlandse Taal ontwikkelt software om onderzoekers efficiënter te laten werken met taalmaterialen. Onze zoeksystemen maken woordenboeken en corpora toegankelijk. Daarnaast stellen we software beschikbaar waarmee onderzoekers hun werkzaamheden grotendeels kunnen automatiseren.

CLARIAH

CLARIAH staat voor Common Lab Research Infrastructure for the Arts and Humanities, en is een samenwerkingsproject dat een digitale infrastructuur voor de geesteswetenschappen tot stand brengt. Daarvoor worden grote hoeveelheden data en software uit verschillende geesteswetenschappelijke disciplines aan elkaar gekoppeld en digitaal doorzoekbaar gemaakt.

CLARIN

Het Instituut voor de Nederlandse Taal (INT) maakt als CLARIN B-centrum deel uit van CLARIN (Common Language Research Infrastructure). Dit Europese programma biedt een stabiele, permanente, toegankelijke en uitbreidbare onderzoeksinfrastructuur voor geesteswetenschappers. Onderzoekers, docenten en studenten krijgen hiermee toegang tot digitale materialen en tools die relevant zijn voor hun onderzoek.

ELEXIS

ELEXIS staat voor European Lexicographic Infrastructure en heeft als doel een duurzame infrastructuur te creëren voor e-lexicografie. ELEXIS maakt het mogelijk om verschillende Europese lexicografische bronnen op grote schaal te koppelen, te delen, te verspreiden en op te slaan.

ELRC

ELRC staat voor European Language Resources Coordination Initiative. Het project heeft als doel op grote schaal taaldata te verzamelen die gebruikt kunnen worden voor het ontwikkelen van automatische vertaalsystemen voor publieke diensten in alle EU-lidstaten, Noorwegen en IJsland.

enetCollect

EnetCollect staat voor European Network for Combining Language Learning with Crowdsourcing Techniques. Het doel van het project is om met behulp van crowdsourcing de productie van lesmateriaal voor taalleerders met verschillende niveaus en achtergronden te verbeteren.

Taalradar

Taalradar is een platform gemaakt door het Instituut voor de Nederlandse Taal (INT), waarmee door middel van crowdsourcing kennis verzameld wordt over het Nederlands.

Woordcombinaties

Wie een vreemde taal bijna even vloeiend wil leren spreken en schrijven als een moedertaalgebruiker, moet ook een behoorlijk aantal vaste en minder vaste woordcombinaties leren om goed te kunnen communiceren.

Afgeronde projecten

Het Instituut voor de Nederlandse Taal (INT) werkt vaak samen in (Europese) projecten, vroeger onder de naam Instituut voor Nederlandse Lexicologie (INL). Op deze pagina vindt u een overzicht van inmiddels afgeronde projecten.