Software development

The Dutch Language Institute develops software that enables researchers to work with language materials in a more efficient way. It makes this software easily accessible to end users.

The development of search engines

In order to make language materials accessible, we develop search systems. Some can be used to search the dictionaries, e.g. the historical dictionaries and the Dictionary of Contemporary Dutch (ANW). Others have been designed to make corpora searchable. Something new is the development of a generic corpus application (BlackLab). It is used in the IMPACT retrieval demonstrator.

Versatility, ease of use and speed are key in the development of our search engines. Apart from looking up the meaning of a word, a reverse search (from meaning to word) is also possible, as well as searching by date or for groups of related words. We are also connecting all separate materials in order to provide users with efficient and well-organized access to the institute’s full data collection.

Software to support research

Our software to support researchers’ work comes in many forms:

programs for automatic data entry
programs for structuring digital language material such as word files or corpus files
programs for converting digital language material into XML standards such as TEI
programs for checking and correcting data
a specialized editing environment like the ANW dictionary editor
a Rapid Application Development platform to develop web-based environments for the manual processing of structured data (Lex’it)

Our goal is always to automate as many labour-intensive tasks as possible. In most cases, the automatically generated data are manually checked, which improves their quality.

Tags: tools

Contact: Jan Niestadt

Applications/products

Het Instituut voor de Nederlandse Taal ontwikkelt software om onderzoekers efficiënter te laten werken met taalmaterialen. Die software maken we voor de gebruikers zo goed mogelijk toegankelijk.

Het ontwikkelen van zoeksystemen

Voor het toegankelijk maken van taalmaterialen worden zoeksystemen ontwikkeld. Hiermee kan in de woordenboeken gezocht worden, zoals de historische woordenboeken en het Algemeen Nederlands Woordenboek (ANW). Daarnaast hebben we zoeksystemen ontwikkeld om corpora doorzoekbaar te maken. Nieuw is de ontwikkeling van een generieke corpusapplicatie (BlackLab). Die wordt gebruikt in de IMPACT retrieval demonstrator.

We maken elk zoeksysteem zo veelzijdig en snel mogelijk en letten op het gebruiksgemak. Naast het opzoeken van de betekenis van een woord, kan er ook omgekeerd gezocht worden (vanuit de betekenis naar een woord), op datering of naar groepen samenhangende woorden. We brengen ook steeds meer koppelingen aan tussen afzonderlijke materialen, zodat gebruikers efficiënt en overzichtelijk toegang hebben tot de complete dataverzameling van het instituut.

Software voor ondersteuning van onderzoek

Onze software ondersteunt onderzoekers bij hun werkzaamheden. We bieden:

programma’s voor automatische gegevensinvoer
programma’s voor het structureren van digitaal taalmateriaal zoals woordenbestanden of corpusbestanden
programma’s voor het converteren van digitaal taalmateriaal in XML-standaarden zoals TEI, NAF of FoLiA
programma’s voor controle en correctie van gegevens
een gespecialiseerde bewerkingsomgeving zoals de ANW-woordenboekeditor
een Rapid Application Development platform om webgebaseerde omgevingen te ontwikkelen voor het handmatig bewerken van gestructureerde data (Lex’it)

Het doel is altijd om zoveel mogelijk bewerkelijke, tijdrovende klussen te automatiseren. In de meeste gevallen worden de automatisch gegenereerde data nog handmatig gecontroleerd. Dat verhoogt de kwaliteit.

Tags: tools

Contactpersoon: Jan Niestadt
Laatste wijziging: 30/06/2022

Software development

The development of search engines

Software to support research

Applications/products

Applicaties/producten

Agenda

Software development

The development of search engines

Software to support research

Applications/products

Het ontwikkelen van zoeksystemen

Software voor ondersteuning van onderzoek

Applicaties/producten

INT-nieuwsbrief

Terminologienieuwsbrief