Categorieën
Onderzoek & projecten

Software­ontwikkeling

Het Instituut voor de Nederlandse Taal ontwikkelt software om onderzoekers efficiënter te laten werken met taalmaterialen. Onze zoeksystemen maken woordenboeken en corpora toegankelijk. Daarnaast stellen we software beschikbaar waarmee onderzoekers hun werkzaamheden grotendeels kunnen automatiseren.

English version

Software development

The Dutch Language Institute develops software that enables researchers to work with language materials in a more efficient way. It makes this software easily accessible to end users.

The development of search engines

In order to make language materials accessible, we develop search systems. Some can be used to search the dictionaries, e.g. the historical dictionaries and the Dictionary of Contemporary Dutch (ANW). Others have been designed to make corpora searchable. Something new is the development of a generic corpus application (BlackLab). It is used in the IMPACT retrieval demonstrator.

Versatility, ease of use and speed are key in the development of our search engines. Apart from looking up the meaning of a word, a reverse search (from meaning to word) is also possible, as well as searching by date or for groups of related words. We are also connecting all separate materials in order to provide users with efficient and well-organized access to the institute’s full data collection.

Software to support research

Our software to support researchers’ work comes in many forms:

  • programs for automatic data entry
  • programs for structuring digital language material such as word files or corpus files
  • programs for converting digital language material into XML standards such as TEI
  • programs for checking and correcting data
  • a specialized editing environment like the ANW dictionary editor

Our goal is always to automate as many labour-intensive tasks as possible. In most cases, the automatically generated data are manually checked, which improves their quality.


Applications/products

Het Instituut voor de Nederlandse Taal ontwikkelt software om onderzoekers efficiënter te laten werken met taalmaterialen. Die software maken we voor de gebruikers zo goed mogelijk toegankelijk.

Het ontwikkelen van zoeksystemen

Voor het toegankelijk maken van taalmaterialen worden zoeksystemen ontwikkeld. Hiermee kan in de woordenboeken gezocht worden, zoals de historische woordenboeken en het Algemeen Nederlands Woordenboek (ANW). Daarnaast hebben we zoeksystemen ontwikkeld om corpora doorzoekbaar te maken. Nieuw is de ontwikkeling van een generieke corpusapplicatie (BlackLab). Die wordt gebruikt in de IMPACT retrieval demonstrator.

We maken elk zoeksysteem zo veelzijdig en snel mogelijk en letten op het gebruiksgemak. Naast het opzoeken van de betekenis van een woord, kan er ook omgekeerd gezocht worden (vanuit de betekenis naar een woord), op datering of naar groepen samenhangende woorden. We brengen ook steeds meer koppelingen aan tussen afzonderlijke materialen, zodat gebruikers efficiënt en overzichtelijk toegang hebben tot de complete dataverzameling van het instituut.

Software voor ondersteuning van onderzoek

Onze software ondersteunt onderzoekers bij hun werkzaamheden. We bieden:

  • programma’s voor automatische gegevensinvoer
  • programma’s voor het structureren van digitaal taalmateriaal zoals woordenbestanden of corpusbestanden
  • programma’s voor het converteren van digitaal taalmateriaal in XML-standaarden zoals TEI, NAF of FoLiA
  • programma’s voor controle en correctie van gegevens
  • een gespecialiseerde bewerkingsomgeving zoals de ANW-woordenboekeditor
  • een Rapid Application Development platform om webgebaseerde omgevingen te ontwikkelen voor het handmatig bewerken van gestructureerde data (Lex’it)

Het doel is altijd om zoveel mogelijk bewerkelijke, tijdrovende klussen te automatiseren. In de meeste gevallen worden de automatisch gegenereerde data nog handmatig gecontroleerd. Dat verhoogt de kwaliteit.


Applicaties/producten