Categorieën
Onderzoek & projecten

CLARIN

Het Instituut voor de Nederlandse Taal (INT) maakt als CLARIN B-centrum en als CLARIN K-centrum deel uit van CLARIN (Common Language Resources and Technology Infrastructure). Dit Europese programma biedt een stabiele, permanente, toegankelijke en uitbreidbare onderzoeksinfrastructuur voor geesteswetenschappers. Onderzoekers, docenten en studenten krijgen hiermee toegang tot digitale materialen en tools die relevant zijn voor hun onderzoek.

English version

CLARIN

As a CLARIN B Centre and as a CLARIN K Centre, the Dutch Language Institute (INT) is part of CLARIN. This European program offers a stable, sustainable, accessible and expandable common infrastructure for research in the humanities. It provides researchers, (assistant) professors and students with the digital materials and tools relevant to their research.

Objective of CLARIN

CLARIN (Common Language Resources and Technology Infrastructure) is building an integrated, interoperable research structure with language sources and language technology. The infrastructure, which is stable, permanent, accessible and expandable, should put an end to the current fragmentation and promote the use of computational techniques in the Digital Humanities.

  • integrated: the source and service centres are linked through grid technology and form one virtual, integrated domain
  • interoperable: the sources and services will use the technology of the semantic web, putting an end to differences in format, structure and used terminology
  • stable: the sources and services are optimally accessible
  • permanent: the sources and services will still be available for research in the long term
  • accessible: the sources and services are accessible in various ways through the web; training is offered, adapted to the user’s needs
  • expandable: the infrastructure is open for expansion with new language sources and services

By now, 22 countries are taking part in CLARIN; the Netherlands has played a key role from the start, with four institutes involved, among which the INT. The INT is a coordinating partner for Belgium. See also the CLARIN website.

CLARIN had great societal benefits. This infrastructure transcends disciplines, languages and borders. It puts the languages and cultures of a country on the map. And because the partaking countries and institutes make use of central services and they all employ the same standards, costs are cut considerably.

Who is CLARIN for?

CLARIN offers its services to:

  • linguists: by adapting their models and tools (software) so they can deal with any language materials
  • humanities scholars: by providing easier access to language sources and language technology
  • society: by providing easier access to multicultural and multilingual sources

INT as a CLARIN B & CLARIN K centre

There are different types of CLARIN centres: B, C, E and K. The Netherlands boasts four CLARIN B centres: the Meertens Institute, Huygens ING, the Max Planck Institute and the Dutch Language Institute. For CLARIN Belgium the INT also functions as a CLARIN B centre for Flanders. It establishes contacts with its academic institutes and research institutes.

The INT is also a CLARIN K centre, the K representing Knowledge, focused on Dutch, as it goes without saying. In this role, the INT also offers its knowledge to non-Dutch researchers. See also https://kdutch.ivdnt.org/wiki/K-Dutch.

A CLARIN B centre manages tools and data, and makes them available for research. In order to become such a centre, an organization must first undergo an assessment procedure to obtain a Data Seal of Approval. This guarantees that each CLARIN B centre employs recognized standards, provides metadata, and is legally and ethically sound.

Apart from CLARIN B centres there are other institutions providing services within Clarin, such as data providers (e.g. KB, DBNL en Beeld en Geluid).

What do we do for researchers?

Researchers and students affiliated with universities and other research institutes can log in with single sign-on (SSO) to use tools and materials. These can be found through portals. This also makes it easy to keep track of ongoing and previously conducted research, which stimulates the cultivation of (international) contacts with fellow researchers.

The portals enable the online use or downloading of tools and data. Researchers have the option of using a personal workspace. Moreover, they can safely and sustainably leave their own research data and research tools in the infrastructure upon finishing their project. Crucially, CLARIN guarantees that tools will be updated, and that materials will remain available and researchable through the use of persistent identifiers.


More information

Finished CLARIN projects

Applications/products

Het Instituut voor de Nederlandse Taal (INT) maakt als CLARIN B-centrum deel uit van CLARIN. Dit Europese programma biedt een stabiele, permanente, toegankelijke en uitbreidbare onderzoeksinfrastructuur voor geesteswetenschappers. Onderzoekers, docenten en studenten krijgen hiermee toegang tot digitale materialen en tools die relevant zijn voor hun onderzoek.

Doel van CLARIN

CLARIN (‘Common Language Resources and Technology Infrastructure’) bouwt aan een geïntegreerde, interoperabele onderzoeksinfrastructuur met taalbronnen en taaltechnologie. De infrastructuur, die stabiel, permanent, toegankelijk en uitbreidbaar is, moet de bestaande versnippering opheffen en gebruik van computationele technieken in de geesteswetenschappen (Digital Humanities) bevorderen.

  • geïntegreerd: de bronnen- en servicecentra zijn door grid-technologie verbonden en vormen één virtueel, geïntegreerd domein
  • interoperabel: de bronnen en diensten zullen gebruikmaken van de technologie van het semantische web, waarbij verschillen in formaat, structuur en gebruikte terminologie opgeheven zullen worden
  • stabiel: de bronnen en diensten zijn in hoge mate beschikbaar
  • permanent: de bronnen en diensten zullen op lange termijn nog steeds beschikbaar zijn voor onderzoek
  • toegankelijk: de bronnen en diensten zijn op verschillende manieren via het web toegankelijk; daarvoor wordt training aangeboden, aangepast aan de behoeften van de gebruiker
  • uitbreidbaar: de infrastructuur is open voor uitbreiding met nieuwe taalbronnen en diensten

Aan CLARIN nemen inmiddels 22 landen deel; Nederland speelt met vier bij CLARIN betrokken instituten, waaronder het INT, een belangrijke rol als trekker. Voor België is het INT een coördinerende partner. Zie ook de website van CLARIN zelf.

De maatschappelijke voordelen van CLARIN zijn groot. Deze infrastructuur overschrijdt disciplines, talen en grenzen. Het zet de talen en culturen van een land op de kaart. En doordat de deelnemende landen en instellingen centrale diensten gebruiken en allemaal dezelfde standaarden gebruiken, worden er veel kosten bespaard.

Voor wie is CLARIN?

CLARIN biedt zijn diensten aan aan:

  • taalkundigen: om hun modellen en tools (software) zo aan te passen dat ze alle taalmateriaal aankunnen
  • geesteswetenschappers: door de toegang tot taalbronnen en taaltechnologie te vergemakkelijken
  • de gemeenschap: door de toegang tot multiculturele en meertalige bronnen te vergemakkelijken

CLARIN-centra

Er bestaan verschillende typen CLARIN-centra: B, C, E en K. Nederland telt vier CLARIN B-centra: het Meertens Instituut, het Huygens ING, het Max Planck Instituut en het Instituut voor de Nederlandse Taal. Voor CLARIN-België vervult het INT ook de rol van CLARIN B-centrum voor Vlaanderen. Het legt contacten met academische instellingen en onderzoeksinstituten daar.

Het INT is eveneens een CLARIN K-centrum, waarbij de K staat voor Knowledge, met de focus op, hoe kan het ook anders, het Nederlands. In die rol biedt het INT zijn kennis over het Nederlands aan niet-Nederlandstalige onderzoekers aan. Zie ook https://kdutch.ivdnt.org/wiki/K-Dutch.

Een CLARIN B-centrum neemt tools en data in beheer en zorgt dat ze beschikbaar zijn of komen voor onderzoek. Om zo’n centrum te worden ondergaat een instelling eerst een assessmentprocedure om een Data Seal of Approval te krijgen. Dat garandeert onder meer dat een CLARIN B-centrum erkende standaarden gebruikt, metadata verschaft en dat alles juridisch en ethisch op orde is.

Behalve CLARIN B-centra zijn er nog andere instituten die binnen CLARIN diensten verlenen, zoals dataproviders (o.a. KB, DBNL en Beeld en Geluid).

Wat doen wij voor onderzoekers?

Via universiteiten en andere onderzoeksinstituten kunnen onderzoekers en studenten via single sign-on inloggen om tools en materialen te gebruiken. Die zijn te vinden via portals. Zo is ook gemakkelijk te ontdekken welk onderzoek er al gedaan is en nog loopt; dat stimuleert (internationale) contacten met collega-onderzoekers.

De portals maken het mogelijk om tools en data online te gebruiken of te downloaden. Onderzoekers kunnen gebruikmaken van een eigen workspace. Bovendien kunnen ze hun eigen onderzoeksdata en -tools na afloop van hun project veilig en duurzaam in de infrastructuur achterlaten. Een belangrijk punt van CLARIN is de garantie dat tools actueel en bruikbaar worden gehouden en materiaal beschikbaar en onderzoekbaar blijft door persistent identifiers.