Categorieën
Onderzoek & projecten

CLARIAH

CLARIAH staat voor Common Lab Research Infrastructure for the Arts and Humanities, en is een samenwerkingsproject dat een digitale infrastructuur voor de geesteswetenschappen tot stand brengt. Daarvoor worden grote hoeveelheden data en software uit verschillende geesteswetenschappelijke disciplines aan elkaar gekoppeld en digitaal doorzoekbaar gemaakt.

English version

CLARIAH

Project description

CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities) is a collaborative project creating a distributed research infrastructure for the arts and humanities. It can be considered a successor to and expansion of CLARIN-NL. Large quantities of data and software from different disciplines in the humanities are linked together and made digitally searchable. CLARIAH focuses on three disciplines: linguistics, media studies, and socio-economic history, which focus on making text files available, developing tools for the mining of audio-visual files, and making structured databases usable, respectively. The Dutch Language Institute is involved in the development of two work packages: Technology (work package 2) and Linguistics (work package 3).

Our role

Our expertise is primarily applied in the area of searchability of linguistic data files. In the CLARIAH project, lexica, corpora, electronic dictionaries and non-linguistic databases are made searchable. This involves ‘local search’ (in local data files), ‘federated search’ (in files stored in different locations), and ‘chaining search’ (in different types of data files at once).

Semantic lexicon DiaMaNT

DiaMaNT (Diachronic SeMantic lexicon of Dutch) started out as a subproject of CLARIAH, and had resulted in a first version of a diachronic semantic lexicon of the Dutch language. The lexicon was used in CLARIAH research pilots SERPENS en DB:CCC(Diamonds in Borneo: Commodities as Concepts in Context).


Further reading

Projectbeschrijving

CLARIAH (Common Lab Research Infrastructure for the Arts and Humanities) is een samenwerkingsproject dat een digitale infrastructuur voor de geesteswetenschappen tot stand brengt. Het kan gezien worden als de opvolging (en uitbreiding) van CLARIN-NL. Grote hoeveelheden data en software uit verschillende geesteswetenschappelijke disciplines worden aan elkaar gekoppeld en digitaal doorzoekbaar gemaakt. CLARIAH richt zich op drie deelgebieden: taalkunde, mediastudies en sociaal-economische geschiedenis, die zich respectievelijk bezighouden met het ontsluiten van tekstbestanden, het ontwikkelen van gereedschappen om audiovisuele bronnen te ontginnen, en het inzetbaar maken van gestructureerde databestanden. Het Instituut voor de Nederlandse Taal is betrokken bij twee werkpakketten, namelijk Techniek (werkpakket 2) en Taalkunde (werkpakket 3).

Onze rol

Onze expertise wordt met name ingezet op het gebied van zoeken in taalkundige databestanden. In het CLARIAH-project worden lexica, corpora, elektronische woordenboeken en niet-taalkundige databases doorzoekbaar gemaakt. Daarbij gaat het om lokaal zoeken in databestanden (local search), zoeken in bestanden die op verschillende locaties staan (federated search), en zoeken met gebruikmaking van verschillende types databestanden tegelijk (chaining search).

Semantisch lexicon DiaMaNT

DiaMaNT (Diachroon seMAntisch lexicon van de Nederlandse Taal) is gestart als deelproject van CLARIAH en heeft een eerste versie van een diachroon semantisch lexicon van de Nederlandse taal geleverd. Het lexicon is gebruikt in de CLARIAH research pilots SERPENS en DB:CCC (Diamonds in Borneo: Commodities as Concepts in Context).


Meer lezen