Searched tag: Tool

Federated Search Lexica

Gemaakt op maandag 28 oktober 2019   »Taalmaterialen

Greedy Extraction of Trees for Emperical Linguistics - GrETEL

Gemaakt op maandag 28 oktober 2019   »Taalmaterialen

Een gebruiksvriendelijke interface voor het doorzoeken van syntactisch geannoteerde corpora of Treebanks.

Details

Philostei

Gemaakt op woensdag 21 november 2018   »Grafzerk

Philostei TICCLing Philosophy

Een open source, web-gebaseerd, gebruiksvriendelijke workflow van digitale afbeeldingen van naar TEI, die het mogelijk maken een filosofisch corpus op te bouwen. Deze workflow gebruikt een combinatie van een OCRopus / Tesseract webservice voor de analyse van de tekst-layout en OCR (Optical Character Recognition) en een meertalige versie van TICCL beschikbaar als webservice TICCLops. Een opvolger is PICCL. Zie ook: http://portal.clarin.nl/node/4190.

Status: Vervallen

TICLLOPS

Gemaakt op woensdag 21 november 2018   »Grafzerk

TICCLOPS Text-Induced Corpus Clean-up online processing system

TICCL (Text Induced Corpus Clean-up) is een systeem dat dient om een corpus te doorzoeken naar varianten van bestaande woorden en kan zo dienen om spelling- en OCR-fouten te ontdekken. Deze tool is inmiddels niet meer beschikbaar. Een opvolger is PICCL. Zie ook: https://portal.clarin.nl/node/1914.

Status: Vervallen

Hulk / Keurmerk Spelling

Gemaakt op woensdag 18 april 2018   »Taalmaterialen

Hulk / Keurmerk Spelling: keurmerk voor producten die de regels en principes van de officiële spelling van de Nederlandse Taalunie volgen.

Certification mark for products written in compliance with the official spelling rules and principles formulated by the Dutch Language Union.

Ga naar website

Cornetto-LMF

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Lexicale database voor het Nederlands met semantische relaties en combinatorische informatie. Alleen toegankelijk met een CLARIN-account.

Lexical database of Dutch, providing semantic relationships and combinatorial information. Only accessible with a CLARIN account.

Ga naar website

OpenConvert

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Tool om tekst te converteren naar xml-formaat (TEI) en te voorzien van taalkundige annotaties. Alleen toegankelijk met een CLARIN-account.

A tool for converting text to XML format (TEI) and annotating it with linguistic information. Only accessible with a CLARIN account.

Details

Nerd

Gemaakt op dinsdag 13 maart 2018   »Grafzerk

Named entity recognizer. Alleen toegankelijk met een CLARIN-account.

Named entity recognizer. Only accessible with a CLARIN account.

Details

Status: Vervallen

Memory-Based Morphological Parser (MBMP)

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een geheugengebaseerde morfologische parser voor de programmeertaal Python. Deze tool wordt gedistribueerd via GitHub.

A memory-based morphological parser for the programming language Python. This tool is distributed through Github.

Details

INL Labs

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Webservice voor het taggen/lemmatiseren van (historische) teksten met o.a. een tagger voor eigennamen (named entities) en een tagger speciaal getraind voor historisch materiaal. De laatste geeft de moderne woordvormen weer en maakt een koppeling naar betekenisomschrijvingen.

Web service for tagging/lemmatizing (historical) texts, for example with a tagger for named entities, and a tagger trained specifically for historical material. The latter shows the modern word forms and connects these to descriptions of their meanings.

Details

CoBaLT

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Applicatie om een verzameling tekstbestanden in te laden en taalkundig te annoteren. Deze applicatie wordt gedistribueerd via GitHub.

Application for importing and linguistically annotating a collection of text files. This application is distributed through Github.

Details

Blacklab Server

Gemaakt op dinsdag 13 maart 2018   »Grafzerk

Webservice voor het zoeken in corpora met BlackLab vanuit iedere programmeertaal. Het project Blacklab Server is samengevoegd met BlackLab. Deze tool wordt gedistribueerd via GitHub.

Web service for searching corpora with BlackLab, using any programming language. The Blacklab Server project had been merged with BlackLab. This tool is distributed through Github.

Ga naar website

Blacklab

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Corpuszoeksysteem op basis van Apache Lucene. Deze tool wordt gedistribueerd via GitHub.

A corpus retrieval engine based on Apache Lucene. This tool is distributed through Github.

Details

Blacklab Frontend

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een uitgebreide interface voor de Blacklab corpus-zoekmachine.

A feature-rich corpus search interface for BlackLab corpus query engine.

Details

Autosearch

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Een tool om geannoteerde teksten te uploaden (voorzien van lemma's en woordsoortinformatie in TEI- of FoLiA-formaat), één of meerdere corpora te definiëren en deze te doorzoeken. Alleen toegankelijk met een CLARIN-account.

A tool to upload corpora annotated with part of speech, lemma and word form in FoLiA or TEI format, and to define one or several corpora and to search them. Only accessible with a CLARIN account.

Details

Attestation Tool

Gemaakt op dinsdag 13 maart 2018   »Taalmaterialen

Multifunctionele, downloadbare gebruikersinterface voor de productie van computationele lexica, inclusief gouden standaard voor named entity tagging.

Deze tool wordt gedistribueerd via GitHub.

A multifunctional, downloadable user interface for the production of computational lexica, including a gold standard for named-entity tagging.

Details

AUTONOMATA-POI-demo

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Een demo van een spraakherkenner voor POIs (points of interest). Deze demo herkent overnachtingsadressen en eetgelegenheden in enkele grote steden (o.a. Amsterdam, Antwerpen, Gent, Rotterdam).

Details

AUTONOMATA-transcriptietoolset

Gemaakt op maandag 30 november -0001   »Taalmaterialen

De AUTONOMATA-transcriptietoolset bestaat uit een transcriptietool en learning tools, waarmee men woordenlijsten kan verrijken met nauwkeurige uitspraakinformatie.

Details

COREA-coreferentieservice

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Een systeem dat automatisch coreferentiële relaties tussen nominale constituenten in teksten op kan lossen.

Details

Dupira

Gemaakt op maandag 30 november -0001   »Taalmaterialen

Op deze website maken wij gebruik van cookies.