Occitanica

Resultats de recèrca

1 resultat
Creator : Rey, Christophe
Portail : Mediatèca
PICARTEXT : Une ressource informatisée pour la langue picarde / Jean-Michel Eloy, Fanny Martin, Christophe Rey
PICARTEXT : Une ressource informatisée pour la langue picarde . TALaRE 2015 - Traitement Automatique des Langues Régionales de France et d'Europe / Jean-Michel Eloy, Fanny Martin, Christophe Rey
Eloy, Jean-Michel
Martin, Fanny
Rey, Christophe
Picartext est une base de données textuelles, construite depuis près de 10 ans à l'Université de Picardie à Amiens. Elle présente des caractéristiques de premier intérêt pour la recherche sur les traitements automatiques. La langue picarde, d'une vitalité non négligeable, dispose d'une littérature assez abondante et de très nombreux dictionnaires et glossaires. Mais elle ne possède pas de standard, ni linguistique, ni graphique. La langue est donc très variante. La base de données, de nature littéraire, d'environ 5 millions d'occurrences, est accessible en ligne au moyen d'un outil d'interrogation paramétrable : non seulement il permet la restriction du corpus de travail (lieux, dates, genres), mais il permet une recherche tenant compte d'équivalences phonétiques et d'équivalences dialectales. Il est ouvert à des évolutions en termes de balisage, en particulier dans le cadre d'un projet ANR portant sur trois langues régionales simultanément (picard, alsacien, occitan).

>> Consultez l'article sur le site de l'Association pour le Traitement Automatique des Langues (ATALA)