L’objectif de l’équipe SMarT est de développer des modèles de représentation du langage pour les systèmes de traduction automatique et de reconnaissance de la parole.

Cette modélisation consiste à utiliser des méthodes mathématiques pour identifier, extraire et proposer des associations entre motifs langagiers servant à la traduction et à la reconnaissance de la parole.

Les langues sont étudiées à travers les corpus monolingues, parallèles ou comparables pour des langues peu dotées (les dialectes arabes), l’arabe, le français et l’anglais. A l’heure actuelle on se restreint à ces langues, mais rien ne nous empêche d’envisager d’autres puisque la modélisation proposée n’est pas fondée sur une étude linguistique mais statistique.

Mots-clés : Modélisation statistique du langage, traduction automatique, étude des langues peu dotées, modélisation de l’estimation de la qualité des systèmes, algorithmes évolutifs, traduction de la parole, fouille de corpus comparables.


This page may have a more recent version on pmwiki.org: PmWiki:ResearchTopics, and a talk page: PmWiki:ResearchTopics-Talk.