Traitement automatique de l’amazighe : problématique de l’étiquetage morphosyntaxique
Type de matériel :
20
L’étiquetage des textes est une tâche très importante pour le traitement automatique du langage. Il est utilisé dans plusieurs applications : l’analyse morphologique et syntaxique des textes, l’indexation, la recherche documentaire, les modèles de langage probabilistes (modèles n-classes), etc. Dans cet article, nous avons étudié des systèmes d’étiquetage morpho-syntaxique de la langue amazighe en utilisant essentiellement les modèles probabilistes, et ceci pour construire un corpus de référence étiqueté et représentant les principales difficultés grammaticales rencontrées en langue amazighe d’une manière générale. Pour la première phase de mise en œuvre de l’étiqueteur morphosyntaxique, nous avons utilisé un corpus d’apprentissage étiqueté manuellement de 60K jetons en utilisant un jeu de 28 étiquettes de nature morphosyntaxique. Ensuite, nous proposons des voies pour l’amélioration de la tâche d’étiquetage morphosyntaxique amazighe tant au niveau des ressources linguistiques qu’au niveau des approches et des outils.
Réseaux sociaux