Traitement automatique de l’amazighe : problématique de l’étiquetage morphosyntaxique

Amri, Samir

Traitement automatique de l’amazighe : problématique de l’étiquetage morphosyntaxique - 2018.


20

L’étiquetage des textes est une tâche très importante pour le traitement automatique du langage. Il est utilisé dans plusieurs applications : l’analyse morphologique et syntaxique des textes, l’indexation, la recherche documentaire, les modèles de langage probabilistes (modèles n-classes), etc. Dans cet article, nous avons étudié des systèmes d’étiquetage morpho-syntaxique de la langue amazighe en utilisant essentiellement les modèles probabilistes, et ceci pour construire un corpus de référence étiqueté et représentant les principales difficultés grammaticales rencontrées en langue amazighe d’une manière générale. Pour la première phase de mise en œuvre de l’étiqueteur morphosyntaxique, nous avons utilisé un corpus d’apprentissage étiqueté manuellement de 60K jetons en utilisant un jeu de 28 étiquettes de nature morphosyntaxique. Ensuite, nous proposons des voies pour l’amélioration de la tâche d’étiquetage morphosyntaxique amazighe tant au niveau des ressources linguistiques qu’au niveau des approches et des outils.

PLUDOC

PLUDOC est la plateforme unique et centralisée de gestion des bibliothèques physiques et numériques de Guinée administré par le CEDUST. Elle est la plus grande base de données de ressources documentaires pour les Étudiants, Enseignants chercheurs et Chercheurs de Guinée.

Adresse

627 919 101/664 919 101

25 boulevard du commerce
Kaloum, Conakry, Guinée

Réseaux sociaux

Powered by Netsen Group @ 2025