Image de Google Jackets
Vue normale Vue MARC vue ISBD

Exploitation de l’échelle d’écriture pour améliorer la reconnaissance automatique des textes manuscrits arabes

Par : Contributeur(s) : Type de matériel : TexteTexteLangue : français Détails de publication : 2016. Sujet(s) : Ressources en ligne : Abrégé : Plusieurs facteurs inhérents à l’écriture augmentent la complexité de la reconnaissance automatique de documents manuscrits, comme la taille de l’écriture. Dans ce travail nous nous intéressons à la prise en compte de tels facteurs dans la modélisation afin d’améliorer la performance des systèmes automatiques. Les expérimentations ont été conduites sur des textes manuscrits arabes extraits de l’une des plus grandes bases étiquetées de documents manuscrits arabes, la base de données NIST-OpenHaRT qui inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons plusieurs approches pour faire face à ces variations lors des deux phases d’apprentissage et de reconnaissance. Les premières expérimentations montrent que la reconnaissance est largement affectée par la taille d’écriture. Pour prendre en compte ce paramètre nous proposons de classifier les données en trois classes selon la taille. En phase de reconnaissance, nous avons redimensionné chaque donnée de test à plusieurs tailles prédéfinies, puis nous avons combiné les scores de reconnaissance associés à chacune des tailles. Cette approche a permis des gains notables de performance de deux systèmes de reconnaissance, HMM et BLSTM. De plus, nous avons intégré des données artificiellement redimensionnées pour adapter les modèles HMM à différentes échelles. Nous avons aussi obtenu des gains de performance par deux méthodes différentes de combinaison (ROVER, treillis) des résultats des modèles adaptés. Nous fournissons les résultats de reconnaissance obtenus qui montrent les avantages de l’exploitation de la taille d’écriture.Abrégé : Several inherent factors increase the complexity of automatic recognition of handwritten documents, such as the size of writing. In this work we are interested in considering such factors in modeling, to improve the performance of automatic systems. The experiments were conducted on Arabic handwritten documents from one of the largest labeled Arabic handwriting databases, NIST-OpenHaRT. The database includes large inter- and intra- variability in the text size. We propose several approaches to deal with these changes in both training and recognition phases. The first experiments show that the recognition is largely affected by the writing size. To account for this parameter, we propose to classify data into three classes according to the writing size. In the recognition phase, we have resized each text-line image into several versions of predefined sizes, then we combined the recognition scores for each size. This approach has significant performance gains for both a HMM-based and a BLSTM-based recognition systems. In addition, we integrated synthetic data to adapt HMM models at different scales. We also obtained performance gains by two different combination methods (ROVER, trellis) on the adapted models results. We provide the obtained recognition results showing the benefits of exploiting the writing size.
Tags de cette bibliothèque : Pas de tags pour ce titre. Connectez-vous pour ajouter des tags.
Evaluations
    Classement moyen : 0.0 (0 votes)
Nous n'avons pas d'exemplaire de ce document

10

Plusieurs facteurs inhérents à l’écriture augmentent la complexité de la reconnaissance automatique de documents manuscrits, comme la taille de l’écriture. Dans ce travail nous nous intéressons à la prise en compte de tels facteurs dans la modélisation afin d’améliorer la performance des systèmes automatiques. Les expérimentations ont été conduites sur des textes manuscrits arabes extraits de l’une des plus grandes bases étiquetées de documents manuscrits arabes, la base de données NIST-OpenHaRT qui inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons plusieurs approches pour faire face à ces variations lors des deux phases d’apprentissage et de reconnaissance. Les premières expérimentations montrent que la reconnaissance est largement affectée par la taille d’écriture. Pour prendre en compte ce paramètre nous proposons de classifier les données en trois classes selon la taille. En phase de reconnaissance, nous avons redimensionné chaque donnée de test à plusieurs tailles prédéfinies, puis nous avons combiné les scores de reconnaissance associés à chacune des tailles. Cette approche a permis des gains notables de performance de deux systèmes de reconnaissance, HMM et BLSTM. De plus, nous avons intégré des données artificiellement redimensionnées pour adapter les modèles HMM à différentes échelles. Nous avons aussi obtenu des gains de performance par deux méthodes différentes de combinaison (ROVER, treillis) des résultats des modèles adaptés. Nous fournissons les résultats de reconnaissance obtenus qui montrent les avantages de l’exploitation de la taille d’écriture.

Several inherent factors increase the complexity of automatic recognition of handwritten documents, such as the size of writing. In this work we are interested in considering such factors in modeling, to improve the performance of automatic systems. The experiments were conducted on Arabic handwritten documents from one of the largest labeled Arabic handwriting databases, NIST-OpenHaRT. The database includes large inter- and intra- variability in the text size. We propose several approaches to deal with these changes in both training and recognition phases. The first experiments show that the recognition is largely affected by the writing size. To account for this parameter, we propose to classify data into three classes according to the writing size. In the recognition phase, we have resized each text-line image into several versions of predefined sizes, then we combined the recognition scores for each size. This approach has significant performance gains for both a HMM-based and a BLSTM-based recognition systems. In addition, we integrated synthetic data to adapt HMM models at different scales. We also obtained performance gains by two different combination methods (ROVER, trellis) on the adapted models results. We provide the obtained recognition results showing the benefits of exploiting the writing size.

PLUDOC

PLUDOC est la plateforme unique et centralisée de gestion des bibliothèques physiques et numériques de Guinée administré par le CEDUST. Elle est la plus grande base de données de ressources documentaires pour les Étudiants, Enseignants chercheurs et Chercheurs de Guinée.

Adresse

627 919 101/664 919 101

25 boulevard du commerce
Kaloum, Conakry, Guinée

Réseaux sociaux

Powered by Netsen Group @ 2025