Exploitation de l’échelle d’écriture pour améliorer la reconnaissance automatique des textes manuscrits arabes
Type de matériel :
10
Plusieurs facteurs inhérents à l’écriture augmentent la complexité de la reconnaissance automatique de documents manuscrits, comme la taille de l’écriture. Dans ce travail nous nous intéressons à la prise en compte de tels facteurs dans la modélisation afin d’améliorer la performance des systèmes automatiques. Les expérimentations ont été conduites sur des textes manuscrits arabes extraits de l’une des plus grandes bases étiquetées de documents manuscrits arabes, la base de données NIST-OpenHaRT qui inclut de grandes variabilités dans la taille du texte inter et intra mots et lignes. Nous proposons plusieurs approches pour faire face à ces variations lors des deux phases d’apprentissage et de reconnaissance. Les premières expérimentations montrent que la reconnaissance est largement affectée par la taille d’écriture. Pour prendre en compte ce paramètre nous proposons de classifier les données en trois classes selon la taille. En phase de reconnaissance, nous avons redimensionné chaque donnée de test à plusieurs tailles prédéfinies, puis nous avons combiné les scores de reconnaissance associés à chacune des tailles. Cette approche a permis des gains notables de performance de deux systèmes de reconnaissance, HMM et BLSTM. De plus, nous avons intégré des données artificiellement redimensionnées pour adapter les modèles HMM à différentes échelles. Nous avons aussi obtenu des gains de performance par deux méthodes différentes de combinaison (ROVER, treillis) des résultats des modèles adaptés. Nous fournissons les résultats de reconnaissance obtenus qui montrent les avantages de l’exploitation de la taille d’écriture.
Several inherent factors increase the complexity of automatic recognition of handwritten documents, such as the size of writing. In this work we are interested in considering such factors in modeling, to improve the performance of automatic systems. The experiments were conducted on Arabic handwritten documents from one of the largest labeled Arabic handwriting databases, NIST-OpenHaRT. The database includes large inter- and intra- variability in the text size. We propose several approaches to deal with these changes in both training and recognition phases. The first experiments show that the recognition is largely affected by the writing size. To account for this parameter, we propose to classify data into three classes according to the writing size. In the recognition phase, we have resized each text-line image into several versions of predefined sizes, then we combined the recognition scores for each size. This approach has significant performance gains for both a HMM-based and a BLSTM-based recognition systems. In addition, we integrated synthetic data to adapt HMM models at different scales. We also obtained performance gains by two different combination methods (ROVER, trellis) on the adapted models results. We provide the obtained recognition results showing the benefits of exploiting the writing size.
Réseaux sociaux