Approche hybride de segmentation de pages à base d’un descripteur de traits

Felhi, Mehdi

Approche hybride de segmentation de pages à base d’un descripteur de traits - 2015.


80

Nous présentons une approche complète de segmentation de pages de documents numérisés permettant d’identifier et d’extraire les régions de texte, de lignes et de photos. L’approche est composée de deux étapes principales : la première étape consiste à détecter une éventuelle inclinaison afin d’ajuster l’image et ainsi diminuer les contraintes pour la segmentation. La deuxième étape se focalise sur une nouvelle méthode hybride pour la segmentation de pages basée sur les composantes connexes et sur l’analyse de régions. Nous décrivons d’abord notre nouvelle méthode de détection d’inclinaison. Ensuite, nous présentons notre descripteur de traits qui permet de détecter les candidats de texte et des lignes par la squelettisation de l’image du document binarisé. Un modèle de contours actifs est appliqué pour segmenter le reste de l’image en photos et arrière plan. Cette classification est vérifiée par l’étude de la variation photométrique de chacune des régions détectées. Enfin, les candidats de texte sont classifiés à l’aide de la technique du clustering du mean-shift en fonction de leurs tailles et nous présentons une approche adaptative d’analyse du profil de projection pour recueillir séparément les régions de texte horizontales et verticales. Cette méthode est appliquée pour la segmentation des images réelles des documents numérisés qui contiennent du texte, lignes et des régions de photos. Nous évaluons les performances de notre approche en la comparant avec des méthodes existantes sur des benchmarks connus. In this paper we present a full document image segmentation approach in order to identify and extract text, lines and photo regions. This approach is composed of two main steps. The first step consists in detecting a possible skew. Then, a new hybrid page segmentation approach based on connected component and region analysis is proposed. For that, we first describe our stroke descriptor that detects text and line component candidates using the skeleton of the binarized document image. Then, an active contour model is applied to segment the rest of the image into photo and background regions. This classification is verified by studying the variation of each detected region. Finally, we cluster the text candidates using mean-shift analysis technique according to their corresponding sizes and we present our multiscale projection profile approach to gather separately horizontal and vertical text regions. We evaluate the performances of our approach by comparing it to the existing methods on well-known benchmarks.

PLUDOC

PLUDOC est la plateforme unique et centralisée de gestion des bibliothèques physiques et numériques de Guinée administré par le CEDUST. Elle est la plus grande base de données de ressources documentaires pour les Étudiants, Enseignants chercheurs et Chercheurs de Guinée.

Adresse

627 919 101/664 919 101

25 boulevard du commerce
Kaloum, Conakry, Guinée

Réseaux sociaux

Powered by Netsen Group @ 2025