Numérisation et codage des caractères de livres anciens

André, Jacques

Numérisation et codage des caractères de livres anciens - 2003.


59

RésuméLa numérisation des livres anciens n’a pas été abordée aussi bien que celle des ouvrages manuscrits anciens, du moins en ce qui concerne les caractères. Or, avant de faire de la reconnaissance de caractères, encore faut-il avoir un certaine connaissance de ceux-ci. Par ailleurs, restituer un ouvrage avec ses caractéristiques typographiques peut induire des recherches qui sinon seraient impossibles. Nous présentons alors le projet Cassetin dont le but est de faire un inventaire des caractères d’imprimerie utilisés depuis le XVe siècle et de proposer une normalisation de leur codage (sous forme d’entités ou de caractères au sens d’Unicode) de façon à rendre portables les sorties d’OCR. Digitalization of ancient books is far less concerned with characters than digitalization of ancient manuscripts. However, before recognition you need cognition. Furthermore, new researches may be launched from texts marked with typographic tags and would be quite impossible without the actually used types. The Cassetin project is proposed to make the inventory of types used from the 15th century and to establish an encoding (either as entities or as Unicode codes when available). This is a way to make OCRs’ output more portable.

PLUDOC

PLUDOC est la plateforme unique et centralisée de gestion des bibliothèques physiques et numériques de Guinée administré par le CEDUST. Elle est la plus grande base de données de ressources documentaires pour les Étudiants, Enseignants chercheurs et Chercheurs de Guinée.

Adresse

627 919 101/664 919 101

25 boulevard du commerce
Kaloum, Conakry, Guinée

Réseaux sociaux

Powered by Netsen Group @ 2025