000 02242cam a2200397 4500500
005 20250112020231.0
041 _afre
042 _adc
100 1 0 _aAndré, Jacques
_eauthor
245 0 0 _aNumérisation et codage des caractères de livres anciens
260 _c2003.
500 _a59
520 _aRésuméLa numérisation des livres anciens n’a pas été abordée aussi bien que celle des ouvrages manuscrits anciens, du moins en ce qui concerne les caractères. Or, avant de faire de la reconnaissance de caractères, encore faut-il avoir un certaine connaissance de ceux-ci. Par ailleurs, restituer un ouvrage avec ses caractéristiques typographiques peut induire des recherches qui sinon seraient impossibles. Nous présentons alors le projet Cassetin dont le but est de faire un inventaire des caractères d’imprimerie utilisés depuis le XVe siècle et de proposer une normalisation de leur codage (sous forme d’entités ou de caractères au sens d’Unicode) de façon à rendre portables les sorties d’OCR.
520 _aDigitalization of ancient books is far less concerned with characters than digitalization of ancient manuscripts. However, before recognition you need cognition. Furthermore, new researches may be launched from texts marked with typographic tags and would be quite impossible without the actually used types. The Cassetin project is proposed to make the inventory of types used from the 15th century and to establish an encoding (either as entities or as Unicode codes when available). This is a way to make OCRs’ output more portable.
690 _acaractère
690 _atypographie
690 _anormes
690 _aprojet Cassetin
690 _acodage
690 _aglyphe
690 _alivres anciens
690 _aUnicode
690 _aligatures
690 _aOCR
690 _aencoding
690 _aglyph
690 _astandard
690 _aancient books
690 _aligature
690 _aCassetin project
690 _aUnicode
690 _acharacters
690 _aOCR
786 0 _nDocument numérique | 7 | 3 | 2003-09-01 | p. 127-142 | 1279-5127
856 4 1 _uhttps://shs.cairn.info/revue-document-numerique-2003-3-page-127?lang=fr
999 _c130797
_d130797