000 02816cam a2200325 4500500
005 20250112020431.0
041 _afre
042 _adc
100 1 0 _aCoüasnon, Bertrand
_eauthor
700 1 0 _a Camillerapp, Jean
_eauthor
245 0 0 _aUne méthode générique de rétroconversion de documents pour la constitution de dossiers numériques
260 _c2002.
500 _a26
520 _aRésuméDans un certain nombre de cas, les dossiers numériques sont constitués par rétroconversion de documents papier. Or jusqu’à présent ces rétroconversions impliquent de développer, pour chaque type de documents, un système spécifique de reconnaissance. Nous proposons donc une approche générique, la méthode DMOS, qui permet d’engendrer le système de reconnaissance adapté à partir de la description de la structure de chaque document. Cette méthode qui a déjà été utilisée sur différents types de documents (partitions musicales, formules mathématiques...), permet entre autres de repérer les structures tabulaires contenues dans une page. Elle vient d’être validée sur plus de 5 000 fiches nominatives d’incorporation militaire du XIXe siècle. En produisant une description XML du document, la méthode permet d’appliquer ensuite d’autres traitements comme la constitution de pages d’index visuels ou le masquage de champs confidentiels.
520 _aDigital files are in many cases build by retrospective conversion of paper documents. Until now this retrospective conversion needs to develop, for each kind of document, a new recognition system from scratch. Therefore we propose in this paper a generic approach for structured document recognition: the DMOS method. With its help, we can automatically produce a new recognition system from a grammatical description of the document structure. The DMOS method has been successfully applied to produce various recognition systems: one for musical scores, one for mathematical formulae and one for table structures. It has been also validated on more than 5,000 military forms of the 19th century. By producing an XML description of the recognized form, the recognition system allows, for example, to build a visual index or to hide confidential cells.
690 _aformulaires
690 _agestion des connaissances a priori
690 _aanalyse structurelle
690 _atableaux
690 _areconnaissance de documents
690 _agrammaire
690 _atable-form
690 _asyntactic analysis
690 _adocuments analysis
690 _aa priori knowledge
690 _aprinted-form
690 _agrammar
786 0 _nDocument numérique | 6 | 1 | 2002-03-01 | p. 129-144 | 1279-5127
856 4 1 _uhttps://shs.cairn.info/revue-document-numerique-2002-1-page-129?lang=fr
999 _c131657
_d131657