Traitements automatiques pour la migration de documents numériques vers XML (notice n° 402187)

détails MARC
000 -LEADER
fixed length control field 02208cam a2200253 4500500
005 - DATE AND TIME OF LATEST TRANSACTION
control field 20250119075108.0
041 ## - LANGUAGE CODE
Language code of text/sound track or separate title fre
042 ## - AUTHENTICATION CODE
Authentication code dc
100 10 - MAIN ENTRY--PERSONAL NAME
Personal name Fuselier, Jérôme
Relator term author
245 00 - TITLE STATEMENT
Title Traitements automatiques pour la migration de documents numériques vers XML
260 ## - PUBLICATION, DISTRIBUTION, ETC.
Date of publication, distribution, etc. 2006.<br/>
500 ## - GENERAL NOTE
General note 7
520 ## - SUMMARY, ETC.
Summary, etc. RésuméDe plus en plus de sociétés migrent leur système de gestion de fonds documentaires vers le formalisme XML, le standard industriel pour l’échange de données. Afin de réduire les coûts de la migration, nous proposons une approche pour réaliser des conversions de documents orientés présentation vers des documents sémantiques. L’intérêt de notre méthode consiste à automatiser le processus de conversion en utilisant des techniques d’apprentissage supervisé pour apprendre un modèle de conversion pour une collection de documents. Nous décomposons la conversion en deux étapes pour simplifier le problème, une première étape d’annotation sémantique et une seconde étape de structuration sémantique du document qui respecte le schéma XML décrivant la classe des documents finaux.
520 ## - SUMMARY, ETC.
Summary, etc. More and more companies are migrating their legacy document management systems toward XML formalism which is the industrial standard for data exchange. In order to reduce the migration cost we propose an approach aimed at automating the conversion of layout-oriented documents to semantic-oriented annotations. The conversion module uses supervised machine learning techniques to learn a conversion model for a collection of documents. The conversion is achieved through a semantic annotation of the document content and structuring the annotations, accordingly to a XML schema that specify the class of target documents.
690 ## - LOCAL SUBJECT ADDED ENTRY--TOPICAL TERM (OCLC, RLIN)
Topical term or geographic name as entry element XML
690 ## - LOCAL SUBJECT ADDED ENTRY--TOPICAL TERM (OCLC, RLIN)
Topical term or geographic name as entry element apprentissage supervisé
690 ## - LOCAL SUBJECT ADDED ENTRY--TOPICAL TERM (OCLC, RLIN)
Topical term or geographic name as entry element extraction d'informations
690 ## - LOCAL SUBJECT ADDED ENTRY--TOPICAL TERM (OCLC, RLIN)
Topical term or geographic name as entry element information extraction
690 ## - LOCAL SUBJECT ADDED ENTRY--TOPICAL TERM (OCLC, RLIN)
Topical term or geographic name as entry element machine learning
690 ## - LOCAL SUBJECT ADDED ENTRY--TOPICAL TERM (OCLC, RLIN)
Topical term or geographic name as entry element XML
700 10 - ADDED ENTRY--PERSONAL NAME
Personal name Chidlovskii, Boris
Relator term author
786 0# - DATA SOURCE ENTRY
Note Document numérique | 9 | 1 | 2006-03-01 | p. 9-24 | 1279-5127
856 41 - ELECTRONIC LOCATION AND ACCESS
Uniform Resource Identifier <a href="https://shs.cairn.info/revue-document-numerique-2006-1-page-9?lang=fr&redirect-ssocas=7080">https://shs.cairn.info/revue-document-numerique-2006-1-page-9?lang=fr&redirect-ssocas=7080</a>

Pas d'exemplaire disponible.

PLUDOC

PLUDOC est la plateforme unique et centralisée de gestion des bibliothèques physiques et numériques de Guinée administré par le CEDUST. Elle est la plus grande base de données de ressources documentaires pour les Étudiants, Enseignants chercheurs et Chercheurs de Guinée.

Adresse

627 919 101/664 919 101

25 boulevard du commerce
Kaloum, Conakry, Guinée

Réseaux sociaux

Powered by Netsen Group @ 2025