Construction incrémentale d'une ontologie par analyse du texte et de la structure des documents
Type de matériel :
11
RésuméBIOTIM est un projet dont l’objectif est de concevoir des méthodes génériques d’analyse automatique de masses de données regroupant textes et images pour acquérir une sur-couche sémantique commune et, à partir de ce premier résultat, développer des méthodes génériques d’interrogation plurimodale des données ainsi structurées. Dans le cadre de ce projet, nous présentons une expérimentation destinée à améliorer le processus d’acquisition de connaissances grâce à une exploitation simultanée de la structure et du contenu des documents. En particulier, nous montrons comment élaborer une ontologie intermédiaire dans le domaine de la flore tropicale (famille des orchidées) et comment cette ontologie intermédiaire peut contribuer à l’obtention d’une ontologie complète du domaine.
BIOTIM is a project to design generic methods for the automatic analysis of large amounts of texts and images in order to acquire a common semantic layer and, building upon this initial result, to develop generic methods for a multi-modal examination of the structured data obtained. As part of this project we present an experiment aimed at improving the knowledge acquisition process by exploiting simultaneously both the structure and textual content of documents. In particular, we show how to build an intermediary ontology in the field of exotic flowers (orchidae family) and how this intermediary ontology represents an incremental step in in the building of a complete domain ontology.
Réseaux sociaux