Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues
Type de matériel :
22
RésuméDans cet article nous présentons une approche statistique d’indexation sémantique des documents multilingues. L’approche que nous proposons est composée de trois étapes : extraction des termes, détection des concepts et détection des relations à partir des couples de concepts. Notre approche est validée par un ensemble d’expérimentations sur la collection ImageCLEFmed 2007 et une comparaison avec une approche linguistique. Nous montrons ainsi que l’approche statistique obtient des résultats équivalents à l’approche linguistique sans adapter la phase d’indexation à la langue du document.
This article presents a statistical approach of semantic indexing for multilingual documents. The proposed approach is composed of three stages: extraction of terms, detection of concepts and detection of relations from couples of terms. Our approach is validated by a set of experiments on the ImageCLEFmed 2007 collection and a comparison with a linguistic approach. The experiments show that the statistical approach obtains results equivalent to the linguistic one without adapting the indexing procedure to the document language.
Réseaux sociaux