Construction et utilisation de contextes autour des nœuds d'un hypertexte pour la recherche d'information
Type de matériel :
90
RésuméNous faisons l’hypothèse que la mise sous forme hypertexte d’un document atomise l’information dans le sens où les nœuds de l’hypertexte qui sont créés ne sont pas auto-suffisants pour pouvoir être appréhendés. Sous cette hypothèse, le contenu seul du nœud n’est pas suffisant pour l’indexer dans un but de l’insérer dans un système de recherche d’information. Nous avons implémenté et testé une méthode de construction de contextes autour des nœuds d’un hypertexte en utilisant une méthode de classification automatique. Cette dernière est basée sur une mesure de similarité entre les nœuds prenant en compte à la fois les aspects structurels de l’hypertexte, à savoir les liens entre les nœuds, et le contenu textuel des nœuds. Notre système de recherche d’information indexe à la fois les nœuds et leurs contextes. Le modèle de requête que nous utilisons est à deux niveaux: niveau sujet et niveau contexte.
We assume that the nodes of an hypertext are not always self-contained because when some information is made available in a hypertextual form, it is split in many nodes. Under this hypothesis the sole content of a node is not sufficient to index it in order to insert it in an information retrieval system. Using a clustering method, we have implemented and tested a context building method around the nodes of an hypertext. The similarity function between the nodes is based both on hypertext structural clues – the hyperlinks – and the textual content of the nodes. Our information retrieval system indexes both the nodes and their contexts. We use two level queries: the subject level and the context level.
Réseaux sociaux