Image de Google Jackets
Vue normale Vue MARC vue ISBD

La structure thème–rhème pour l’ordonnancement de documents en recherche d’information

Par : Contributeur(s) : Type de matériel : TexteTexteLangue : français Détails de publication : 2017. Sujet(s) : Ressources en ligne : Abrégé : La recherche d’information fait souvent l’hypothèse que les documents pertinents sont « à propos de la requête ; la requête est ainsi supposée refléter le besoin d’information de l’utilisateur de façon appropriée. La plupart des moteurs de recherche fait l’hypothèse que le fait d’être « à propos de peut être mesuré par l’appariement des termes du document et ceux de la requête selon une représentation par sac de mots. Cependant, les modèles existants ne sont pas capables de capter la distribution entre l’information déjà connue et l’information nouvelle apportée par l’énoncé. L’objectif principal de ce papier est de proposer l’utilisation de la structure thème–rhème pour le ré-ordonnancement de documents en recherche d’information. Nous avons analysé manuellement la structure thème–rhème des documents issus de trois collections : Wikipédia, TREC Robust et WT10G. Grâce à cette analyse, nous avons introduit une méthode complètement automatique pour annoter la structure informationnelle. Elle s’appuie sur l’hypothèse que le thème a tendance à être positionné au début des phrases. La structure thème–rhème est identifiée automatiquement à partir des premiers documents retrouvés qui sont ré-ordonnés selon cette structure intégrée dans le formalisme BM25F. Cette méthode n’exige qu’une analyse syntaxique de surface, à savoir le découpage en phrases et le balisage des parties de discours. L’évaluation sur les collections TREC montre que notre méthode améliore significativement les résultats de recherche d’information par rapport aux systèmes de l’état de l’art.Abrégé : In this paper, we propose a novel approach for document re-ranking based on information structure of texts. In contrast to traditional information retrieval models based on bag-of-words representation that assume relevant documents be about the query, we rather try to capture document relevance by distinguishing the topic of a text from what is said about the topic (comment) in the text. We introduce a completely automatic method for topic-comment structure extraction and a re-ranking algorithm based on this structure. The evaluation on TREC collections shows that the method significantly outperforms strong baselines.
Tags de cette bibliothèque : Pas de tags pour ce titre. Connectez-vous pour ajouter des tags.
Evaluations
    Classement moyen : 0.0 (0 votes)
Nous n'avons pas d'exemplaire de ce document

15

La recherche d’information fait souvent l’hypothèse que les documents pertinents sont « à propos de la requête ; la requête est ainsi supposée refléter le besoin d’information de l’utilisateur de façon appropriée. La plupart des moteurs de recherche fait l’hypothèse que le fait d’être « à propos de peut être mesuré par l’appariement des termes du document et ceux de la requête selon une représentation par sac de mots. Cependant, les modèles existants ne sont pas capables de capter la distribution entre l’information déjà connue et l’information nouvelle apportée par l’énoncé. L’objectif principal de ce papier est de proposer l’utilisation de la structure thème–rhème pour le ré-ordonnancement de documents en recherche d’information. Nous avons analysé manuellement la structure thème–rhème des documents issus de trois collections : Wikipédia, TREC Robust et WT10G. Grâce à cette analyse, nous avons introduit une méthode complètement automatique pour annoter la structure informationnelle. Elle s’appuie sur l’hypothèse que le thème a tendance à être positionné au début des phrases. La structure thème–rhème est identifiée automatiquement à partir des premiers documents retrouvés qui sont ré-ordonnés selon cette structure intégrée dans le formalisme BM25F. Cette méthode n’exige qu’une analyse syntaxique de surface, à savoir le découpage en phrases et le balisage des parties de discours. L’évaluation sur les collections TREC montre que notre méthode améliore significativement les résultats de recherche d’information par rapport aux systèmes de l’état de l’art.

In this paper, we propose a novel approach for document re-ranking based on information structure of texts. In contrast to traditional information retrieval models based on bag-of-words representation that assume relevant documents be about the query, we rather try to capture document relevance by distinguishing the topic of a text from what is said about the topic (comment) in the text. We introduce a completely automatic method for topic-comment structure extraction and a re-ranking algorithm based on this structure. The evaluation on TREC collections shows that the method significantly outperforms strong baselines.

PLUDOC

PLUDOC est la plateforme unique et centralisée de gestion des bibliothèques physiques et numériques de Guinée administré par le CEDUST. Elle est la plus grande base de données de ressources documentaires pour les Étudiants, Enseignants chercheurs et Chercheurs de Guinée.

Adresse

627 919 101/664 919 101

25 boulevard du commerce
Kaloum, Conakry, Guinée

Réseaux sociaux

Powered by Netsen Group @ 2025