Modèles de langue pour la détection d'opinions dans les blogs
Type de matériel :
76
Cet article décrit une approche de recherche de documents pertinents visà-vis d’une requête et exprimant une opinion. Afin de détecter si un document est porteur d’opinion (i.e. comporte de l’information subjective), nous proposons de le comparer à des sources d’information qui comportent du contenu de type opinion. L’intuition derrière cela est la suivante : un document ayant une similarité forte avec des sources d’opinions, est vraisemblablement porteur d’opinion. Pour mesurer cette similarité, nous exploitons des modèles de langue. Nous modélisons le document et la source (référence) porteuse d’opinions par des modèles de langue, nous évaluons ensuite la similarité de ces modèles. Plusieurs expérimentations ont été réalisées sur des collections issues de TREC. Les résultats obtenus valident notre intuition.
This article describes an opinion retrieval approach which aims at retrieving relevant and opinionated documents w.r.t. a query. To detect whether a document is opinionated (i.e. contain subjective information), we compare it with opinionated sources that contain subjective information. The intuition is the following, a document having a strong similarity with opinionated sources is likely to be opinionated. To measure this similarity we use language models. We model the document and the source of opinions using language models, we estimate then the similarity of these two models. Several experiments were carried out on TREC collection. The results showed the effectiveness of our approach.
Réseaux sociaux