Image de Google Jackets
Vue normale Vue MARC vue ISBD

Construction automatique d'un lexique de n-grammes pour la fouille d'opinion

Par : Type de matériel : TexteTexteLangue : français Détails de publication : 2014. Sujet(s) : Ressources en ligne : Abrégé : De nombreuses méthodes automatiques de fouille d’opinion s’appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques ont été développées ces dix dernières années et leur efficacité a été confirmée. La présente recherche propose d’étendre de telles procédures à l’analyse de n-grammes de mots et de déterminer les éventuels bénéfices apportés par cette extension. Une expérience menée sur la base d’un vaste corpus de critiques de films indique non seulement que les n-grammes sont des indicateurs plus fiables de polarité que les mots simples, mais aussi que leur combinaison avec ces mêmes mots permet une meilleure prédiction de la polarité de textes. Soulignant les limitations de la présente étude, la conclusion propose plusieurs pistes pour des recherches futures.Abrégé : Many automatic opinion mining methods make use of a lexicon in which each word is associated with a degree of polarity. The construction of such a kind of linguistic resources has become an important field of research in computational linguistics. Automatic techniques have been developed over the last decade and their effectiveness has been confirmed. This paper proposes to extend these techniques to the analysis of n-grams of words and to determine the potential benefits of this extension. An experiment based on a large corpus of movie reviews indicates that n-grams are more reliable indicators of polarity than words and that their combination with these words allows a better prediction of the polarity of texts. Highlighting the limitations of this study, the conclusion discuses some suggestions for future research.
Tags de cette bibliothèque : Pas de tags pour ce titre. Connectez-vous pour ajouter des tags.
Evaluations
    Classement moyen : 0.0 (0 votes)
Nous n'avons pas d'exemplaire de ce document

71

De nombreuses méthodes automatiques de fouille d’opinion s’appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques ont été développées ces dix dernières années et leur efficacité a été confirmée. La présente recherche propose d’étendre de telles procédures à l’analyse de n-grammes de mots et de déterminer les éventuels bénéfices apportés par cette extension. Une expérience menée sur la base d’un vaste corpus de critiques de films indique non seulement que les n-grammes sont des indicateurs plus fiables de polarité que les mots simples, mais aussi que leur combinaison avec ces mêmes mots permet une meilleure prédiction de la polarité de textes. Soulignant les limitations de la présente étude, la conclusion propose plusieurs pistes pour des recherches futures.

Many automatic opinion mining methods make use of a lexicon in which each word is associated with a degree of polarity. The construction of such a kind of linguistic resources has become an important field of research in computational linguistics. Automatic techniques have been developed over the last decade and their effectiveness has been confirmed. This paper proposes to extend these techniques to the analysis of n-grams of words and to determine the potential benefits of this extension. An experiment based on a large corpus of movie reviews indicates that n-grams are more reliable indicators of polarity than words and that their combination with these words allows a better prediction of the polarity of texts. Highlighting the limitations of this study, the conclusion discuses some suggestions for future research.

PLUDOC

PLUDOC est la plateforme unique et centralisée de gestion des bibliothèques physiques et numériques de Guinée administré par le CEDUST. Elle est la plus grande base de données de ressources documentaires pour les Étudiants, Enseignants chercheurs et Chercheurs de Guinée.

Adresse

627 919 101/664 919 101

25 boulevard du commerce
Kaloum, Conakry, Guinée

Réseaux sociaux

Powered by Netsen Group @ 2025