000 03046cam a2200289 4500500
005 20250118082117.0
041 _afre
042 _adc
100 1 0 _aJean, Pierre-Antoine
_eauthor
700 1 0 _a Harispe, Sébastien
_eauthor
700 1 0 _a Ranwez, Sylvie
_eauthor
700 1 0 _a Bellot, Patrice
_eauthor
700 1 0 _a Montmain, Jacky
_eauthor
245 0 0 _aUn modèle probabiliste pour la détection de l’incertitude dans le langage naturel
260 _c2016.
500 _a8
520 _aParce qu’elle conditionne la confiance que l’on peut avoir dans certaines affirmations, la détection de l’incertitude dans le langage naturel constitue l’un des enjeux majeurs du développement de systèmes exploitant l’analyse de textes e.g. questions-réponses, raisonnement approché, enrichissement de bases de connaissances. Après une synthèse des différentes classifications de l’incertitude et des méthodes de détection correspondantes, cet article introduit une approche supervisée et générique de détection de l’incertitude. Celle-ci se base sur une analyse statistique de différentes caractéristiques lexicales et syntaxiques afin de construire une représentation vectorielle d’une phrase utilisée ensuite dans un processus de classification. L’évaluation que nous proposons tient compte des différentes dimensions de l’incertitude et de la nature des textes. Les résultats obtenus sur différents jeux de validation soulignent la performance globale de la méthode proposée et permettent d’envisager l’utilisation de cette méthode dans un contexte plus global d’extraction et d’inférence de connaissances.
520 _aUncertainty influences the confidence that we have in some affirmations. That is why uncertainty detection is a cornerstone of the development of Natural Language Processing applications e.g. question-answering, approximate reasoning, knowledge bases population. This article proposes an overview of several contributions and classifications defining the concept of uncertainty expressions in natural language, and their related detection methods that have been proposed so far. A new supervised and generic approach is next introduced for this specific task ; it is based on the statistical analysis of multiple lexical and syntactic features used to characterize sentences through vector-based representations that can be analyzed by proven classification methods. The global performance of our approach is demonstrated and discussed with regard to various dimensions of uncertainty and text specificities.
690 _aclassification binaire
690 _amodèle supervisé
690 _adétection de l’incertitude linguistique
690 _asupervised model
690 _abianary classification
690 _auncertainty detection in natural language
786 0 _nDocument numérique | 19 | 2 | 2016-12-21 | p. 53-73 | 1279-5127
856 4 1 _uhttps://shs.cairn.info/revue-document-numerique-2016-2-page-53?lang=fr&redirect-ssocas=7080
999 _c370716
_d370716