Poibeau, Thierry
Le traitement automatique des langues pour les sciences sociales
- 2015.
72
La masse de données textuelles aujourd’hui disponible permet d’envisager les sciences sociales sous un jour nouveau, dans la mesure où les textes regorgent d’éléments d’informations jamais exploités jusqu’ici. La difficulté consiste alors à accéder à la bonne information, à la « normaliser » puis à la mettre en contexte, dans la mesure où cette information doit être formatée pour être exploitable par d’autres outils automatiques. Cet article présente un panorama des techniques de traitement automatique des langues utilisées de nos jours et examine surtout une série de réalisations concrètes, permettant de mettre en avant ce qui fonctionne, mais aussi les limites des systèmes actuels. Automatic language processing for the social sciencesMost textual data available today enable us to see the social sciences in a new light, as texts contain an abundance of as yet unexploited information. The difficulty consists in accessing the right information, in “standardizing” it and then in putting it into context, since it has to be formatted to be exploitable by other automatic tools. This article presents a range of automatic language processing techniques presently in use, and examines a set of examples that help to show not only what works but also where the limits of current systems lie.