Ce que le big data fait à l’analyse sociologique des textes
Type de matériel :
- éseaux sémantiques
- races numériques
- I
- B
- T
- L
- ntelligence artificielle
- É
- C
- exicométrie
- R
- raitement automatique de la langue
- orpus textuels
- pistémologie
- ig data
- emantic networks
- D
- B
- T
- L
- exicometry
- E
- S
- pistemology
- A
- extual corpora
- rtificial intelligence
- igital traces
- utomatic language processing
- ig data
59
ResumeDepuis les années 2000, de nouvelles techniques d’analyse textuelle font leur apparition au croisement des mondes informatiques, de l’intelligence artificielle et du traitement automatique de la langue. Bien qu’élaborées en dehors de toute préoccupation sociologique, ces techniques sont aujourd’hui mobilisées par des chercheurs – sociologues comme non-sociologues – dans le but de renouveler la connaissance du social en tirant parti du volume considérable de matériaux textuels aujourd’hui disponibles. En dressant un panorama des enquêtes sociologiques qui reposent sur la mise en données et le traitement quantitatif de corpus textuels, cet article identifie à quelles conditions ces approches peuvent constituer une ressource pour l’enquête sociologique. Les trois conditions qui émergent de notre analyse concernent : 1) la connaissance du contexte de production des inscriptions textuelles ; 2) l’intégration à l’enquête de données extérieures au texte lui-même ; 3) l’ajustement des algorithmes au raisonnement sociologique.
What Big data does to the sociological analysis of texts? A review of recent researchSince the 2000s, new techniques of text analysis have emerged at the crossroads of computer science, artificial intelligence and natural language processing. Although they were developed independently of any sociological theory, these methods are now being used by researchers—sociologists and non-sociologists alike—to produce new knowledge of the social domain exploiting the massive volume of textual materials now available. By providing an overview of recent sociological investigations that are based on quantitative analyses of textual corpora, this article identifies three conditions under which these approaches can be a resource for sociological inquiry. The three conditions that emerge from our analysis concern: 1) knowledge of the context of production of textual inscriptions; 2) integration of external data into the study itself; 3) the adaptation of algorithms for sociological reasoning.
ResumenDesde los años 2000 han ido apareciendo nuevas técnicas de análisis textual, en la encrucijada entre la informática, la inteligencia artificial y el tratamiento automatizado de la lengua. Aunque han sido elaboradas fuera de cualquier preocupación sociológica, estas técnicas suelen ser utilizadas por investigadores – tanto sociólogos como no sociólogos – para renovar el conocimiento de lo social sacando partido del volumen considerable de materiales textuales del que se dispone hoy en día. A través de un panorama de las encuestas sociológicas basadas en la puesta en datos y en el tratamiento cuantitativo de corpus textuales, se identifica en este artículo en qué condiciones estos métodos pueden pasar a constituir un recurso para la encuesta sociológica. Las tres condiciones que emergen al final de nuestro análisis tienen que ver con: 1) el conocimiento del contexto de producción de las inscripciones textuales; 2) la integración en la encuesta de datos ajenos al propio texto; 3) la adecuación de los algoritmos al razonamiento sociológico.
ZusammenfassungSeit Beginn der Jahre 2000 erscheinen neue Techniken der Textanalyse an der Kreuzung der Welt der Informatik, der künstlichen Intelligenz und der automatischen Sprachverarbeitung. Obwohl sie außerhalb aller soziologischen Absichten erarbeitet wurden, werden diese Techniken heute in der sowohl soziologischen als auch nicht soziologischen Forschung eingesetzt, um die Kenntnis des Sozialen mithilfe des jetzt verfügbaren umfangreichen Textmaterials zu erneuern. Der Artikel stellt eine Überschau der soziologischen Umfragen zusammen, die sich auf die Verdatung und die quantitative Behandlung der Textkorpora stützt und identifiziert so, unter welchen Bedingungen diese Ansätze eine Ressource für die Sozialforschung darstellen können. Drei Bedingungen zeichnen sich aus unserer Analyse ab: 1) die Kenntnis des Produktionskontexts der Texteinträge: 2) die Integrierung in die Forschung der Daten außerhalb des eigentlichen Textes; 3) die Anpassung der Algorithmen an die soziologische Argumentation.
Réseaux sociaux