Apprentissage automatique non supervisé et renseignement : Une analyse de rapports du Kenya colonial
Type de matériel :
52
Cet article applique une classification « zero-shot » aux rapports de services de renseignement déclassifiés par le gouvernement kenyan et couvrant la période coloniale britannique qui a précédé la révolte des Mau Mau et l’état d’urgence de 1952. La classification « zero-shot » (catégorisant les documents sans exemples étiquetés des catégories) est devenue fonctionnelle avec l’arrivée des grands modèles de langage (LLM), une avancée récente dans le domaine du traitement automatique des langues (TAL). Cet article démontre comment un apprentissage automatique non supervisé peut être utilisé par les chercheurs et les praticiens du renseignement pour analyser des milliers de rapports de services de renseignement sans rapports étiquetés et données d’entraînement, ou sans la capacité d’entraîner des modèles traditionnels de classification de documents.
This article applies zero-shot classification to intelligence reports declassified by the Kenyan government covering the British colonial period prior to the 1952 Mau Mau uprising and State of Emergency. Zero-shot classification—categorizing documents without any labelled examples of the categories—only became practical with the advent of large language models (LLMs), a recent development in the field of natural language processing (NLP). The article demonstrates how unsupervised machine learning can be utilized by intelligence scholars and practitioners to analyze thousands of intelligence reports without any labelled reports with no training data or the ability to train traditional document classifier models.
Réseaux sociaux