Marc Wilmet, Grammaire rénovée du français. Bruxelles, De Boeck Université, 2007. ISBN10 : 2-8041-5568-4, 332 p.
Type de matériel :
TexteLangue : français Détails de publication : 2008.
Ressources en ligne : Abrégé : RésuméCet article entend rendre compte de certaines des propositions de la sémantique textuelle pour la recherche d’information et plus particulièrement pour la classification de texte par leur contenu. La première partie sera consacrée à une rétrospective de l’impact du linguistique - à travers les techniques TAL - dans le domaine de la RI. Elle sera l’occasion de faire état à la fois des résultats acquis et des approches standard de la dimension linguistique dans la problématique RI. On s’intéressera en particulier à la lente émergence de la problématique textuelle qui accompagne l’expansion du Web. Nous comptons montrer en quoi l’attention croissante suscitée par la linguistique textuelle correspond à un tournant dans la problématique de la RI sur le Web, en quoi l’approche par catégorisation des textes constitue une rupture avec les méthodes précédentes. Les deuxième et troisième parties approfondiront les conditions d’une linguistique textuelle appliquée à la RI. Nous exposerons dans un premier temps des méthodologies expérimentées dans le cadre d’un projet de filtrage des textes racistes sur Internet, puis nous présenterons certaines des recherches actuelles menées en Analyse des Données Textuelles (ADT) susceptibles, à plus ou moins court terme, d’améliorer les méthodes de la RI.Abrégé : The aim of this paper is to set out some of the proposals of text semantics for information retrieval - more specifically for content-based text classification. To start with, we will assess the contribution of linguistics to information retrieval by means of natural language processing techniques. This will give us an opportunity to look at the achievements that have been secured and to examine standard linguistic approaches to information retrieval. In particular, we will focus on the slow emergence of text considerations as the web expands. We intend to show that the ever-greater attention raised by text linguistics comes at a critical juncture in the evolution of information retrieval on the web. We will show how text categorisation is a departure from traditional approaches. The second and third parts will go into greater detail and examine the way text linguistics can apply to information retrieval. We will first lay out the methods used within the framework of a project aiming to filter racist web texts; we will then introduce some of the research currently conducted in the field of textual data analysis, which, in the near future, is liable to improve the methodology of information retrieval.
52
RésuméCet article entend rendre compte de certaines des propositions de la sémantique textuelle pour la recherche d’information et plus particulièrement pour la classification de texte par leur contenu. La première partie sera consacrée à une rétrospective de l’impact du linguistique - à travers les techniques TAL - dans le domaine de la RI. Elle sera l’occasion de faire état à la fois des résultats acquis et des approches standard de la dimension linguistique dans la problématique RI. On s’intéressera en particulier à la lente émergence de la problématique textuelle qui accompagne l’expansion du Web. Nous comptons montrer en quoi l’attention croissante suscitée par la linguistique textuelle correspond à un tournant dans la problématique de la RI sur le Web, en quoi l’approche par catégorisation des textes constitue une rupture avec les méthodes précédentes. Les deuxième et troisième parties approfondiront les conditions d’une linguistique textuelle appliquée à la RI. Nous exposerons dans un premier temps des méthodologies expérimentées dans le cadre d’un projet de filtrage des textes racistes sur Internet, puis nous présenterons certaines des recherches actuelles menées en Analyse des Données Textuelles (ADT) susceptibles, à plus ou moins court terme, d’améliorer les méthodes de la RI.
The aim of this paper is to set out some of the proposals of text semantics for information retrieval - more specifically for content-based text classification. To start with, we will assess the contribution of linguistics to information retrieval by means of natural language processing techniques. This will give us an opportunity to look at the achievements that have been secured and to examine standard linguistic approaches to information retrieval. In particular, we will focus on the slow emergence of text considerations as the web expands. We intend to show that the ever-greater attention raised by text linguistics comes at a critical juncture in the evolution of information retrieval on the web. We will show how text categorisation is a departure from traditional approaches. The second and third parts will go into greater detail and examine the way text linguistics can apply to information retrieval. We will first lay out the methods used within the framework of a project aiming to filter racist web texts; we will then introduce some of the research currently conducted in the field of textual data analysis, which, in the near future, is liable to improve the methodology of information retrieval.




Réseaux sociaux