Étiquetage grammatical des corpus de parole : problèmes et perspectives (notice n° 853240)

détails MARC
000 -LEADER
fixed length control field 02300cam a2200181 4500500
005 - DATE AND TIME OF LATEST TRANSACTION
control field 20250123150037.0
041 ## - LANGUAGE CODE
Language code of text/sound track or separate title fre
042 ## - AUTHENTICATION CODE
Authentication code dc
100 10 - MAIN ENTRY--PERSONAL NAME
Personal name Valli, André
Relator term author
245 00 - TITLE STATEMENT
Title Étiquetage grammatical des corpus de parole : problèmes et perspectives
260 ## - PUBLICATION, DISTRIBUTION, ETC.
Date of publication, distribution, etc. 1999.<br/>
500 ## - GENERAL NOTE
General note 95
520 ## - SUMMARY, ETC.
Summary, etc. Les systèmes de transcription qui proposent de reproduire certains phénomènes de l’oral, comme les bribes, les hésitations, les répétitions, et qui n’utilisent pas de ponctuation peuvent laisser présager de grandes difficultés pour l’étiquetage grammatical de corpus transcrits. Le développement d’étiqueteurs directement conçus pour l’oral est souhaitable, mais ne peut constituer qu’une entreprise à long terme. Nous relatons dans cet article une expérience d’étiquetage d’un corpus oral à l’aide d’un étiqueteur conçu pour l’écrit, complété par des programmes de pré-édition et de post-édition adéquats, qui, contre toute attente, permet d’obtenir d’excellents résultats sur l’oral, presque comparables à ceux obtenus sur l’écrit. Ces résultats permettent d’envisager la constitution rapide de grands corpus oraux étiquetés pour le français.
520 ## - SUMMARY, ETC.
Summary, etc. The use of transcription conventions that attempt to code the specific properties of speech, such as false starts, hesitations, and repetitions, and do not rely on the usual written punctuation, suggests that the grammatical tagging of transcribed oral corpora might be a very difficult undertaking. Developing speech-specific taggers, although desirable, would be a long-term project. In the experiment reported in this article, a spoken corpus was tagged using a system designed for written text, along with some appropriate pre-editing and post-editing programs. Quite unexpectedly, the results for speech were excellent, almost as good as those previously obtained for writing. This discovery allows us to foresee the rapid compilation of large tagged spoken corpora for French.
700 10 - ADDED ENTRY--PERSONAL NAME
Personal name Véronis, Jean
Relator term author
786 0# - DATA SOURCE ENTRY
Note Revue française de linguistique appliquée | IV | 2 | 1999-12-01 | p. 113-133 | 1386-1204
856 41 - ELECTRONIC LOCATION AND ACCESS
Uniform Resource Identifier <a href="https://shs.cairn.info/revue-francaise-de-linguistique-appliquee-1999-2-page-113?lang=fr&redirect-ssocas=7080">https://shs.cairn.info/revue-francaise-de-linguistique-appliquee-1999-2-page-113?lang=fr&redirect-ssocas=7080</a>

Pas d'exemplaire disponible.

PLUDOC

PLUDOC est la plateforme unique et centralisée de gestion des bibliothèques physiques et numériques de Guinée administré par le CEDUST. Elle est la plus grande base de données de ressources documentaires pour les Étudiants, Enseignants chercheurs et Chercheurs de Guinée.

Adresse

627 919 101/664 919 101

25 boulevard du commerce
Kaloum, Conakry, Guinée

Réseaux sociaux

Powered by Netsen Group @ 2025