Étiquetage grammatical des corpus de parole : problèmes et perspectives (notice n° 853240)

détails MARC
000 -LEADER
fixed length control field	02300cam a2200181 4500500
005 - DATE AND TIME OF LATEST TRANSACTION
control field	20250123150037.0
041 ## - LANGUAGE CODE
Language code of text/sound track or separate title	fre
042 ## - AUTHENTICATION CODE
Authentication code	dc
100 10 - MAIN ENTRY--PERSONAL NAME
Personal name	Valli, André
Relator term	author
245 00 - TITLE STATEMENT
Title	Étiquetage grammatical des corpus de parole : problèmes et perspectives
260 ## - PUBLICATION, DISTRIBUTION, ETC.
Date of publication, distribution, etc.	1999.<br/>
500 ## - GENERAL NOTE
General note	95
520 ## - SUMMARY, ETC.
Summary, etc.	Les systèmes de transcription qui proposent de reproduire certains phénomènes de l’oral, comme les bribes, les hésitations, les répétitions, et qui n’utilisent pas de ponctuation peuvent laisser présager de grandes difficultés pour l’étiquetage grammatical de corpus transcrits. Le développement d’étiqueteurs directement conçus pour l’oral est souhaitable, mais ne peut constituer qu’une entreprise à long terme. Nous relatons dans cet article une expérience d’étiquetage d’un corpus oral à l’aide d’un étiqueteur conçu pour l’écrit, complété par des programmes de pré-édition et de post-édition adéquats, qui, contre toute attente, permet d’obtenir d’excellents résultats sur l’oral, presque comparables à ceux obtenus sur l’écrit. Ces résultats permettent d’envisager la constitution rapide de grands corpus oraux étiquetés pour le français.
520 ## - SUMMARY, ETC.
Summary, etc.	The use of transcription conventions that attempt to code the specific properties of speech, such as false starts, hesitations, and repetitions, and do not rely on the usual written punctuation, suggests that the grammatical tagging of transcribed oral corpora might be a very difficult undertaking. Developing speech-specific taggers, although desirable, would be a long-term project. In the experiment reported in this article, a spoken corpus was tagged using a system designed for written text, along with some appropriate pre-editing and post-editing programs. Quite unexpectedly, the results for speech were excellent, almost as good as those previously obtained for writing. This discovery allows us to foresee the rapid compilation of large tagged spoken corpora for French.
700 10 - ADDED ENTRY--PERSONAL NAME
Personal name	Véronis, Jean
Relator term	author
786 0# - DATA SOURCE ENTRY
Note	Revue française de linguistique appliquée \| IV \| 2 \| 1999-12-01 \| p. 113-133 \| 1386-1204
856 41 - ELECTRONIC LOCATION AND ACCESS
Uniform Resource Identifier	<a href="https://shs.cairn.info/revue-francaise-de-linguistique-appliquee-1999-2-page-113?lang=fr&redirect-ssocas=7080">https://shs.cairn.info/revue-francaise-de-linguistique-appliquee-1999-2-page-113?lang=fr&redirect-ssocas=7080</a>

Pas d'exemplaire disponible.

Étiquetage grammatical des corpus de parole : problèmes et perspectives (notice n° 853240)

PLUDOC

Adresse

Liens utiles

Étiquetage grammatical des corpus de parole : problèmes et perspectives (notice n° 853240)

PLUDOC

Adresse

Réseaux sociaux

Liens utiles