Présentation de OTG
Laboratoire(s) participant(s)
LIG, Valoria, LI
Responsable(s)
Jean-Yves Antoine (pour la partie constitution corpus), P. Nicolas, M. Bessac, I. Schadle
Objet
Objectifs scientifiques | discipline | début-fin | recueil/enrichissement/exploitation | nombre de personnes impliquées |
---|
Evaluation des systèmes de dialogue oral homme-machine | Interaction, syntaxe | 1996-2001 | recueil et analyse | 4 pour le laboratoire ayant constitué le corpus |
Données orales/multimodales
Audio/video/autre | Matériel/technique d'enregistrement | Volume | sont-elles numérisées ? | Support |
---|
Audio | Enregistrement numérique sur 2 voies (2 micros) | 2 heures – 26000 mots | oui, la totalité | CD |
Langues | Pays d'enregistrement | Années d'enregistrement | Nombre de locuteurs enregistrés | Tâche linguistique |
---|
français | France | 1998 | 315 | Interaction finalisée |
Métadonnées | Manuscrite/numérique/format ? | données structurées ? | Standards |
---|
oui | Numérique : XML, Word, PDF | non | DTD Transcriber pour la transcription |
Annotation (transcription) et alignement
Manuscrites/numériques ? | Par qui ? | Alignées ? | Volume annoté | Type d'information codée | Convention ? | Format des fichiers |
---|
oui numérique | | oui | totalité | transcription orthographique | | |
Annotation et enrichissement collaboratifs |
---|
|
Anonymisation et autorisations d'exploitation et de diffusion
Une anonymisation a-t-elle été effectuée ? | Les enregistrements comportent-ils des données personnelles ? | Quelles sont les autorisations prévues par le consentement éclairé ? |
---|
transcriptions : oui ; audio : non | non | Oui de la part des hotesses d’accueil – Non de la part des usagers de l’office du tourisme |
Sauvegarde, pérenisation, diffusion
Moyens de sauvegarde et pérenisation* | Condition d'accès aux données | Volume accessible | Volume téléchargeable | Personne à contacter |
---|
CD + site WWW | www.info.univ-tours.fr/~antoine/parole_publique/corpus.html | 2 h (transcription) | 2 h (transcription) | Jean-Yves Antoine (Université de Tours |
* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.