IRCOM

Présentation de OTG

Laboratoire(s) participant(s)

LIG, Valoria, LI

Responsable(s)

Jean-Yves Antoine (pour la partie constitution corpus), P. Nicolas, M. Bessac, I. Schadle

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Evaluation des systèmes de dialogue oral homme-machine Interaction, syntaxe 1996-2001 recueil et analyse 4 pour le laboratoire ayant constitué le corpus

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
Audio Enregistrement numérique sur 2 voies (2 micros) 2 heures – 26000 mots oui, la totalité CD
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
français France 1998 315 Interaction finalisée
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
oui Numérique : XML, Word, PDF non DTD Transcriber pour la transcription

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
oui numérique oui totalité transcription orthographique
Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ? Quelles sont les autorisations prévues par le consentement éclairé ?
transcriptions : oui ; audio : non non Oui de la part des hotesses d’accueil – Non de la part des usagers de l’office du tourisme

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
CD + site WWW www.info.univ-tours.fr/~antoine/parole_publique/corpus.html 2 h (transcription) 2 h (transcription) Jean-Yves Antoine (Université de Tours

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.