IRCOM

Présentation de Accueil UBS

Laboratoire(s) participant(s)

LI, Valoria

Responsable(s)

Jean-Yves Antoine (pour la partie constitution corpus)

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Constitution de ressources linguistiques et logiques pour le TA Langue Parlée Interaction, syntaxe 2002-2004 Recueil 4 pour le laboratoire ayant constitué le corpus

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
audio Enregistrement conversation téléphonique via carte son PC 1 heure – 10 000 mots Oui, totalité CD
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
français France 2003 40 interaction finalisée
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
oui Numérique : XML, Word, PDF non DTD Transcriber pour les annotations

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
oui, numérique oui 1 heure – 10 000 mots orthographique
Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ? Quelles sont les autorisations prévues par le consentement éclairé ?
transcriptions : oui ; audio : non Non sur les transcriptions. Oui sur l’audio essentiellement pour le personnel d’accueil Oui de la part du personnel d’accueil – Non de la part des usagers

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
CD + site WWW www.info.univ-tours.fr/~antoine/parole_publique/corpus.html 1 h (transcription) 1 h (transcription) Jean-Yves Antoine

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.