IRCOM

Présentation de TCOF

Laboratoire(s) participant(s)

ATILF

Responsable(s)

Virginie André, Christophe Benzitoun, Emmanuelle Canut, Jeanne-Marie Debaisieux, Evelyne Jacquey

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Mutualiser des données hétérogènes (enfants vs adultes), Partage de données grammaire, syntaxe, interaction, acquisition, lexique 2005- recueil 12

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
Audio Enregistreurs numériques Disque dur
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
Français France 90- Réunions de travail, conversations privées, entretiens adultes-enfants, entretiens, récits de vie, etc.
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
Oui Numériques, XML Bases de données

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
Transcriptions manuelles en orthographe standard Etudiants en L2 SDL, puis révision par au moins un enseignant-chercheur Oui 20h / 200.000 mots Conventions de transcription dérivées de DELIC 2004 Transcriber
Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ?
Oui Non

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
www.cnrtl.fr/corpus/tcof/ Emmanuelle.Canut@univ-nancy2.fr

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.