Présentation de TCOF
Laboratoire(s) participant(s)
ATILF
Responsable(s)
Virginie André, Christophe Benzitoun, Emmanuelle Canut, Jeanne-Marie Debaisieux, Evelyne Jacquey
Objet
Objectifs scientifiques | discipline | début-fin | recueil/enrichissement/exploitation | nombre de personnes impliquées |
---|
Mutualiser des données hétérogènes (enfants vs adultes), Partage de données | grammaire, syntaxe, interaction, acquisition, lexique | 2005- | recueil | 12 |
Données orales/multimodales
Audio/video/autre | Matériel/technique d'enregistrement | Volume | sont-elles numérisées ? | Support |
---|
Audio | Enregistreurs numériques | | | Disque dur |
Langues | Pays d'enregistrement | Années d'enregistrement | Nombre de locuteurs enregistrés | Tâche linguistique |
---|
Français | France | 90- | | Réunions de travail, conversations privées, entretiens adultes-enfants, entretiens, récits de vie, etc. |
Métadonnées | Manuscrite/numérique/format ? | données structurées ? | Standards |
---|
Oui | Numériques, XML | Bases de données | |
Annotation (transcription) et alignement
Manuscrites/numériques ? | Par qui ? | Alignées ? | Volume annoté | Type d'information codée | Convention ? | Format des fichiers |
---|
Transcriptions manuelles en orthographe standard | Etudiants en L2 SDL, puis révision par au moins un enseignant-chercheur | Oui | 20h / 200.000 mots | | Conventions de transcription dérivées de DELIC 2004 | Transcriber |
Annotation et enrichissement collaboratifs |
---|
|
Anonymisation et autorisations d'exploitation et de diffusion
Une anonymisation a-t-elle été effectuée ? | Les enregistrements comportent-ils des données personnelles ? |
---|
Oui | Non |
Sauvegarde, pérenisation, diffusion
Moyens de sauvegarde et pérenisation* | Condition d'accès aux données | Volume accessible | Volume téléchargeable | Personne à contacter |
---|
| www.cnrtl.fr/corpus/tcof/ | | | Emmanuelle.Canut@univ-nancy2.fr |
* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.