IRCOM

Présentation de CoLaJE: Paris Corpus

Laboratoire(s) participant(s)

PRISMES, MoDyCo, STL

Responsable(s)

Aliyah Morgenstern

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Etudier l'émergence de la communicaiton langagière chez le jeune enfant en intéraction avec une approche mulitnmodale et multi niveaux linguistiques Acquisition, Langue des signes, LSF, prosodie, interaction, morpho-syntaxe, phonologie, gestualité 2009-2012 Oui 25

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
vidéo camescope, 200 heures oui 200hs en constante augmentation numérique (transcriptiosn et vidéos en ligne sur site internet accessible à tous)
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
français France 2006-2012 6 enfants cibles,famille, amis Aucune tâche, une heure de vie en milieu familial
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
Oui, texte + formulaires (descripteurs) numérique oui, tableau excel + début de base de données CHAT

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
Transcption avec CLAN et PHON, tout est numérisé Une équipe oui 200 heures ligne orthographique, igne phonétique, gestes, situation, possiblité d'avoir l'annotation morph-syntaxique CHAT + convention COLaJE (voir guide) CLAN mais aussi ELAN et PHON
Annotation et enrichissement collaboratifs
Projet ANR Jeune chercheurs Léonard
Projet Adonis ENFLANG

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ? Quelles sont les autorisations prévues par le consentement éclairé ?
non oui: image Les familels ont donné (signé) leur consentement éclairé à l'accès aux données et leur exploitation

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
Serveur MoDyco, en partie base de données CHILDES également + ordinateurs personnels aucune condtion: http://colaje.risc.cnrs.fr/index.php/corpus Vidéos > 200hs Transcriptions 196 heures, bientôt 200 hseures Tout Aliyah.Morgenstern@gamil.com

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.