IRCOM

Présentation de Corpus Nigéria

Laboratoire(s) participant(s)

LLACAN

Responsable(s)

Bernard Caron

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Typology and annotation of information structure and grammatical relations Syntaxe, prosodie, structure de l'information 2010-2019 (Labex EFL) les trois

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
audio cassettes, minidisk, enregistreur numérique 23h + 50h + 1h (faisant partie de CorpAfroAs), respectivement. Oui Sur disques durs en plusieurs exemplaires

Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
Langues rares tchadiques Sud Bauchi Ouest, pidgin english du Nigéria Nigéria 1991-2011 et 2010, respectivement de 1 à 4 et 3, respectivement narration, interview, enquêtes lexicales, grammaticales et ethnographiques, discours.

Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
oui Manuscrites et numériques Oui : tableau excel + CorpAfroAs aucun et IMDI, respectivement

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
oui, en partie manuscrite (10h de langues tchadiques), le reste numérisée oui, sauf pour une partie (10h) langues tchadiques manuscrites 4h numérique (langues tchadiques), 3h numérique (pidgin), 10h manuscrite (langues tchadiques) phonologique + traduction anglaise pour les annotations numériques alignées. Orthographique pour les annotations manuscrites Praat et Elan (l. tch. num.), Praat (pid.), word et manuscrit (l. tch. man.)

Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ?
non

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
1h (CorpAfroAs) caron@vjf.cnrs.fr

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.