IRCOM

Présentation de Sénélangues

Laboratoire(s) participant(s)

LLACAN, DDL

Responsable(s)

Stéphane Robert

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
description linguistique, allant d'une esquisse grammaticale à une description grammaticale complète description grammaticale, apparentement, typologie, dialectalisation, codification, documentation 2009-2013 les trois

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
audio et vidéo enregistreur numérique, caméra DV audio : 10 minutes x 17 langues ; vidéo : 25h x 8 langues (rush) et 1h30 x 8 langues (films soutitrés) oui disque dur, site web, DVD pour la vidéo
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique Population de locuteurs
bainunk gubaxer Sénégal 2010 narration, conversations
bainunk gunyamolo Sénégal 2009 narration, conversations 32520
basari Sénégal 2010 narration, conversations 13300
bayot Sénégal narration, conversations 18790
biafada Sénégal narration, conversations 36800
casamançais Sénégal narration, conversations 105000
jalonke Sénégal 2011 narration, conversations 104500
kerak Sénégal 2010-2012 narration, conversations 13200
kobiana Sénégal narration, conversations 650
lehar-laala Sénégal 2009-2011 narration, conversations 12000
mandinka Sénégal 2010 narration, conversations 1346000
maninka Sénégal 2011 narration, conversations 525300
menik Sénégal 2010 narration, conversations 3380
palor Sénégal narration, conversations 9680
pepel Sénégal 2009-2011 narration, conversations 140200
seereer Sénégal 2009-2011 narration, conversations 1161900
lebou (wolof) Sénégal 2011-2012 narration, conversations
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
prévues numériques, XML base de données DC, OLAC, IMDI

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
oui, numérisée (XML) oui 3h segmentation prosodique, transcription phonétique et phonologique, morpho-syntaxique, glose, catégorie ELAN, Toolbox, XML-Lacito
sous-titres pour les films oui 12h sous-titre en français, index temporels .srt
Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ?
au besoin

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
Huma-Num (en projet) libre (à terme) son et annotation (totalité), 8 films de 1h30 chanard@vjf.cnrs.fr

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.