Stéphane Robert
Objectifs scientifiques | discipline | début-fin | recueil/enrichissement/exploitation | nombre de personnes impliquées |
---|---|---|---|---|
description linguistique, allant d'une esquisse grammaticale à une description grammaticale complète | description grammaticale, apparentement, typologie, dialectalisation, codification, documentation | 2009-2013 | les trois |
Audio/video/autre | Matériel/technique d'enregistrement | Volume | sont-elles numérisées ? | Support |
---|---|---|---|---|
audio et vidéo | enregistreur numérique, caméra DV | audio : 10 minutes x 17 langues ; vidéo : 25h x 8 langues (rush) et 1h30 x 8 langues (films soutitrés) | oui | disque dur, site web, DVD pour la vidéo |
Langues | Pays d'enregistrement | Années d'enregistrement | Nombre de locuteurs enregistrés | Tâche linguistique | Population de locuteurs |
---|---|---|---|---|---|
bainunk gubaxer | Sénégal | 2010 | narration, conversations | ||
bainunk gunyamolo | Sénégal | 2009 | narration, conversations | 32520 | |
basari | Sénégal | 2010 | narration, conversations | 13300 | |
bayot | Sénégal | narration, conversations | 18790 | ||
biafada | Sénégal | narration, conversations | 36800 | ||
casamançais | Sénégal | narration, conversations | 105000 | ||
jalonke | Sénégal | 2011 | narration, conversations | 104500 | |
kerak | Sénégal | 2010-2012 | narration, conversations | 13200 | |
kobiana | Sénégal | narration, conversations | 650 | ||
lehar-laala | Sénégal | 2009-2011 | narration, conversations | 12000 | |
mandinka | Sénégal | 2010 | narration, conversations | 1346000 | |
maninka | Sénégal | 2011 | narration, conversations | 525300 | |
menik | Sénégal | 2010 | narration, conversations | 3380 | |
palor | Sénégal | narration, conversations | 9680 | ||
pepel | Sénégal | 2009-2011 | narration, conversations | 140200 | |
seereer | Sénégal | 2009-2011 | narration, conversations | 1161900 | |
lebou (wolof) | Sénégal | 2011-2012 | narration, conversations |
Métadonnées | Manuscrite/numérique/format ? | données structurées ? | Standards |
---|---|---|---|
prévues | numériques, XML | base de données | DC, OLAC, IMDI |
Manuscrites/numériques ? | Par qui ? | Alignées ? | Volume annoté | Type d'information codée | Convention ? | Format des fichiers |
---|---|---|---|---|---|---|
oui, numérisée (XML) | oui | 3h | segmentation prosodique, transcription phonétique et phonologique, morpho-syntaxique, glose, catégorie | ELAN, Toolbox, XML-Lacito | ||
sous-titres pour les films | oui | 12h | sous-titre en français, index temporels | .srt |
Annotation et enrichissement collaboratifs |
---|
Une anonymisation a-t-elle été effectuée ? | Les enregistrements comportent-ils des données personnelles ? |
---|---|
au besoin |
Moyens de sauvegarde et pérenisation* | Condition d'accès aux données | Volume accessible | Volume téléchargeable | Personne à contacter |
---|---|---|---|---|
Huma-Num (en projet) | libre (à terme) | son et annotation (totalité), 8 films de 1h30 | chanard@vjf.cnrs.fr |
* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.