Amina Mettouchi
Objectifs scientifiques | discipline | début-fin | recueil/enrichissement/exploitation | nombre de personnes impliquées |
---|---|---|---|---|
corpus de langues afro-asiatiques (chamito-sémitiques) comportant une indexation texte-son, et une annotation complexe | Prosodie, morpho-syntaxe | 2006-2011 | les trois |
Audio/video/autre | Matériel/technique d'enregistrement | Volume | sont-elles numérisées ? | Support |
---|---|---|---|---|
audio | enregistreur numérique (wav 44,1 khz/16bits) | 13 langues x 1h | oui | disque dur, site web |
Langues | Pays d'enregistrement | Années d'enregistrement | Nombre de locuteurs enregistrés | Tâche linguistique |
---|---|---|---|---|
Kabyle | Algérie | 2007 | narration, conversation | |
Tamashek | Algérie, Mali ? | 2007-2009 | narration, conversation | |
Hausa | Nigéria | 2009 | narration, conversation | |
Zaar | Nigéria | 2007 | narration, conversation | |
Afar | Djibouti | 2001 | narration, conversation | |
Beja | Soudan | 2005-2007 | narration, conversation | |
Gawwada | Ethiopie | 2008 | narration, conversation | |
Ts'amakko | Ethiopie | 2007 | narration, conversation | |
Wolaitta | Ethiopie | narration, conversation | ||
Arabe marocain | Maroc | 2007-2009 | narration, conversation | |
Arabic lybien | Lybie | 2005 | narration, conversation | |
Juba (créole soudanais) | Soudan | 2007 | narration, conversation | |
Hébreu | Israël | 2008 | narration, conversation |
Métadonnées | Manuscrite/numérique/format ? | données structurées ? | Standards |
---|---|---|---|
oui | numérique, XML | XML, base de données | DC, OLAC, IMDI |
Manuscrites/numériques ? | Par qui ? | Alignées ? | Volume annoté | Type d'information codée | Convention ? | Format des fichiers |
---|---|---|---|---|---|---|
oui, numériques, XML | segmentation prosodique, transcription phonétique large et phonologique, segmentation morpho-syntaxique, glose, catégorie | Praat, ELAN, Toolbox, XML-LACITO |
Annotation et enrichissement collaboratifs |
---|
Une anonymisation a-t-elle été effectuée ? | Les enregistrements comportent-ils des données personnelles ? |
---|---|
dans quelques cas |
Moyens de sauvegarde et pérenisation * | Condition d'accès aux données | Volume accessible | Volume téléchargeable | Personne à contacter |
---|---|---|---|---|
Huma-Num (stockage) | en cours (http://corpafroas.huma-num.fr) | chanard@vjf.cnrs.fr |
* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.