IRCOM

Présentation de CorpAfroAs

Laboratoire(s) participant(s)

LLACAN, LACNAD-CREAM

Responsable(s)

Amina Mettouchi

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
corpus de langues afro-asiatiques (chamito-sémitiques) comportant une indexation texte-son, et une annotation complexe Prosodie, morpho-syntaxe 2006-2011 les trois

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
audio enregistreur numérique (wav 44,1 khz/16bits) 13 langues x 1h oui disque dur, site web
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
Kabyle Algérie 2007 narration, conversation
Tamashek Algérie, Mali ? 2007-2009 narration, conversation
Hausa Nigéria 2009 narration, conversation
Zaar Nigéria 2007 narration, conversation
Afar Djibouti 2001 narration, conversation
Beja Soudan 2005-2007 narration, conversation
Gawwada Ethiopie 2008 narration, conversation
Ts'amakko Ethiopie 2007 narration, conversation
Wolaitta Ethiopie narration, conversation
Arabe marocain Maroc 2007-2009 narration, conversation
Arabic lybien Lybie 2005 narration, conversation
Juba (créole soudanais) Soudan 2007 narration, conversation
Hébreu Israël 2008 narration, conversation
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
oui numérique, XML XML, base de données DC, OLAC, IMDI

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
oui, numériques, XML segmentation prosodique, transcription phonétique large et phonologique, segmentation morpho-syntaxique, glose, catégorie Praat, ELAN, Toolbox, XML-LACITO
Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ?
dans quelques cas

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation * Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
Huma-Num (stockage) en cours (http://corpafroas.huma-num.fr) chanard@vjf.cnrs.fr

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.