IRCOM

Présentation de Collection Pangloss



Laboratoire(s) participant(s)

LACITO

Responsable(s)

Séverine Guillaume, Boyd Michailovsky, Alexis Michaud

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Documentation sonore de langues en tant que patrimoine humain Documentation, langues rares depuis 1996 recueil et enrichissement

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
audio 1302 documents visibles oui Site web, archivage via COCOON
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
plus de 60 narration,...
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
oui. Numériques XML DC, OLAC

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
numériques les chercheurs phrases par phrase totalité transcription, glose, traduction XML
Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ?

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
COCOON http://lacito.vjf.cnrs.fr/archivage/presentation.htm 1302 documents 1302 documents Séverine Guillaume, Alexis Michaud

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.