IRCOM

Groupe de travail 6 : dépôt, conservation et diffusion des corpus oraux et multimodaux

Coordinateurs : Sarra El Ayari (SFL), Michel Jacobson (LLL).

Participants :

Olivier Baude LLL ESLO, membre du conseil scientifique d'Huma-Num
Bernard Bel LPL SLDR/Ortolang
Annelies Braffort LIMSI corpus multimodaux (langues des signes)
Véronique Ginouvès MMSH Responsable de la phonothèque de la MMSH
Séverine Guillaume LACITO CoCoON
Anne-Katharina Harr Ludwig-Maximilians-Universität (Munich) Allemand langue étrangère
Linda Hriba LLL ESLO, consortium Ecrits
Tatiana Iakovleva SFL Acquisition du langage
Cyril Pestel Atilf Ingénieur Ortolang
Sara Tandar LAM ? Application Telemeta
Martine Toda IRCOM Aide à la finalisation des corpus

S’inscrire à la liste de diffusion (laisser le mail vide)

Envoyer un mail

Introduction : intitulé, domaines, périmètre

Ce groupe de travail se donne comme objectif de favoriser la pérennisation des corpus oraux et multimodaux par le moyen de l'archivage numérique, quels que soit leur langue ou leur thématique.

Actions envisagées

En concertation avec CoCoON et SLDR/ORTOLANG, le groupe de travail aura pour mission d'établir une documentation claire et unifiée des solutions et de diffuser l'information le plus largement possible : réunion, site web, guide des bonnes pratiques, questions/réponses, exemples, ...

Comptes-rendus

Réunions 3 : 2 décembre à Paris

Compte-rendu par Michel Jacobson

Compte-rendu de la réunion du GT6 du 2 décembre 2014.

Présents: Cyril, Martine, Michel

Discussion autour des objectifs du GT-6 :

Les objectifs du groupe tournent autour de la production d'une documentation facile d'accès, permettant d'expliquer et de convaincre les utilisateurs et producteurs de ressources orales et multimodales de l'importance d'une bonne gestion de leurs données. Les bonnes pratiques en la matière touchent à différents domaines qui peuvent eux-même être l'objet d'un autre groupe thématique de l'IRCOM. La mission du GT-6, de ce point de vue, est donc relativement transverse et ne correspond pas bien au nom qui en a été donné "Stockage sécurisé et mutualisation des corpus oraux et multimodaux". Nous proposons de renommer le groupe en " Dépôt / conservation / diffusion ". Même si ces termes sont polysémiques ou peuvent avoir des acceptions différentes dans des jargons métier, ils couvrent mieux le domaine que l'on souhaite expliquer pour influencer sur les pratiques.

Discussion sur le Wiki et le site web de l'IRCOM :

Le système de production du site web et de bascule entre le Wiki et le site web de l'IRCOM est compliqué en terme de procédure et hors-standard. Nous proposons de séparer les deux.

- Le Wiki est utilisé comme un outil de production collaborative facilitant l'organisation du travail dans les groupes, mais ne représente pas en l'état actuel un outil de communication à l'extérieur. Seul une petite partie des pages du wiki fait l'objet d'une "bascule" sur le site web. Cet outil pourrait être conservé pour un usage interne. Au-delà du mandat de l'IRCOM, son utilité va diminuer mais pas le coût de son maintient.

- Le site web est un outil de communication auprès du public visé (utilisateurs et producteurs de ressources orales). Il doit être organisé à cet effet. Certaines rubriques sont d'un usage interne à l'IRCOM et on gagnerait en clarté à les retirer pour ne les laisser que dans le Wiki.

- Le mécanisme de bascule du Wiki vers le site web est perçu par ceux qui l'utilisent (Martine) comme lourd et peu pratique. Ce mécanisme pourrait être retiré et remplacé par un outil de gestion de type CMS, plus souple et surtout plus standard comme manière de gérer un site de ce type. Dans une réunion de préparation Sarra s'était déclarée compétente et volontaire pour mettre en place un tel outil.

- Remarques particulières sur le Glossaire:

Planning de l'action:

- D'ici le 5 janvier échanges sur des propositions de rubriques de haut-niveau pour le site web (pas plus de 5)

- Préparer un email synthétisant la proposition pour un envoie au COPIL le vendredi 12 déc

Discussion sur la possible Journée d'étude conjointe avec le GT-4 en 2005 :

La demande n'émane pas du GT-6 et on ne comprends donc pas bien la commande. Pour trouver quelles actions pourraient être menées, on envisage 2 pistes:

- Demander aux participant des ateliers de juin quels sont leurs éventuelles attentes et vérifier que celles avec lesquelles ils étaient venues ont été satisfaites. Martine se charge de récupérer la liste des participants et de leur faire passer un mini questionnaire en ligne.

- Que les membres du GT6 communiquent via la liste leur liste d'idées d'ici le vendredi 12 janvier

Discussion sur la brochure :

Le plan général reprendra la liste des modules fonctionnels de l'OAIS (Gestion des entrées, Gestion des accès, Gestion des métadonnées, Stockage, Planification de la pérennisation, Administration). Un préambule présentera de manière simple et courte la norme OAIS comme un cadre conceptuel et organisationnel, puis la descriptions des différents modules sera l'occasion d'expliquer des concepts. Par exemple dans la "gestion des accès", on peut parler des permaliens, de l'oai, des licences, des aspects techniques et légaux de l'authentification et de la restriction d'accès, ... Dans la partie "Planification de la pérennisation" de la veille technologique, du suivi des communautés d'utilisateurs, des conversions de formats et migration de supports. Etc, etc. Ces concepts seront illustrés sous forme d'encarts par des retours d'expériences sur des cas concrets de projets de corpus. La dernière partie présenterait l'implémentation de ce modèle mis en place par Huma-Num avec le CINES.

Le volume de la brochure doit être court (un multiple de 4 pages (2 feuillets, cad une feuille pliée en deux) )

Actions: Associer aux modules fonctionnels des questions pratiques et des noms de personnes pouvant faire des retours d'expérience dessus. Envoyer les idées sur la liste pour le vendredi 19 (= avant les vacances de Noël)

Réunion 2 : mardi 17 juin 2014 10h30-16h30, à Paris

Etaient présents (en suivant le tour de table) : Catherine Bolly, Martine Toda, Michel Jacobson, Sara Tandar, Sophie Roekhaut, Cyril Pestel. Annelies Braffort était avec nous par Skype mais nous avons dû nous quitter en raison de la mauvaise qualité de la connexion.

Compte-rendu de la réunion (.docx)

Compte-rendu de la réunion (.pdf)

Réunion 1 : Table-ronde des principaux acteurs impliqués dans le stockage sécurisé et la diffusion des corpus oraux et multimodaux

Jeudi 30 janvier 2014

- Quelle est votre spécificité ?

- Qu'apportez-vous en matière d'hébergement et d'archivage pérenne ?

Catherine Bolly et Martine Toda pour le groupe de travail 6 de l'IRCOM

Stéphane Pouyllau et Nicolas Larrousse pour Huma-Num

Jean-Marie Pierrel pour ORTOLANG

Bernard Bel et Frédérique Bénard pour SLDR

Michel Jacobson pour CoCoON

Compte-rendu (Martine Toda et Catherine Bolly) mis à jour le 11/03/2014

Dernière mise à jour : 2015/09/29