IRCOM

Présentation de MULCE

Dernière mise à jour : ~~LASTMOD~~

http:mulce-doc.univ-bpclermont.fr/IMG/pdf/mul-vue-gen.pdf , http:mulce-doc.univ-bpclermont.fr/spip.php?article30 et http://mulce-doc.univ-bpclermont.fr/spip.php?article81

Laboratoire(s) participant(s)

LRL

Responsable

Thierry Chanier

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Mulce : La recherche sur les interactions en ligne en situation d’apprentissage offre encore trop peu souvent la possibilité d’accéder aux données à partir desquelles les chercheurs ont élaboré les analyses présentées dans les publications. Cela restreint, d’une part, la compréhension des phénomènes étudiés et, d’autre part, empêche toute réplication dans le but de comparaisons, d’analyses cumulatives ou contrastives. Dans le projet Mulce, nous défendons le point de vue méthodologique suivant : pour permettre une analyse des interactions situées, il convient de relier les différentes données issues de formations en ligne pour construire un objet d’analyse, exploitable par différentes équipes et disciplines. Le constat actuel est que les données sont souvent décontextualisées, parcellaires ou simplement inaccessibles à la communauté des chercheurs. Nous proposons donc de structurer les données en corpus d’apprentissage (LETEC) de façon à rendre possible leur échange et la capitalisation des analyses. Le protocole de recherche, le scénario pédagogique, les interactions, productions et traces, les licences et les analyses capitalisables en sont les constituants. Un corpus d’apprentissage (LETEC - Learning and Teaching Corpus ) assemble de façon systématique et structurée un ensemble de données, particulièrement d’interactions, et de traces issues d’une expérimentation de formation partiellement ou totalement en ligne, enrichies par des informations techniques, humaines, pédagogiques et scientifiques permettant leur analyse en contexte. Interactions en ligne, apprentissage L2, ALAO 2007- (en cours) Recuel, analyse, partage de résultats en Opendata environ 15 (étudiants de master, doctorants, CDD assistant de recherche, enseignants-chercheurs)

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
vidéo dialogues Skype (capture d'écran 90 heures oui en ligne (MSH Clermont-Ferrand)
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
français langue étrangère, anglais langue étrangère France, Grande Bretagne, Allemagne, Colombie, Etats-Unis 2006-2009 152 interaction en ligne, enseignement de langue étrangère
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
oui numériques, OLAC oui (certaines métadonnées sous format Excel) OLAC (http://www.language-archives.org/archive/mulce.org), CLARIN (http://catalog.clarin.eu/vlo/?fq=collection:Multimodal+Learning+and+teaching+Corpora+Exchange)

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
oui XML
Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ? Quelles sont les autorisations prévues par le consentement éclairé ?
oui non Oui références aux contrats de consentement éclairé dans les fiches descriptives des corpus

Sauvegarde, pérenissation, diffusion

Moyens de sauvegarde et pérenissation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
MSH Clermont-Ferrand cf. ci-dessus 90 heures 90 heures Thierry.chanier@univ-bpclermont.fr (04 73 34 68 39), Paul.lotin@univ-bpclermont.fr

* L'archivage pérenne (long-term preservation) concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.

Références