IRCOM

Présentation de ALIPE

Dernière mise à jour : ~~LASTMOD~~

Laboratoire(s) participant(s)

LRL

Responsable(s)

Thierry Chanier

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Le projet ALIPE a pour objectif d’étudier les modalités d’acquisition de deux phénomènes variables en français chez les locuteurs du français maternel : la liaison et l’élision du schwa. Dans cet objectif, nous basons nos études sur l’analyse de corpus recueillis en situation naturelle d’interaction entre trois enfants et leurs parents respectifs. Au total, trois corpus denses sont constitués dans le cadre du projet ALIPE. En effet, trois enfants (deux fillettes et un garçon) ont été enregistrés à leur domicile en situation naturelle d’interaction avec leurs parents. Les séances d’enregistrement ont duré environ une heure et ont été répétées une fois par jour pendant une semaine. Le même protocole a été répété huit mois plus tard pour chacun des sujets afin d’observer leur développement linguistique. Ces corpus ont été structurés dans deux formats standard : XML-TEI et CHAT. L’ensemble des données (transcriptions annotées et données primaires) sont anonymisées et mises à disposition de la communauté scientifique sous une licence Creative Commons. Acquisition - Phonologie - Interaction 2010-2014 Recueil de Données - Exploitation 5

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
Audio Enregistreur numérique à microphone omnidirectionnel intégré. 30 heures Oui, 30 heures MP3 et WAV
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
Français, France France 2007-2011 9 Interactions naturelles (repas, jeux, bain…) aux domiciles familiaux.
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
Oui Numériques, formats TEI Documents XML-TEI XML-TEI. À venir : OLAC, CMDI, IMDI

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
Les transcriptions et annotations ont été réalisées manuellement, dans un format numérique. Elles sont intégrées au corpus. Les différentes personnes ayant participé à ces tâches sont listées dans les métadonnées (format XML-TEI). Oui 30 heures Formats CHAT : conventions CHAT. Pour annoter la liaison, utilisation du « Freecode », dont la méthode d’annotation est renseignée dans les métadonnées et en début de chaque fichier de transcription. Formats TEI : Utilisation des balise des la TEI P5, essentiellement le chapitre pour l’oral. pour la liaison, l’élision et l’adresse du discours, utilisation de balises conçues pour créer un schéma d’annotation. La méthodologie est renseignée dans les métadonnées, en début de chaque fichier XML. TEI et CHAT XML-TEI et Clan
Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ? Quelles sont les autorisations prévues par le consentement éclairé ?
Oui, avec code pour les données anonymisées (lieux de travail, de vie, etc.) Non, anonymisation des parties critiques dans les transcriptions et le signal sonore Oui, pour utilisation scientifique et diffusion libre.

Sauvegarde, pérenissation, diffusion

Moyens de sauvegarde et pérenissation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
Oui, pour utilisation scientifique et diffusion libre. Opendata donc tout est accessible et téléchargeable, sous licence Creative Commons. http://lrl-diffusion/alipe 15 heures 15 heures Thierry.chanier@univ-bpclermont.fr

* L'archivage pérenne (long-term preservation) concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.

Références

→ Liégeois, L., Saddour, I. et Chabanal, D. (2012). L’élision du schwa dans les interactions parents-enfant : étude de corpus. Actes des Journées d’Études sur la Parole, colloque international, 4-8 juin 2012, Grenoble. Pages 313-320. [http://hal.archives-ouvertes.fr/hal-00707773]

→ Liégeois, L. (2012). De l’analyse au partage des données, quel(s) format(s) choisir ? L’exemple d’un corpus d’interactions parents-enfant. Communication affichée au colloque international jeunes chercheurs Coldoc 2012, 4-5 octobre 2012, Paris.

→ Liégeois, L., Chabanal, D. et Chanier, T. (2011). La liaison en discours adressé à l’enfant, spécificités et impacts sur l’acquisition. Communication orale au colloque du Réseau Français de Phonologie, 1-3 Juillet 2011, Tours.

→ Liégeois, L., Chanier, T. et Chabanal, D. (2012). L’exemple d’un corpus d’interactions orales spontanées structuré en TEI : quels avantages pour l’interopérabilité, l’analyse et le partage des données de la recherche ? [Communication], Colloque La linguistique de corpus à l’heure de la confrontation entre concepts, techniques et applications, 14-15 Décembre 2012, Bordeaux.

→ Chabanal, D. et Liégeois, L. (2011). Variation phonologique chez l’enfant francophone de 40 mois : développement lexical et impact du bain linguistique parental. Communication affichée au colloque international Adyloc, 7-9 juin 2011, Paris.

→ Liégeois, L., Chabanal, D. et Chanier, T. (2013). Choix méthodologiques et annotation de la liaison dans le corpus ALIPE. Communication invitée au séminaire Liaison, séminaire du groupe de travail inter laboratoires sur la liaison. Laboratoire Modyco, 11 février 2013, Nanterre. [http://www.modyco.fr/modyco/seminaire-la-liaison.html].

→ Liégeois, L. (2013). La variation phonologique en discours adressé à l'enfant dans le corpus ALIPE. Communication invitée au séminaire Liaison, séminaire du groupe de travail inter laboratoires sur la liaison. Laboratoire Modyco, 21 janvier 2013, Nanterre. [http://www.modyco.fr/modyco/seminaire-la-liaison.html].

→ Liégeois, L. (2013). L'acquisition de la variation phonologique par l’enfant pré-lecteur : impact du bain linguistique et dispositifs cognitifs d’apprentissage. Communication invitée au séminaire Lordat, séminaire de l’unité de recherche interdisciplinaire Octogone. Maison de la Recherche, université de Toulouse le Mirail, 24 mai 2013, Toulouse. [http://octogone.univ-tlse2.fr/accueil/manifestations-scientifiques/seminaires-journees-d-etude/seminaire-lordat-239741.kjsp?RH=1295597563131]

→ Saddour, I. et Liégeois, L. (2013). Particularités du discours adressé à l'enfant en français L1 et à l'apprenant du français L2 : le cas de l'élision. Communication invitée au séminaire Lordat, séminaire de l’unité de recherche interdisciplinaire Octogone. Maison de la Recherche, université de Toulouse le Mirail, 24 mai 2013, Toulouse. [http://octogone.univ-tlse2.fr/accueil/manifestations-scientifiques/seminaires-journees-d-etude/seminaire-lordat-239741.kjsp?RH=1295597563131]

→ Liégeois, L., Saddour, I. Chabanal, D. et Chanier, T. (Article accepté sur résumé, à paraître fin 2013). Acquisition de schwa en français L1 : analyse de corpus denses d’interactions parents‐enfant. Article à paraître dans la revu

e Linx.