IRCOM

Présentation de Rhapsodie



http://www.projet-rhapsodie.fr/

Laboratoire(s) participant(s)

MoDyCo, IRCAM, LATTICE, CLLE-ERSS, LPL

Responsable(s)

Anne Lacheret (MODYCO), Xavier Rodet (IRCAM), Bernard Victorri (LATTICE), Nathalie Rossi (CLLE-ERSS), Valérie Pasdeloup (LPL)

Objet

Objectifs scientifiques discipline début-fin recueil/enrichissement/exploitation nombre de personnes impliquées
Construction d’un corpus prosodique et syntaxique de référence du français parlé. Prosodie, syntaxe, discours 2008-2011 Projet portant sur l’analyse et l’exploitation des données 44

Données orales/multimodales

Audio/video/autre Matériel/technique d'enregistrement Volume sont-elles numérisées ? Support
audio variable 3 heures, 33.000 mots oui, en totalité site web
Langues Pays d'enregistrement Années d'enregistrement Nombre de locuteurs enregistrés Tâche linguistique
français France 1968-2009 87 Conversations spontanées, parlé télévisé, indications d’itinéraires, récits de vie
Métadonnées Manuscrite/numérique/format ? données structurées ? Standards
oui numériques, format XML oui, base de données IMDI

Annotation (transcription) et alignement

Manuscrites/numériques ? Par qui ? Alignées ? Volume annoté Type d'information codée Convention ? Format des fichiers
oui, numérique *1 oui totalité Transcription phonétique, dysfluences prosodiques, proéminences prosodiques, pauses, contours syllabiques et contours globaux, périodes prosodiques, Texte + XML pour les annotations syntaxiques

*1 :

Transcriptions et annotations numérisées

Transcription orthographique : Anne Dister, Christophe Benzitoun, Renaud Marlet

Transcription phonétique et alignement au phonème: Jean Philippe Goldman et Anne Lacheret (sous Easy Align)

Traitement du signal : Anne Lacheret, Bernard Victorri, Philippe Martin, Nicolas Obin, Christophe Veaux

Annotations prosodiques : Anne Lacheret, Mathieu Avanzi, Piet Mertens, Nicolas Obin, Bernard Victorri

Annotation syntaxique : Christophe Benzitoun Catherine Bolly, Jeanne-Marie Debaisieux, Henri José Deulofeu, Anne Dister Kim Gerdes, Julie Glikman, Sylvain Kahane, Florence Lefeuvre, Renaud Marlet, Paola Pietrandrea, Nathalie Rossi-Gensane, Noalig Tanguy, Bernard Victorri

Annotation et enrichissement collaboratifs

Anonymisation et autorisations d'exploitation et de diffusion

Une anonymisation a-t-elle été effectuée ? Les enregistrements comportent-ils des données personnelles ? Quelles sont les autorisations prévues par le consentement éclairé ?
oui Oui pour la parole publique. La question de l’anonymisation ne se pose pas pour ce domaine de parole

Sauvegarde, pérenisation, diffusion

Moyens de sauvegarde et pérenisation* Condition d'accès aux données Volume accessible Volume téléchargeable Personne à contacter
Libre totalité totalité anne@ lacheret.com

* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.