http://www.projet-rhapsodie.fr/
Anne Lacheret (MODYCO), Xavier Rodet (IRCAM), Bernard Victorri (LATTICE), Nathalie Rossi (CLLE-ERSS), Valérie Pasdeloup (LPL)
Objectifs scientifiques | discipline | début-fin | recueil/enrichissement/exploitation | nombre de personnes impliquées |
---|---|---|---|---|
Construction d’un corpus prosodique et syntaxique de référence du français parlé. | Prosodie, syntaxe, discours | 2008-2011 | Projet portant sur l’analyse et l’exploitation des données | 44 |
Audio/video/autre | Matériel/technique d'enregistrement | Volume | sont-elles numérisées ? | Support |
---|---|---|---|---|
audio | variable | 3 heures, 33.000 mots | oui, en totalité | site web |
Langues | Pays d'enregistrement | Années d'enregistrement | Nombre de locuteurs enregistrés | Tâche linguistique |
---|---|---|---|---|
français | France | 1968-2009 | 87 | Conversations spontanées, parlé télévisé, indications d’itinéraires, récits de vie |
Métadonnées | Manuscrite/numérique/format ? | données structurées ? | Standards |
---|---|---|---|
oui | numériques, format XML | oui, base de données | IMDI |
Manuscrites/numériques ? | Par qui ? | Alignées ? | Volume annoté | Type d'information codée | Convention ? | Format des fichiers |
---|---|---|---|---|---|---|
oui, numérique | *1 | oui | totalité | Transcription phonétique, dysfluences prosodiques, proéminences prosodiques, pauses, contours syllabiques et contours globaux, périodes prosodiques, | Texte + XML pour les annotations syntaxiques |
*1 :
Transcriptions et annotations numérisées
Transcription orthographique : Anne Dister, Christophe Benzitoun, Renaud Marlet
Transcription phonétique et alignement au phonème: Jean Philippe Goldman et Anne Lacheret (sous Easy Align)
Traitement du signal : Anne Lacheret, Bernard Victorri, Philippe Martin, Nicolas Obin, Christophe Veaux
Annotations prosodiques : Anne Lacheret, Mathieu Avanzi, Piet Mertens, Nicolas Obin, Bernard Victorri
Annotation syntaxique : Christophe Benzitoun Catherine Bolly, Jeanne-Marie Debaisieux, Henri José Deulofeu, Anne Dister Kim Gerdes, Julie Glikman, Sylvain Kahane, Florence Lefeuvre, Renaud Marlet, Paola Pietrandrea, Nathalie Rossi-Gensane, Noalig Tanguy, Bernard Victorri
Annotation et enrichissement collaboratifs |
---|
Une anonymisation a-t-elle été effectuée ? | Les enregistrements comportent-ils des données personnelles ? | Quelles sont les autorisations prévues par le consentement éclairé ? |
---|---|---|
oui | Oui pour la parole publique. La question de l’anonymisation ne se pose pas pour ce domaine de parole |
Moyens de sauvegarde et pérenisation* | Condition d'accès aux données | Volume accessible | Volume téléchargeable | Personne à contacter |
---|---|---|---|---|
Libre | totalité | totalité | anne@ lacheret.com |
* L'archivage pérenne concerne l'archive publique, un moyen de pérennisation institutionnel des documents créés dans le cadre de l'exercice du service public. Il s'agit d'une notion distincte du dépôt sur un portail de diffusion ou d'une sauvegarde sur un serveur sécurisé, pour lesquels la pérennité des données n'est pas garantie dans le long terme.