IRCOM

Dépot et distribution de corpus

Deux centres de ressources français permettant l'archivage institutionnel de vos corpus
Cenntre de ressource Type de ressources acceptées type de métadonnées complément d'information aperçu des ressources disponibles
SLDR (anciennement CRDO-Aix) formats définis par le CINES (cf. l'utilitaire FACILE) OLAC-DC et base de donnée interne permettant la prise en compte de nouveaux standards (CMDI etc.). Possibilité d'édition en ligne des fiches de métadonnées via un formulaire web Possibilité de déposer des ressources primaires, secondaires, et outils (logiciels, scripts...) ; possibilité de mise à jour des ressources secondaires. Possibilité de dépôt d'un ensemble. Ressources accessibles en accès restreint limité dans le temps ou publiques immédiatement. //Pourquoi/comment archiver et partager des ressources orales ? (diaporama, 2012) // pages détaillées en français, anglais, espagnol ou chinois) * ou en ligne
COCOON ::: ::: Possibilité de déposer des ressources primaires et secondaires. Possibilité de dépôt de ressources individuelles, ou de dépôt groupé d'un corpus complet. Comprend un grand nombre de ressources portant sur les langues peu documentées (plus de 100 langues au catalogue). Ressources accessibles en accès restreint ou publiquement. Consulter le catalogue en ligne
Autres organismes de distribution
Organisme description modalité d'accès aperçu des ressources
ELRA (European Language Ressources Association) Ressources (dont ressources orales et multimodales) initialement destinées au traitement automatique du langage et de la parole, généralement accompagnées d'un grant volume d'annotations manuelles vérifiées (>100h), présentant un potentiel pour l'exploitation dans le domaine de la recherche en linguistique également Gratuit ou payant en fonction des ressources. Possibilité de distribution gratuite d'une ressource demandant l'établissemnet d'un contrat écrit Consulter le catalogue en ligne

Organismes impliqués dans les corpus oraux et multimodaux (élaboration, sauvegarde, ...)

France

Nom Ressources ou services proposés
Bibliothèque Numérique Mondiale La Bibliothèque numérique mondiale met à disposition, gratuitement et en plusieurs langues, des ressources documentaires de grande importance sur les cultures du monde entier, parmi lesquelles des manuscrits, cartes, livres rares, partitions musicales, enregistrements, films, gravures, photographies, dessins d'architecture, et plus encore.
BNF (archives de la parole) La BNF met à disposition deux millions de documents consultables gratuitement : livres, manuscrits, fascicules de presse, numéros de revues, cartes, plans, photographies, estampes, affiches, partitions, enregistrements sonores...
CapDigital Cap Digital est le pôle de compétitivité des contenus et services numériques en Île-de-France.
COMETS Comité d'éthique du CNRS.
CNIL La Commission nationale de l’informatique et des libertés (CNIL) est une institution indépendante chargée de veiller au respect de l'identité humaine, de la vie privée et des libertés dans un monde numérique.
Consortium Corpus-Ecrits (wiki) Répondant aux missions générales fixées par l’IR Corpus, le consortium Corpus écrits s’accordera sur un programme pluriannuel (4 années) de numérisation et de documentation comprenant toutes les étapes de l’archivage et de la mise à disposition numérique, y compris la discussion sur les formats et standards à adopter.
COCOON COCOON accompagne les producteurs de ressources orales, à créer, structurer et archiver leurs corpus ; un corpus pouvant se composer d'enregistrements audio accompagnés éventuellement de d'annotations de ces enregistrements.
DGLFLF La délégation générale à la langue française et aux langues de France élabore la politique linguistique du Gouvernement en liaison avec les autres départements ministériels. Ressources : Corpus de la Parole.
INIST L'Institut de l'Information Scientifique et Technique du CNRS (Inist-Cnrs) facilite l'accès aux résultats issus des différents champs de la recherche mondiale.
IR-Corpus Corpus est une très grande infrastructure de recherche qui coordonne la production de corpus de données numériques en sciences humaines et sociales.
INA (Institut National de l'Audiovisuel) Archives de la radio (70 ans) et de la télévision (60 ans).
MSHS de Toulouse Propose, dans le cadre du projet archives de chercheurs, la numérisation de patrimoine scientifique quel que soit son sa nature (texte, image, son, video).
Phonothèque de la Maison Méditérannéenne des Sciences de l'Homme Conserve un fonds sonore portant entre autres sur la linguistique. Participe au plan national de numérisation et dispose de moyens de numérisation de fonds sonores.
Réseau des Maisons des Sciences de l'Homme Plates-Formes technologiques et équipements lourds (outils mutualisés : logiciels, serveurs, données, et personnel).
Service de la documentation du CNRS Ses missions : coordination, réalisation et soutient des activités de communication et d’animation scientifique, d’information et de documentation scientifique et technique.
SLDR Banque de données parole et langage.
TGE-Adonis La grille de services du TGE Adonis est constituée d'un ensemble de technologies d'infrastructure et de systèmes informatiques mis à la disposition des laboratoires de recherche pour mutualiser, diffuser et stabiliser dans le temps les données et documents issus de la recherche ainsi que les méthodes de traitement afférentes. Services: conservation, archivage à long terme (avec le CINES), traitement des données, diffusion des données.

Institutions européennes et/ou francophones et/ou qui concernent la langue française

Nom Ressources/mission
AFCP (Association Francophone de la Communication Parlée) L’Association Francophone de la Communication Parlée est une association à but non-lucratif (loi 1901) destinée au soutien, au développement, à la diffusion et à la promotion des différentes spécialités des sciences de la communication parlée, dans la communauté francophone.
AFLS (Association for French Language Studies) L’AFLS a été fondée en 1981 pour encourager et promouvoir des activités d’enseignement de la langue et de recherche en langue et linguistique française, en tant qu’activités dignes d’intérêt en elles-mêmes.
CLARIN
DARIAH
ELRA
FlaReNet
Meta-Net