IRCOM

Glossaire

a - b - c - d - e - f - g - h - i - j - k - l - m - n - o - p - q - r - s - t - u - v - w - x - y - z

Alignement temporel (Time alignment)

L'alignement renvoie à la correspondance temporelle entre deux ressources, par exemple entre l'audio et la transcription, où l'alignement peut se situer au niveau du tour de parole, du groupe intonatif, du mot ou du phonème, ou entre la vidéo et l'annotation (gestes ou langues des signes). L'alignement peut également concerner la correspondance temporelle entre deux flux primaires, comme deux flux vidéo en cas d'utilisation simultanée de deux caméras, pour des prises de vue à partir d'angles différents.

Il existe des outils semi-automatiques permettant d'affiner un alignement au niveau phonétique à partir de la transcription orthographique : voir EasyAlign, SailAlign.

Des outils semi-automatiques permettant de segmenter automatiquement des évènements gestuels dans les vidéos commencent à se développer.

La procédure se déroule généralement en plusieurs étapes successives de traitement automatique et de réajustements manuels. Ces logiciels sont implémentés sous forme d'extensions de logiciels d'annotation existants ou sous forme de logiciel autonome possédant des fonctions d'export dans des formats courants.

Plus généralement, l'alignement des données consiste à spécifier une relation entre les unités de chaque type de données. Les alignement peuvent faire référence directement à un signal temporel (les phonèmes sont alignés sur le signal audio) ou à d'autres données. Par exemple, les syllabes sont alignées sur les phonèmes, les unités syntaxiques sur les tokens, etc. Les alignements peuvent être stricts (les frontières des unités doivent être les mêmes) ou flexibles (les frontières doivent être dans une zone proche). Les alignements peuvent être partiels (une partie des unités est alignée).

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Annotation (annotation)

Dans ce wiki, nous utilisons le terme "annotation", au sens large, pour désigner la documentation de sous-parties d'enregistrements (phases, mots, tour de parole...), en opposition au terme "métadonnées", qui désigne la documentation d'un enregistrement dans son ensemble.

Dans un sens plus restreint, le terme "annotation", qui est un codage d'informations diverses (glose, gestes, balisage, analyse morpho-syntaxique,...), s'oppose à "transcription", qui est le codage orthographique ou phonétique de la parole qui a été produite.


Annotation des langues des signes (sign language annotation)

A l'heure actuelle, l'annotation des langues des signes consiste généralement à 1) définir un ensemble de pistes d'annotations qui vont permettre d'annoter plusieurs ou l'ensemble des articulateurs mobilisés en LS (buste, épaules, bras, mains, tête, regard, joues, sourcils, bouche), 2) segmenter temporellement la production en unités, 3) identifier ces unités à l'aide de catégories qui dépendent de l'approche choisie (annotation de la forme ou de la fonction) ou à l'aide de gloses. Généralement, une piste supplémentaire comporte une traduction approchée en français écrit.

Problématique de la transcription de la LS : Il existe divers systèmes spécifiques pour la notation des LS, dont les deux principaux sont HamNoSys et SignWriting. HamNoSys est un système qui se veut phonétique et qui permet de décrire la forme des signes conventionnalisés selon cinq paramètres (configuration, emplacement, mouvement, orientation, mimique). Il est monolinéaire et existe sous forme d'une police de caractères qui peut être utilisée dans les logiciels d'annotation ELAN et iLex. Il est d’une relative efficacité pour la représentation de signes isolés mais ne permet pas de représenter le discours en LS, caractérisé par une exploitation massive de l’espace et l’implication simultanée dans la construction du sens des différentes composantes corporelles. SignWriting a été conçu au départ pour permettre l'écriture des LS. Il propose une représentation multilinéaire et en partie analogique. Il fait notamment depuis une décennie l’objet d’expérimentations prometteuses pour la transcription du discours en LS italienne. Cependant, la non standardisation de ses règles d’écriture (orthographie) d’une part, les difficultés de son implémentation informatique d’autre part, en limitent, à ce jour, l’utilisation pour la transcription des corpus de LS au sein des logiciels d'annotation. Ainsi, il n'existe pas à ce jour de système permettant de transcrire les langues des signes.

Annotation par gloses (Gloss-based notation) : Expression consacrée dans le champ international des recherches linguistiques sur les langues des signes (LS) pour désigner les pratiques consistant à représenter le discours en LS par l’écrit d’une langue vocale (LV) (la LV du pays hébergeant la LS et/ou une LV internationale).

Base de la majorité des annotations de corpus de LS jusqu'à maintenant, cette modalité de représentation y est le plus souvent utilisée dès la première piste, alignée sur le signal. Peu standardisés, variant selon les chercheurs et les pays, les modes de recours à la LV écrite y sont hétérogènes, allant de l’étiquetage des unités LS par un (parfois 2 ou 3) mots de la LV —ce qui dans le champ est appelé « glose »— (ex. CHEVAL, pour le signe LS signifiant « cheval ») à l’usage de divers types d’abréviations porteuses d’informations formelles, catégorielles et/ou morpho-syntaxiques (ex : IX1, pour un pointage manuel pronom de 1ère personne).

ID-Gloss : Forme d'annotation par gloses qui tend à devenir le standard actuel. Dans le contexte de l’annotation de corpus de discours en langue des signes (LS), l’ID-Gloss (de l’anglais Identifying Gloss, cf. Johnston 2001) est un mot de la langue vocale annotatrice (choisie par l’annotateur) utilisé de manière systématisée et consistante pour labelliser un signe au sein d’un corpus, abstraction faite des variations sémantiques contextuelles et des variations morphologiques et morpho-syntaxiques de ce signe. L’ID-Glose prétend en effet renvoyer à la forme lemmatisée (lemme, ou lexème, selon les terminologies, ou encore forme de citation) du signe (type vs token). Même si le choix du mot de la LV est motivé par sa proximité sémantique avec le signe, l’ID-Gloss n’est pas censée, à quelque titre que ce soit, être une traduction de ce signe.

L’établissement et l’assignation d’ID-Gloss requièrent que la LS annotée par leur biais ait fait l’objet d’une lemmatisation (sur les débats relatifs aux procédures de lemmatisation et d’assignation des ID-Gloses, voir notamment Johnston 2008, 2011 et Konrad 2011).

L’utilisation d’ID-Gloss dans l’annotation appuyée sur des logiciels d’annotation multimédia comme ELAN ou iLex, qui nécessite l’association à une base de données lexicales consistante et évolutive, vise à permettre une annotation régulière et homogène, permettant des requêtes significatives.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Annotation des langues peu décrites

L’annotation des langues peu décrites comporte au minimum une glose morphosyntaxique et une traduction libre. Chaque morphème (lexical ou grammatical) est associé à une étiquette correspondant à une catégorie grammaticale (ex. futur, pluriel, antipassif, etc.) et/ou à une traduction (pour les lexèmes). Par exemple: “il a fini” :

il SBJ.3SG.M

a have.PRS.3SG

fini finish.PTCP.PST

Traduction libre : “he has finished”.

Les étiquettes sont abrégées selon des standards en cours d’élaboration. Par exemple ici: SBJ = sujet, SG = singulier, M = masculin, PRS= présent, PTCP = participe, PST = passé.

Une syntaxe de l’annotation morphosyntaxique est également nécessaire, et en cours de standardisation. Par exemple, le signe “=” est utilisé pour les frontières de clitiques, le signe “\” pour les alternances morphophonologiques (ablaut, mutation, alternance tonale etc.), le signe “.” sépare plusieurs étiquettes grammaticales lorsqu’elles correspondent à un seul morphème dans la langue analysée.

Des propositions ont été faites dans le cadre de divers projets, les plus abouties étant les Leipzig Glossing Rules (lien sur : http://www.eva.mpg.de/lingua/resources/glossing-rules.php) et les CorpAfroAs Glossing Rules (lien sur: http://corpafroas.tge-adonis.fr/glosses.html).


Anonymisation (anonymization)

L'anonymisation consiste à retirer des informations par lesquelles des individus pourraient être reconnus, dans la perspective de diffuser des données sans porter atteinte à la vie privée. Cette opération peut concerner les descripteurs pour ne pas identifier un participant ou un lieu qui rendrait identifiables les participants, le signal audio ou vidéo, la transcription avec des données personnelles comme une adresse, un numéro de téléphone ou un nom propre. Plutôt que d'effacer simplement des portions de signal, il existe des procédures de masquage/filtrage qui rendent les portions sensibles inintelligibles, mais analysables sous certains aspects (ex. analyse prosodique).

Pour les données visuo-gestuelles, de Langue des signes (sign language)notamment, l’anonymisation (par exemple par floutage) reste problématique, le regard et les expressions faciales étant porteurs d’informations linguistiques majeures.

Voir Anonymisation de corpus réutilisables, Reffay et Teutsch, 2000 et Script PRAAT d'anonymisation de fichiers sonores.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Archivage (archiving)

Au sens large, il s'agit de gérer le cycle de vie de l'information qui couvre une période allant de sa création à son élimination ou sa conservation définitive. Cette gestion recouvre des actions du type (collecter, classer, conserver et communiquer). Dans une acception étroite ou ponctuelle on parle d'une action d'archivage pour : le « Transfert de documents qui ont cessé d'être d'utilité courante dans un local de stockage ou dans un service d'archives compétent pour les recevoir. » [Dictionnaire de terminologie archivistique. 2002]. Pour les archives publiques les modalités de ce transfert sont régies par le code du patrimoine.

Contributeur : Michel Jacobson


Archivage pérenne (long-term preservation)

Au sens large, il s'agit de conserver un document sans limite de temps. Au sens de l'archive publique, les documents qui font l'objet d'un archivage, après leur période d'utilité administrative, le sont par définition de manière pérenne. Voir également la distinction entre l'archivage pérenne et la sauvegarde sécurisée sur le site du cines


Archives

Au sens du code du patrimoine, « Les archives sont l’ensemble des documents, quels que soient leur date, leur lieu de conservation, leur forme et leur support, produits ou reçus par toute personne physique ou morale et par tout service ou organisme public ou privé dans l’exercice de leur activité » [Article L211-1]. Les documents numériques sont vu et traités comme des archives sauf pour les publications qui suivent un circuit pour leur conservation qui leur est propre (le dépôt légal).


Archives publiques

Au sens du code du patrimoine, les archives publiques sont essentiellement « Les documents qui procèdent de l’activité, dans le cadre de leur mission de service public, de l’État, des collectivités territoriales, des établissements publics et des autres personnes morales de droit public ou des personnes de droit privé chargées d’une telle mission. ». [Article L211-4 ]. Les archives privées étant des « archives » qui n'entrent pas dans le cadre de cette définition.


Balisage (balisage)

Le balisage de la transcription consiste à ajouter des balises de segmentation ou de parenthèsage du texte. Il peut par exemple s'agir de balises xml définissant une structure de constituants comme dans certains treebanks syntaxiques.

Cela s'oppose à une annotation séparée Annotation déportée (stand-off annotation) où les annotations sont dans des fichiers séparés et alignés sur le temps ou sur la transcription par une indexation des tokens de la transcription.

Il est recommandé d'avoir éventuellement un balisage léger de la transcription sans prétention théorique excessive (équivalent à une ponctuation à l'écrit) facilitant la lecture pour les utilisateurs et les traitements automatiques et de séparer toutes les annotations de plus haut niveau.


Capture de mouvements (motion capture)

Moyens techniques permettant d’enregistrer les valeurs de positions ou d'orientations d'éléments corporels pendant une activité. Elle est utilisée, entre autres, dans l'étude de la langue des signes, de la gestualité, et du mouvement des articulateurs visibles lèvres, menton. On peut distinguer trois principales techniques, (1) mécanique, faisant appel à des accéléromètres placés sur le corps ou un exosquelette/gant utilisant des fibres optiques ou des jauges de contraintes ; (2) optique ou visuelle, avec marqueurs passifs (réfléchissant) ou actifs (diodes), dont la position est enregistrée par des caméras et les coordonnées dans l'espace sont reconstituées après coup. La fréquence d'échantillonnage des systèmes récents atteint 500 Hz, pour une précision spatiale inférieure au millimètre ; (3) magnétique, où des bobines miniatures émettent un champs magnétique capté par un boitier de réception. Les systèmes récents peuvent atteindre une fréquence d'échantillonnage de 400 Hz. Cette technique permet d'enregistrer la position des articulateurs invisibles (langue, velum).

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


CLARIN

Common Language Resources and Technology Infrastructure. Consortium européen au service de la linguistique et des sciences humaines et sociales visant à établir une infrastructure de recherche intégrée et interopérable en ressources et technologies linguistiques. C'est un acteur important dans le processus de normalisation des descripteurs. La France y a un statut d'observateur.


CMDI

Component MetaData Infrastructure. Un format de métadonnées développé au sein de CLARIN, permettant, en outre, de documenter une structure de filiation (hiérarchique) entre fiches de métadonnées. La version actuelle de ce format est 1.2.


Consultation (droit de consultation ; modalités de consultation)

Toute personne constituant un corpus doit en définir les modalités d’accès ou consultation.

Les corpus peuvent être associés à différentes modalités de consultation, depuis l’usage restreint au(x) chercheur(s) et aux enquêtés impliqués dans la constitution du corpus, jusqu’à un accès libre à tout public, via internet notamment. L’importance d’une définition précise des modalités de consultations des corpus, en lien avec la question des droits d’auteur, s’est accrue avec l’usage d’internet et les facilités de diffusion et de copie qu’il permet.

Les modalités de consultation des corpus doivent être définies d’après des critères éthiques d’abord (autorisation des personnes enregistrées, données sensibles), scientifiques et d’intérêt public. Elles peuvent être distinguées en quatre types principaux : accès non autorisé (restreint au(x) créateur(x) du corpus et au(x) enquêté(s))/ accès avec autorisation du responsable du corpus/ accès limité à une communauté scientifique/ accès libre à tout public. Les modalités de consultation peuvent évoluer au cours du temps.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Contexte, co-texte (context)

Le contexte joue un rôle primordial dans l’utilisation de la parole (en Langue des signes (sign language) et en langue des signes (sign language) et détermine certaines propriétés universelles du langage humain. Il fait intervenir des dimensions multiples. (1) Les aspects Co-verbal / non-verbal (co-verbal, non-verbal) de la situation immédiate, tels que les paramètres spatio-temporels définissant la situation d’énonciation, et, pour les langue vocale (vocal/oral language), le regard et toutes les autres informations corporelles, faciales et gestuelles, accompagnant la parole. (2) Les dimensions de la communication qui sont plus particulièrement liées au contexte discursif ou co-texte, participant à la construction de l'univers de référence et de la structure informationnelle. (3) Il peut également inclure les connaissances plus générales du monde qui sont partagées entre les interlocuteurs d’un même groupe linguistique et/ou socio-culturel.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Convention de transcription orthographique

Une convention de transcription orthographique spécifie l'encodage des différentes informations permettant de transcrire un énoncé audio de façon textuelle. En plus des tokens eux-mêmes, une transcription encode quelques informations de bas niveau comme les bruits, les amorces de mots ou les prononciations particulières. Ces informations ne correspondent généralement pas à des annotations, qui sont des informations de plus haut niveau et dont nous recommandons l'encodage séparé (respectant le principe du stand-off annotation). Le groupe de travail 1 du consortium IRCOM est en cours d'élaborer une convention de transcription qui pourra servir de référence pour le français.


Convention d'annotation (convention on annotation)

Ensemble de règles de codification de l'information (linguistique, contextuelle, gestuelle...) convenues pour l'annotation d'une ressource, de telle sorte qu'un même événement sera représenté de manière constante et non ambigüe. Il permet de rendre interopérable des annotations réalisées par des opérateurs différents, à des moments différents. Il existe des conventions développées au sein de projets (ex. PFC, Rhapsodie, LANGACROSS, CLAPI...), de laboratoires (ex. DELIC/GARS).


Corpus (corpus)

Ensemble cohérent de données, sans nécessairement impliquer un "gros" volume. Un corpus doit comporter au minimum, outre les fichiers qui le composent, une fiche de métadonnées (ex. OLAC) pour être visible par les moteurs de recherche.


Coverbal/non verbal (coverbal/nonverbal)

Dans la communication en Langue des signes (sign language), de nombreuses informations non verbales accompagnent l’utilisation du langage Oral vs. écrit. Constituant une partie indissociable de la communication, ces informations sont dites coverbales. Ainsi, la parole se situe dans un contexte comprenant des entités diverses qui définissent l’univers du discours dans la situation immédiate (interlocuteurs, autres entités, espace-temps...) et elle est accompagnée d’informations corporelles (attitude, positions et mouvements du corps...), faciales (expression d’émotions, regard...) et gestuelles (pointages, manipulation d’entités...) qui sont fondamentales pour l’interprétation des énoncés. Les recherches actuelles sur les gestes coverbaux montrent que leur utilisation serait partiellement liée aux propriétés spécifiques des langues.

Concernant les Langue des signes (sign language), dont les éléments verbaux relèvent de la modalité visuo-gestuelle et s’apparentent très souvent, en termes formels, aux éléments co-/non verbaux de la communication en langue vocale (direction du regard, mimiques faciales, postures corporelles, paramètres manuels), la question de la présence et de la nature du co-/non verbal reste entière.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


DARIAH

Digital Research Infrastructure for Arts and Humanities. Consortium européen visant à promouvoir et à aider les pratiques de recherche basées sur les technologies de l'information et de la communication dans le domaine des arts et des sciences humaines.


DOI (Digital Object Identifier)

"Identifiant numérique d'objet" ou "identifiant d'objet numérique". Chaîne de caractères utilisée pour identifier de manière unique et pérenne un document électronique, et en particulier, une ressource de type corpus. Alors qu'une URL peut changer, un DOI reste attaché à la ressource et permet son identification à long terme.


Donnée/ressource primaire (primary resource)

Désigne les données brutes telles qu'elles ont été recueillies (audio, vidéo, signaux physiologiques ou comportementaux...), par opposition aux ressources secondaires (transcription, annotation, signal résultant d'un traitement) qui en dérivent.


Dublin Core (DC)

Le Dublin Core est un schéma de métadonnées très génériques pour décrire tous types de ressources. Ce schéma (normalisé en 2003 : ISO 15836) est en particulier utilisé par le protocole OAI qui permet à des « fournisseurs de services » (par exemple des moteurs de recherche) d'interroger régulièrement les « entrepôts » afin d'actualiser leurs base de références. Cette opération s'appelle le 'moissonnage'. Le standard international OLAC, dérivé du Dublin Core, permet d'ajouter des propriétés au jeu de descripteurs de Dublin Core qualifié.

  1. Dublin Core. Il s'agit d'un ensemble de 15 descripteurs. Voir également OAI-PMH et OLAC.
  1. Data Category, dans le cadre d'ISOCat
  1. Le DCMI (Dublin Core Metadata Initiative) définit un autre jeu de descripteurs (le Dublin Core qualifié) qui précise les descripteurs de base par une quarantaine de catégories plus fines ainsi qu'un certain nombre de vocabulaires contrôlés et de syntaxe formelles.

Entrepôt (repository)

Les entrepôts de données donnent accès (librement ou sous conditions) aux données, en exposant leurs métadonnées aux moteurs de recherche. En France, plusieurs initiatives nationales proposent une plateforme pour le dépôt et l’accès aux ressources linguistiques : le CRDO, devenu COCOON et SLDR ; l'Equipex Ortolang (qui s'appuie sur l'expérience des Centre de Ressources Numériques CNRTL et SLDR) et TGE-Adonis.

Ils proposent aux auteurs de corpus un environnement permettant la pérennisation et la diffusion de leur production (en respectant le niveau de diffusion souhaité). Ils proposent à tous les utilisateurs une visualisation des données, des requêtes sur l'ensemble des bases ainsi que le téléchargement complet des données (moyennant signature d'une licence).


Expression faciale (facial expression)

Une expression faciale est une configuration particulière du visage ou une modification des traits du visage, associée ou non à un regard ou un changement de regard. Une expression du visage peut accompagner l’exécution d’un Geste (gesture) manuel, céphalique (de la tête) ou autre, comme lorsqu’on acquiesce de la tête tout en souriant, ou comme lorsqu’on hausse les sourcils, index levé, tout en prononçant un mot important.

Chaque expression faciale peut être décrite comme une configuration particulière des muscles du visage (à l’aide du système FACS ou Facial Action Coding System), ou comme une gestalt ou forme ayant une valeur emblématique : le visage de la joie, celui de la colère, les traits du doute, ceux de la réflexion, etc.

L’expression faciale a donc souvent valeur d’emblème : tout comme pour le geste conventionnel, une traduction linguistique est possible, et une mimique faciale peut se substituer à une verbalisation. Mais tout comme le geste coverbal/non verbal (coverbal/nonverbal), l’expression faciale est aussi employée de façon conjointe à la parole et concourt à la réalisation de messages multimodaux (voir Multimodalité (multimodality)).

A l’instar du geste et plus encore, l’expression faciale sert de multiples fonctions : expression des émotions et des sentiments, expression des états mentaux, réalisation Coverbal/non verbal (coverbal/nonverbal) des actes de langage, connotation du message verbal, indexicalisation du référent dans le contexte physique, marquage de la progression de la parole et du discours, signalisation de ses intentions immédiates dans l’interaction en cours, etc.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Genre du discours (discourse genre)

L’utilisation du langage dépend de facteurs multiples déterminant la nature du discours dans lequel s’inscrit la communication dans une situation donnée. On distingue différents types de discours ou genres discursifs, qui se caractérisent par des propriétés particulières liées au but de la communication dans la situation d’énonciation, par exemple la narration, l’argumentation, la description, la conversation. Chacun de ces genres peut être différencié de façon plus précise (par exemple, pour la narration, les récits personnels autobiographiques, les récits d’autres événements passés récents, les contes faisant partie du patrimoine culturel...). Des genres discursifs différents peuvent être combinés lors d'une même situation de communication. Le registre de la communication est parfois aussi considéré comme participant au genre discursif, par exemple selon certains paramètres sociolinguistiques de la situation d’énonciation.

Chaque groupe culturel possède son propre répertoire de genres discursifs; certains grands types (ex. narration, conversation) semblent se trouver communément mais leurs caractéristiques formelles et contextuelles peuvent varier notablement d'une culture à une autre.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Geste (gesture)

Un geste est un mouvement corporel de la tête, des mains, des membres supérieurs (bras, épaules) ou d’une autre partie du corps, intégrant ou non des modifications du regard ou du visage, et qui est pourvu d’une visée communicative intentionnelle. Un geste peut mobiliser plusieurs parties du corps en même temps, comme lorsqu’on salue tout à la fois de la tête et de la main.

Le geste manuel présente une morphologie complexe qui tient à la multiplicité des paramètres permettant de le décrire : geste uni- ou bi-manuel, forme de la ou des main(s), trajet dans l’espace, position et orientation de la ou des main(s) par rapport au corps, mouvement répété ou non, vitesse d’exécution.

De plus, le geste manuel a ceci de particulier qu’il peut être décrit en plusieurs Phase gestuelle (gesture phase).

Le geste est parfois employé de façon autonome, comme un outil de communication se suffisant à lui-même. C’est le cas de « l’emblème », geste doté d’une forme et d’un sens conventionnel, parfois appelé geste « quasi-linguistique » ou glossing gesture en raison du fait qu’une traduction linguistique du geste est possible et qu’il peut se substituer à une verbalisation (ex. : le salut manuel ou céphalique -de la tête-, le geste invitant l’interlocuteur à se taire ou à approcher, le geste de pointage indiquant un objet ou un lieu, le poing brandi en guise de protestation).

Le geste est aussi employé de façon coverbale (conjointe à la parole) et concourt à la réalisation de messages multimodaux (voir Multimodalité (multimodality)). La relation entre le geste Coverbal/non verbal (coverbal/nonverbal) et la parole est tout à la fois de nature « séquentielle » : le geste ou stroke gestuel est réalisé au cours ou non loin de la prononciation du segment de parole (syllabe, mot, groupe, proposition) avec lequel il entre en relation ; « fonctionnelle » : le message gestuel peut redoubler, compléter, connoter ou contredire le message verbal, lui associer un message supplémentaire, aider le locuteur à mettre en mots son message verbal, marquer la progression de la parole et du discours, signaler ses intentions immédiates dans l’interaction en cours ; et « sémiotique » lorsqu’il s’agit d’un mouvement doté de propriétés indexicales (geste de pointage) ou représentationnelles (geste qui permet au locuteur de présentifier et localiser un référent linguistique dans son espace frontal, qui en indique la taille ou en dessine le contour, qui mime un déplacement, qui symbolise, par métaphore ou par métonymie, une idée ou un concept abstrait).

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Gestualité (gestuality)

En anglais, gesture désigne aussi bien un geste manuel ou céphalique (de la tête) que les phénomènes de gestualité pris dans leur ensemble. En français, la « gestualité » se restreint pour certains au Geste (gesture) manuel, voire au geste céphalique, alors que pour d’autres, elle inclut les Expression faciale (facial expression), et les changements de position, de posture ou d’attitude au cours de la communication, voire même la proxémique et les changements de regards.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Glose (gloss)

Fait partie de l'annotation, consistant à aligner un niveau d'analyse avec un niveau de transcription. La glose peut relever de divers niveaux d’analyse : morpho-syntaxique (ex. personne, nombre, cas, aspect…), lexématique (ex : Parties du discours (part of speech, POS)), intonatif (ex : fonctions pragmatiques), etc.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Identifiant pérenne (PIDs, permanent identifiers)

Il s'agit d'un équivalent, pour les documents numériques, de ce qu'est le numéro ISBN pour les publications imprimées. L'OAI préconise une certaine syntaxe. L'emplacement (URL) d'un document numérique doit pouvoir être résolu par le biais de fournisseurs de services (ex. portails d'archivage...). Le consortium CLARIN préconise l'utilation de //Persistent Identifiers// (PID) gérés par l'European Persistent Identifier Consortium.


IMDI

ISLE (International Standards for Language Engineering) Meta Data Initiative. Ensemble de descripteurs qui vise à décrire les ressources linguistiques multimédia et multimodales. Utilisées surtout au MPI (Max Planc Institute for Psycholinguistics : ex. DoBeS), les métadonnées IMDI ne sont pas moissonnées par les moteurs relevant du protocole OAI-PMH. L'utilisation de moteurs spécifiques (ex. IMDI Browser) permet d'effectuer des recherches sur ces métadonnées.

Ce format est actuellement considéré comme obsolète, en voie de remplacement par le CMDI de CLARIN, qui préconise ARBIL. Toutefois, un service de dépôt en ligne au format CMDI n'a pas encore été créé ; il est prévu dans le cadre du projet européen INNER SPARK.


Interopérabilité (interoperability)

L’interopérabilité fait référence à la possibilité pour des données d’être réutilisées, modifiées, transformées dans un cadre différent de celui de leur création originale. Idéalement, cette réutilisation doit pouvoir se propager à de nouvelles situations à l’infini et, dans certains cas, mener à la réutilisation (un fois les données modifiées et enrichies) par les mêmes outils et procédures qui avaient servi à créer les données au départ.

Cette interopérabilité repose le plus souvent sur l’usage de formats communs et partagés (par exemple format Word et OpenDocument pour le traitement de texte). Elle peut être mise en difficulté par l’évolution des outils. Elle dépend aussi largement de la qualité de partage des concepts manipulés : les concepts les plus connus et les mieux décrits sont les plus partageables.

Aujourd’hui, l’interopérabilité des données de corpus de langage (en particulier oral et multimodal) est encore balbutiante et nécessite un important investissement de la part des utilisateurs. C’est particulièrement le cas dans un domaine complexe et novateur comme celui de la multimodalité.

Pour ce qui concerne les annotations, l'interopérabilité vise à permettre l'édition et la manipulation (notamment la correction) de données à l'aide d'outils ou d'éditeurs différents. Cela signifie la capacité pour un même ensemble de données d'être manipulées indifféremment par des outils comme Anvil, Praat pour Elan, important et exportant des formats compréhensibles par les autres outils.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)

Voir également la page interoperabilité.


ISOcat

Les catégories ISO sont des descripteurs standards (cf. Vocabulaire contrôlé (controlled vocabulary)) permettant de définir des concepts linguistiques largement acceptés. Ces descripteurs couvrent les différentes thématiques linguistiques (syntaxe, sémantique, lexique, traduction, etc.). Il existe un groupe au sein du consortium CLARIN travaillant sur le développement des descripteurs ISOcat. Des formations sont proposées en France.


Langue des signes (sign language)

Le terme français de « langue des signes » provient de l’américain « sign language » (Mottez 1976, en référence à l’American Sign Language, ASL). Les langues des signes (LS), parfois également appelées « langues signées » (de l’américain « signed language »), sont les langues naturelles visuo-gestuelles développées, au fil de l’Histoire, en tous les lieux du monde où vivent un ou plusieurs sourds. Exploitant linguistiquement divers paramètres manuels (configuration, orientation, emplacement et mouvement) et corporels (regard, expression faciale, mouvements du corps, mouvements de la tête...), ces langues existent à divers stades de développement communautaire : langues des signes familiolectales de sourds isolés en milieu entendant (LS émergentes), LS micro-communautaires, LS macro-communautaires ou institutionnelles (ayant fait l’objet d’un enseignement). La Langue des Signes Française (LSF) est la LS (institutionnelle) pratiquée sur le territoire français.

Notion de langue vocale (LV) :

L’intégration —récente (1960)— des langues des signes parmi les langues naturelles humaines a engendré en retour la question de la dénomination spécifique des langues de modalité audio-phonatoire, qui avaient été seules prises en compte jusque là. Le terme de « langues orales », d’abord proposé et encore en usage, pose problème en raison de l’ambiguïté du terme « Oral » en français, qui réfère à la fois à la modalité audio-phonatoire (oral vs gestuel) et à l’utilisation de la langue en situation de face-à-face (oral vs écrit). A ce dernier égard, les LS sont en effet foncièrement des langues orales. C’est pour ces raisons que l’expression de « langue vocale », plus récente mais de plus en plus répandue, a été proposée pour désigner les langues de modalité audio-phonatoire. Le terme le plus courant dans la littérature anglo-saxonne est « spoken languages ».

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Licence (licence)

Une licence précise les termes dans lesquels des données, des programmes, ou des œuvres peuvent être cédés à des tiers. Elles peuvent préciser, par exemple, si l'utilisateur de la ressource a le droit ou non de redistribuer la ressource, de la modifier, de faire du commerce avec, etc. Les licences libres sur le modèle de la « GNU General Public Licence » sont très répandues dans la distribution des logiciels libres et ont inspirées d'autres types de licences applicables à des contenus (ressources linguistiques) comme les licences Creative Commons. Ces licences réaffirment que les œuvres sont couvertes par le droit d'auteur mais prévoient des cessions de droits pour les utilisateurs (droits de redistribution, de modification, etc.) Le dépôt d'une ressource sur un site d'archivage peut faire l'objet de l'acceptation d'une « licence » par le déposant, qui déclare ainsi bénéficier de tous les droits pour la diffusion de son dépôt dans les conditions du site.

Le dépôt d'une ressource sur un site d'archivage peut faire l'objet de la signature d'une « licence de contributeur » où le producteur garantit, entre autres, qu'il bénéficie de tous les droits pour la diffusion de son dépôt. Voir les exemples de licences utilisateur et contributeur : Licences SLDR

Les licences (commerciales ou non-commerciales) peuvent aussi être partagées entre les membres d'une institution ou d'une équipe. Voir : Licences partagées


Logiciels d'annotation (annotation softwares/applications)

Les données numériques sont souvent associées à des données symboliques (ou parfois analogiques) permettant de les décrire en détail et de les étudier (par exemple le contenu du discours, la forme des gestes, la direction du regard, etc.). Dans la plupart des cas, ces données symboliques sont associées à un certain point temporel ou à un certain intervalle temporel (on utilisera ici le terme d’alignement temporel). Il faut pour les créer et les éditer des outils spécialisés appelés « logiciels d’annotation ». Ces logiciels comme ELAN, CLAN, ANVIL, Transcriber, PRAAT, Transana sont souvent dédiés à l’étude du langage ou des gestes, ou d’annotations textuelles. D’autres logiciels comme ADVENE sont plus dédiés à l’annotation de séquences qu’à la transcription de corpus complets. Pour des usages plus spécialisés, on utilisera des outils génériques comme les tableurs ou les bases de données.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Mesures d'accord

Pour vérifier la cohérence des annotations produites lors d'une campagne d'annotation et donc la qualité d'un corpus annoté, on utilise différentes mesures d'accord ainsi que des métriques d'évaluation. Ces outils peuvent être utilisés pour comparer les annotations produites par différents annotateurs sur le même jeu de données (on parle alors de mesure inter-annotateurs) ou par un même annotateur à différents moments (on parle de mesure intra-annotateur). Dans la famille des accords inter-annotateurs (ou intra-annotateur), on peut distinguer quatre coefficients principaux qui sont le S de Bennet, le ? de Scott (ou ? de Carletta), le ? de Chronbach et le ? de Cohen. Ces coefficients s'appuient sur la proportion des accords observés et la proportion attendue d'accords obtenus par hasard. Ils se distinguent par la façon différente de calculer l'accord attendu :

Parmi les métriques d'évaluation, on retrouve le plus souvent la Précision, le Rappel, la F-mesure et le Slot Error Rate :


Métadonnées (metadata)

Informations qui permettent de documenter les données primaires (enregistrements) ou secondaires (annotations...), à la manière d'une fiche bibliographique pour un livre dans une bibliothèque.

Dans un sens restreint, une fiche de métadonnées caractérise un corpus à l'aide d'une liste d'attributs standards, destinés à être interprétés par des robots, dans le cadre du moissonnage (metadata harvesting de métadonnées). A l'état actuel, les catégories OLAC font office de standard dans le domaine de l'archivage de corpus de linguistique.

Une fiche OLAC peut s'avérer parfois insuffisante pour décrire certaines informations. Il est important, alors, que chaque communauté de recherche développe des solutions pour répondre à ces besoins en s'appuyant sur les standards internationaux comme la TEI ou ISOcat.

Il existe des éditeurs de métadonnées que l'on peut associer à un logiciel d'annotation: IMDI et ARBIL en sont des exemples, ils sont compatibles avec le logiciel ELAN.

D'autres "métadonnées" au sens large de documentation (tableaux excel, commentaires...), peuvent, en plus, accompagner les corpus, voire chacun des documents numériques.


Moissonnage (metadata harvesting)

Ce terme désigne le processus par lequel les métadonnées sont collectées auprès des entrepôts de données pour être rassemblées chez les fournisseurs de service (moteurs de recherche...). Pour que les métadonnées puissent être moissonnées (et que les corpus de données soient interopérables), elles doivent se conformer à des standards. Le protocole OAI-PMH, oblige minimalement l'utilisation du format Dublin Core et permet d'ajouter autant de format que nécessaire (Le format OLAC qui propose des extensions spécifiques à la linguistique est un complément utile pour des ressources de cette discipline).


Multilingue/plurilingue (corpus)

Nous entendons ici par corpus plurilingues des corpus dont les données enregistrées mettent en jeu des locuteurs bilingues ou plurilingues, maniant plusieurs langues dans les enregistrements. Les notations prennent en compte ces différences, cruciales pour les recherches sur le bi/plurilinguisme, les phénomènes d’hétéroglossie, d'alternance codique (code-blending et code switching), l’idéologie linguistique, l’acquisition de seconde langue, etc.

Nous distinguons cette situation d'une part des corpus de traduction (deux versions ou plus d'un même texte dans des langues différentes sont alignés) et des corpus utilisant une langue de description différente de la langue décrite (cf. Métalangue de description).

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Multimodalité (multimodality)

La communication humaine implique l’utilisation simultanée de plusieurs canaux, relevant de plusieurs modalités, participant toutes à l’interaction interpersonnelle. Ces canaux incluent la modalité audio-phonatoire (parole) et la modalité visuo-gestuelle (regards, gestes, autres mouvements et positions du corps, signes...), cette dernière constituant la modalité principale définissant les langues des signes, qui sont organisées en des systèmes de différents types d’unités gestuelles.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Numérisation (digitizing/digitization)

Cette opération consiste à passer d’une donnée originale dite analogique de type film, enregistrement sonore, photographie, sculpture, à une donnée stockée sur ordinateur dans une description purement numérique. L’opération s’applique en particulier aux cassettes VHS, aux cassettes audio et aux photographies argentiques, ainsi qu'à tous les supports anciens de type "bandes magnétiques". Dans les formats récents, de type DV, AVCHD, MP3, JPEG, il s’agit simplement de transférer les données numériques stockées sur l’enregistreur vers l’ordinateur de destination. Si une transformation est nécessaire avant l’usage, on parlera alors ici de conversion. La qualité de la numérisation joue de manière fondamentale sur la qualité des données obtenues car c’est une opération irréversible. La qualité de la numérisation est donc fondamentale et ne supprime pas totalement la notion de conservation des originaux.

La numérisation est toutefois incontournable aujourd'hui car elle permet, en théorie, une conversion à très long terme des données, ainsi que leur manipulation sur ordinateur.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


OAI-PMH

Open Archive Initiative - Protocol for Metadata Harvesting. Protocole permettant à un entrepôt de données numériques de dialoguer avec un fournisseur de service (par exemple un moteur de recherche). Les métadonnées échangées dans le cadre de ce protocole sont codées au format XML. Voir OAI-PMH for beginners sur le site Open Archives Forum. Ce protocole exige la présence minimale de métadonnées au format Dublin Core oai_dc (15 descripteurs) mais il est prévu pour servir simultanément des métadonnées dans des formats plus élaborés tels que le Dublin Core OLAC qui propose des descripteurs spécifiques au champ de la linguistique (extensions OLAC) ou les métadonnées CMDI préconisées par CLARIN, METS, TEI, RDF etc.


OAIS

Open Archival Information System. Il s'agit d'une norme ISO (14721:2003)définissant un modèle de référence pour tout système d'archivage de l'information sur le long terme. Le modèle OAIS propose un cadre conceptuel et terminologique définissant en particulier un modèle de l'information et un modèle fonctionnel guidant la mise en place d'un système ou d'un service d'archivage.


OLAC

Open Language Archives Initiative. Organisation , émanant d'un partenariat international ayant comme objectif d'unifier les pratiques et de créer un réseau de services pour la mise à disposition de ressources linguistiques. Cette organisation définit un format de description (schéma de métadonnées) et fournit des outils pour la communauté (agrégateur, statistiques, analyse qualité, moteur de recherche à facettes). Les métadonnées moissonnées par OLAC comprennent 201493 ressources, concernant 6909 langues vivantes et 515 langues mortes (données au 15 septembre 2014, d'après les statistiques publiées sur leur site.

En tant qu'instance fédératrice, OLAC développe des normes dans la perspective de rendre les données interopérables. Entre autres, OLAC propose une extension "linguistique" des métadonnées Dublin Core : http://www.language-archives.org/REC/olac-extensions.html.


Ontologie (ontology)

L'ontologie, dans la sphère du web sémantique, formalise les descripteurs et leurs relations dans un domaine donné (ex. linguistique). Cette formalisation sémantique (relations), au-delà d'une description standard (TEI, ISOcat), permet d'effectuer des raisonnements automatisés sur les données. La communauté GOLD (projet financé par E-MELD, The Linguist List) travaille sur la définition d'une ontologie basée sur les pratiques dans tous les domaines de la linguistique.


Oral vs. écrit (oral vs. written)

Dans l'usage courant, l’oral correspond à l'une des modalités d'utilisation du langage faisant appel, pour ce qui concerne les langues vocales, au système phonatoire et articulatoire pour sa production, et au système auditif pour sa réception. Le recours à des signes co-verbaux ou non verbaux, tels que les expressions faciales et les gestes, ainsi que l'apport de la modalité visuelle pour leur réception, caractérisent également cette modalité. L'oral s'oppose principalement à la modalité écrite. En ce sens plus large, l'oral englobe aussi bien les langues des signes que les langues vocales.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Parties du discours (part of speech, POS)

Catégories (morpho-)syntaxiques/grammaticales (nom, verbe, ...) utilisées dans l'annotation de corpus écrits ou oraux.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Pérennisation (long-term preservation)

« fait de conserver à Long terme l’information sous une forme correcte et Immédiatement compréhensible. » [OAIS traduction français]. Il s'agit de l'ensemble des actions nécessaires à la conservation de l'intégrité, de l'authenticité et la lisibilité de l'information. Le « long terme » étant définit dans cette même norme comme une « période suffisamment longue pour qu’il soit nécessaire de prendre en compte les changements technologiques, et notamment la gestion des nouveaux supports et formats de données ainsi que l’évolution de la communauté d’utilisateurs. Cette période n’est pas limitée dans le temps. ». Voir également la distinction entre la pérennisation et la sauvegarde sécurisée sur le site du CINES.


Phase gestuelle (gesture phase)

Chaque geste peut se décomposer en plusieurs phases gestuelles (Kendon, 1980) comme la préparation (en anglais, preparation, mise en place des articulateurs), après laquelle vient une phase de réalisation (partie signifiante du geste, en anglais stroke), qui peut être précédée ou suivie d’une tenue, en anglais hold (les articulateurs font une pause). Kita (1990) distingue la tenue qui précède la phase de réalisation, pre-stroke hold, de celle qui suit la phase de réalisation, post-stroke hold. Certains gestes sont statiques et non pas dynamiques et comptent une préparation et une tenue, mais pas de phase de réalisation. Enfin, soit un deuxième geste s’enchaîne directement sur le premier, soit il y a une phase de rétraction (en anglais, retraction, retour des articulateurs à une position de repos). Cette rétraction peut être partielle si la configuration manuelle n’est plus tenue mais que les articulateurs ne retournent pas (totalement) à la position de repos. Le geste peut également inclure un battement et s’achever par un léger rebond de la main, en anglais recoil.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Phrase gestuelle (gesture phrase)

Une phrase gestuelle comprend une ou plusieurs phases gestuelles et peut être comprise comme un geste, relevant d’une intention de communication. Dans une séquence où plusieurs gestes sont enchaînés, elle se différencie des phrases gestuelles environnantes par un contraste de configuration manuelle, de trajectoire du mouvement ou de mode de réalisation (mono-manuel vs. bi-manuel par exemple) pendant la phase de réalisation des gestes (stroke). Différentes typologies sont utilisées pour noter la fonction des phrases gestuelles.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Piste d'annotation (tier, track)

Certains logiciels permettent d’annoter des événements sur une ou plusieurs pistes (parfois nommées tiers, ou tires), définies par l’annotateur, et dans lesquelles les phénomènes annotés sont alignés temporellement sur le signal audio et/ou vidéo. Les pistes permettent d’annoter sur plusieurs lignes des phénomènes de nature différente (voir aussi Schéma d’annotation)

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


RDF

Resource Description Framework. Modèle conceptuel de description non ambigüe, normalisé pour le W3C (web sémantique : web des données liées par des relations sémantiques). Les ressources sont identifiées à l'aide d'un identifiant uniforme (URI ou //Uniform Ressource Identifier//), et leurs relations peuvent être exprimées par des triplets de la forme sujet/prédicat/objet. Ce modèle peut être appliqué aux métadonnées des ressources linguistiques. Il est moissonné par ISIDORE, le moteur de recherche de ressources SHS développé par le TGE-Adonis.


Ressource (ressource)

Le terme "ressource" désigne, dans le cadre des corpus oraux, une unité que l'on peut décrire et identifier. Il peut s'agir d'un enregistrement (donnée primaire), d'une transcription ou annotation (donnée secondaire), d'une documentation (article...), d'un outil (application, logiciel, plugin...) ou encore d'un ensemble d'éléments liés (base de données, répertoire de fichiers...). Les "corpus", "collections" ou autres regroupements de ressources peuvent également être considérés comme des ressources s'ils sont identifiés et décrits en tant que tels.


Schéma d'annotation (annotation scheme)

Il s’agit de modèles à constituer préalablement à l’annotation, rassemblant et éventuellement documentant les pistes à annoter, ainsi que les relations de filiation, d’alignement temporel, d’association ou de subdivision entre ces pistes. Ces schémas servent à définir et à stabiliser un ensemble d’annotations indépendamment du nombre d’annotateurs et du nombre de corpus. Ceci d’une part parce qu’ils constituent des modèles, « templates » ou grilles d’annotation généralement applicables directement sur les données primaires (texte, son, image, vidéo) via les logiciels d’annotation. D’autre part, parce que quelle que soit leur dénomination — pistes d’annotations, tiers ou tires —, les items associés à chaque pistes peuvent constituer un Vocabulaire Contrôlé (VC) restreint, défini et univoque, utilisé a priori de la même façon par différents annotateurs sur plusieurs enregistrements.

La constitution de ces schémas d’annotation doit prendre en compte de multiples paramètres. Citons les principaux : les questions de recherche posées, les types de données et la manière dont celles-ci ont été captées ou obtenues, les possibilités offertes par le logiciel d’annotation comprenant également les modalités de requête et, plus généralement, la reproductibilité de ces annotations (accord inter-annotateurs). Dans l’idéal, tout schéma d’annotation constitue la phase d’opérationnalisation entre les hypothèses de recherche, d’une part, et les données à disposition, d’autre part. A ce titre, un travail minutieux, parfois long et collectif, préside à la constitution du schéma d’annotation avant toute annotation, même si des aller-retour permettent d’éprouver le modèle.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Segmentation

Toute analyse repose sur une étape de segmentation ayant pour objectif d'identifier des unités de traitement (qui ne seront pas nécessairement conservées pour l'analyse). On segmente ainsi généralement le signal audio en unités inter-pausales (segments de parole entre des pauses de plus de 200ms) ou la transcription en tokens (unités lexicales pouvant être complexes). La segmentation peut concerner des domaines et des niveaux différents : segmentation en phrases, en unités de discours, etc. La ponctuation peut ici jouer un rôle important à l'écrit, mais également par une transposition de cette notion à l'oral, c'est-à-dire par un balisage de la transcription (qu'il soit basé sur des critères prosodiques, syntaxiques ou pragmatiques).

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Standard, norme (standard)

Référentiel commun défini par un organisme spécialisé, favorisant l'interopérabilité des ressources. En matière de nomenclature et de vocabulaire contrôlé, le consortium TEI et l'ISO (Organisation internationale de normalisation) remplissent cette fonction. En matière de métadonnées pour documenter des ressources linguistique numériques, le consortium européen CLARIN oeuvre pour la définition d'un standard modulaire plus souple et répondant mieux aux besoins spécifiques au domaine. les conventions (de transcription ou d'annotation) n'ont pas le statut officiel des standards, mais peuvent s'imposer dans une sphère plus ou moins large et assurer partiellement ce rôle.


Support d'enregistrement (recording medium)

Les enregistrements analogiques ou numériques doivent être stockés en temps réel sur un support. Dans le cas de son analogique, on pensera souvent aux bandes magnétiques et cassettes audio, mais les disques vinyles sont aussi des supports sonores analogiques. Dans le cas d’images ou de vidéos, on pensera à tous les types de cassettes magnétiques : VHS, Betamax, U-Matic, HI8 pour citer les plus connus. Des supports analogiques existent pour certains instruments de mesure. Lorsque l’on parle de support numérique, on fait universellement référence à des mémoires pouvant être connectées sur un ordinateur. Les principaux types aujourd’hui sont le disque dur et la mémoire dite permanente, utilisée dans les clés USB, les disques SSD et les cartes de type SD, Memory Stick, XD. A noter qu’il existe des supports numériques sur cassette, notamment les DAT pour l’audio ou le DV pour la vidéo ou pour certaines sauvegardes informatiques.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


TEI

Text Encoding Initiative. Il s'agit d'un consortium ayant comme objectif de définir des standards en matière de représentation textuelle au format numérique (et plus précisément, de texte lisible par la machine). Le terme TEI renvoie également aux recommandations qui émanent du consortium. Il s'agit de conventions de balisage de textes sous la forme élément/attribut, encodées en XML. Le schéma TEI possède une architecture évolutive qui accepte d'être enrichie d'éléments propres à un domaine particulier. C'est pourquoi il existe des groupes de travail et des ateliers sur l'annotation oeuvrant pour la standardisation d'éléments TEI "métiers". Encore une fois, c'est la standardisation qui sera garante de l'interopérabilité et du potentiel scientifique des informations encodées.


Tour de parole (Speech turn)

Deux acceptions sont possibles.

Dans la première, le tour de parole désigne un empan de texte (enregistrement) où un locuteur garde la parole sans interruption majeure. Dans cette acception, les tours de parole peuvent se chevaucher et un simple "mh" constituer un tour de parole.

En socio-linguistique, les tours de parole désignent une prise de parole qui implique un changement de tour de parole.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Transcription (transcription)

La transcription est l’image écrite du continuum sonore (langues vocales) ou gestuel (langues des signes,gestualité). Elle peut être orthographique, phonétique ou (morpho-)phonologique, et peut contenir des informations périlinguistiques (rires, indications contextuelles, etc.). La transcription est associée à un fichier-son ou un fichier-vidéo. La transcription est une instance particulière de l'annotation, distincte de la glose.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


Unité Gestuelle (gestural unit)

Dans les études sur les diverses langues des signes (LS), on s’accorde à identifier quatre grands types d’unités gestuelles autonomes :

  1. les unités conventionnelles, de type lexématique (couramment appelées « signes » —ang. signs, ou « words »—, ou « frozen signs ») ;
  2. les unités non conventionnalisées, diversement analysées et qualifiées selon les approches théoriques (« constructions à classificateurs », « productive signs », « unités de transfert », etc.) ;
  3. les pointages (« pointing signs ») ;
  4. les unités dactylologiques (qui représentent chacune une lettre de la langue vocale écrite et constituent un « alphabet dactylologique », dont la forme et le degré de fonctionnalisation varient selon les LS).

La question du statut (linguistique ou « gestuel », périphérique ou central) des unités non conventionnalisées, de leur fonction dans les LS et de leurs interrelations avec les autres types d’unités, d’une part, celle du statut de leurs composants d’autre part, comptent parmi les points centraux de clivages et de débats dans le champ.

Dans les études portant sur la gestualité, une unité gestuelle est définie depuis le moment où les articulateurs partent d'une position où ils sont relâchés jusqu'au moment où ils reviennent dans le même type de relâchement. Cette unité gestuelle comprend une phrase gestuelle et une ou plusieurs phases gestuelles.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)


URL Pérenne

cf. Identifiant pérenne.


Vocabulaire contrôlé (controlled vocabulary)

Ensemble de valeurs prédéfinies dans un standard (ex. TEI, OLAC, ISOcat), une convention d'annotation ou par l'annotateur, le plus souvent saisies dans un logiciel d’annotation, qui permet de coder des informations de manière non ambigüe et de rester cohérent tout au long du processus d’annotation. L'utilisation d'un vocabulaire contrôlé permet de rendre exploitables les informations annotées par un logiciel, des expressions régulières ou des scripts.

Contenu validé par le Groupe de Travail 4 (multimodalité et modalité visuo-gestuelle)