Glossaire

Nous définissons ici les termes employés dans les fiches de description des outils.

 

Annotation Le terme « Annotation » renvoie ici à de l’annotation manuelle (sémantique par exemple) par l’utilisateur, et donc au processus qui consiste à assigner une ou plusieurs étiquettes ou balises à un élément textuel.
Concordance Méthode d’extraction textuelle basée sur la présentation d’extraits textuels contenant tous le même mot ou la même séquence, le même motif.
Segments répétés Pratique d’exploration textuelle consistant à repérer automatiquement les séquences qui se répètent significativement dans un même texte, ou d’un texte à l’autre au sein d’un corpus (autres termes liés: motifs, phraséologies, idiomes, etc.).
Cooccurrences Méthode d’exploration consistant à repérer automatiquement les associations de mots apparaissant simultanément et de manière statistiquement significative dans le même contexte.
Explorer la structure d’un corpus Approche inductive consistant à explorer l’organisation d’un corpus, i.e. les associations et les oppositions principales qui sous-tendent un ensemble de données.
Mettre à jour les spécificités d’une partition Approche d’exploration de corpus basée sur un découpage du corpus en parties; la méthode consiste à extraire pour chaque partie ses unités les plus spécifiques à l’aide de mesures statistiques (loi hypergéométrique, valeur-test, etc.)
Alignement Mise en parallèle graphique de deux états d’un même texte (e.g. un texte et sa traduction, un texte produit en T1 et sa version ultérieure, produite en T2, etc.).
Visualisation topologique Méthode de représentation graphique de la séquentialité d’un texte.