Nous définissons ici les termes employés dans les fiches de description des outils.
Annotation | Le terme « Annotation » renvoie ici à de l’annotation manuelle (sémantique par exemple) par l’utilisateur, et donc au processus qui consiste à assigner une ou plusieurs étiquettes ou balises à un élément textuel. |
Concordance | Méthode d’extraction textuelle basée sur la présentation d’extraits textuels contenant tous le même mot ou la même séquence, le même motif. |
Segments répétés | Pratique d’exploration textuelle consistant à repérer automatiquement les séquences qui se répètent significativement dans un même texte, ou d’un texte à l’autre au sein d’un corpus (autres termes liés: motifs, phraséologies, idiomes, etc.). |
Cooccurrences | Méthode d’exploration consistant à repérer automatiquement les associations de mots apparaissant simultanément et de manière statistiquement significative dans le même contexte. |
Explorer la structure d’un corpus | Approche inductive consistant à explorer l’organisation d’un corpus, i.e. les associations et les oppositions principales qui sous-tendent un ensemble de données. |
Mettre à jour les spécificités d’une partition | Approche d’exploration de corpus basée sur un découpage du corpus en parties; la méthode consiste à extraire pour chaque partie ses unités les plus spécifiques à l’aide de mesures statistiques (loi hypergéométrique, valeur-test, etc.) |
Alignement | Mise en parallèle graphique de deux états d’un même texte (e.g. un texte et sa traduction, un texte produit en T1 et sa version ultérieure, produite en T2, etc.). |
Visualisation topologique | Méthode de représentation graphique de la séquentialité d’un texte. |