TXM

Plateforme modulaire et open-source de textométrie : textométrie sur corpus tout venant ou structurés, annotés et alignés, préparation de corpus, mise en ligne de corpus.

txm_portail_edition_synoptique  txm_specif_motif

FICHE DESCRIPTIVE DE L’OUTIL

 

Dernière version TXM 0.7.6 (juillet 2014)
Responsable du projet Serge Heiden
Accessibilité Téléchargement
Site Web http://textometrie.ens-lyon.fr/
Interface – Ergonomie -Interface conviviale : interface graphique utilisateur classique avec fenêtres multiples, widgets, barre d’outils et windows manager intégré (Eclipse RCP pour la version bureau ou GWT pour la partie client dans le navigateur web de la version portail) ;
-Ergonomie : assistants de construction de requêtes, de sous-corpus ou de partitions, interface traduite en français, anglais et russe ;
-Interface experte : version bureau pilotable également par scripts Groovy ou R, version portail interrogeable par API Restful (prototype).
Systèmes -Windows (32 et 64 bits) ;
- Mac OS X ;
- Linux (32 et 64 bits) ;
- Version portail Web ;
Licence GPLv3
Format des corpus en entrée Une quinzaine de formats d’import déjà définis + import personnalisé possible par script. Les formats déjà définis vont du texte brut (presse-papier, fichiers .txt) au texte structuré (XML dont une dizaine d’usages TEI différents), en passant par des formats de production de corpus (Factiva, Europresse), de transcription de l’oral (Transcriber), de corpus annoté (Cordial, Tiger Search), de corpus parallèle (TMX) ou d’analyse de corpus (Hyperbase, Alceste). Travaille en UTF-8 mais peut importer et exporter d’autres encodages.
Format des corpus en sortie -Exports des tableaux par copier/coller ou au format tableur générique csv ;
-Export des graphiques en svg, pdf, bmp, jpeg, png, gif ;
-Production d’une version XML-TEI du corpus
Fonctionnalités -Concordances ;
-Coocurences ;
-Lexique et Index ;
-Spécificités sur une partition
-Recherche de motifs…;
voir plus de fonctionnalités
Annotations gérées par l’outil Toute annotation XML, lexicale (étiquettes) ou/et textuelle (structuration) ; annotation Cordial ; possibilité d’ajout d’un étiquetage TreeTagger à la volée.
Documentation Manuel d’utilisation
Type d’outil Analyse

PRATIQUES ET USAGES DE TXM

  • Fiches renseignées par :

Sergen Heiden (ICAR, Université de Lyon) – Céline Poudat (BCL, Université de Nice Sophia Antipolis) –  Béatrice Turpin(Université de Cergy Pontoise) – Denis Vigier (ICAR, Université Lumière Lyon II )

  • Fiche 1 : 
Objectifs de recherche Conception (S.Heiden) / Etude du genre de l’article de recherche (C.Poudat) / Etude quantitative et qualitative de la combinatoire de mots lexicaux ou grammaticaux (D. Vigier) / Analyse de corpus journalistiques (B.Turpin)
Pratiques Concordance
Scénarios Concordance sur corpus annotés, gestion du multiniveau avec CQP, utilisation d’expressions régulières dans tous les éléments de la requête, nombreuses possibilités de tris, paramétrage du contexte, retour au texte, interconnexion des fonctionnalités (cooccurrences, ventilations, tables lexicales…)
  • Fiche 2 :
Objectifs de recherche Identifier et caractériser des usages linguistiques propres à une typologie textuelle
Pratiques Mettre au jour les spécificités d’une partition
Scénarios Spécificités, loi hypergéométrique

Signaler des erreurs et/ou proposer des modifications

Donner votre avis sur l’outil : 

Interface - Ergonomie
4
Fonctionnalités
4
Facilité d utilisation
4
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

AntConc

Logiciel d’analyse textuelle

antconc_02 antconc_12

Fiche descriptive de l’outil

Responsable du projet Laurence Anthony – Université de Waseda (Japon)
Dernière version AntConc  3.4.3
Accessibilité Téléchargement en ligne gratuit ici
Systèmes Windows XP, Vista, Win 7, Win 8, Mac
Interface – Ergonomie Interface simple et facile d’utilisation
Format des corpus en entrée TXT, HTML et XML
Format des corpus en sortie Exploitation des résultats sous Excel
Fonctionnalités Concordances (création et tri) – Concordances avancées (expressions régulières, listes) –
Utilisations des motifs recherchés : Word List, clusters, collocates, keyword list
Annotations gérées par l’outil Corpus textuel brut
Manuel, Documentation En françaisEn anglais
Type d’outil Analyse

Pratiques et usages d’AntConc

  • Fiche 1 :
Objectifs de recherche Linguistique de corpus – Travail sur le sens des mots en contexte
Visée Linguistique de corpus
Pratiques Concordance
Scénarios Corpus non annotés – Concordancier sur chaînes textuelles – Visualisation topologique (« concordance plot ») –  Regexp sur les mots (jokers)
  • Fiche 2 :
Objectifs de recherche Linguistique de corpus
Pratiques Mettre au jour les spécificités d’une partition
Scénarios Fonction Keyword, indice de keywordness

 

 

Signaler des erreurs et/ou proposer des modifications
 
 

Donner votre avis sur l’outil : 

Interface - Ergonomie
4
Fonctionnalités
4
Facilité d utilisation
4
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

 

Analec

Logiciel d’annotation et d’analyse de corpus écrits

analec3 analec2

FICHE DESCRIPTIVE DE L’OUTIL

 

Responsable du projet Bernard Victorri – LaTTiCe (ENS-CNRS)
Dernière version 23 avril 2014 – Analec 1.4
Accessibilité Téléchargement en ligne gratuit ici
Systèmes Windows, Mac et Unix – Moteur virtuel Java nécessaire
Interface – Ergonomie Onglets donnant accès à différentes opérations (règles, statistiques, schémas, structure, etc.)
Format des corpus en entrée Corpus au format texte brut – Compatibilité GLOZZ en entrée et en sortie
Format des corpus en sortie TXT, CSV, GLOZZ
Fonctionnalités Gestion, regroupement, visualisation et impression de
corpus annoté ; annotation ergonomique (via le concept de vue, à l’aide de filtrages élaborés des informations disponibles); calculs de fréquences ; recherche de corrélations ; générations de tableaux de chiffres et de schémas etc.
Annotations gérées par l’outil Possibilité de définir son propre schéma d’annotation (morpho, syntaxe, sémantique), Syntex.
Concordance = outil de visualisation des annotations sur le texte
Manuel, Documentation Guide d’utilisation
Type d’outil Annotation – Analyse

PRATIQUES ET USAGES D’ANALEC

1. Fiche renseignée par : Frédéric Landragin (LaTTiCe – CNRS) et Thierry Poibeau (LaTTiCe -CNRS)

Objectifs de recherche Analyse (annotation, visualisation, interrogation) des chaînes de coréférence d’un texte ; analyse des éléments initiaux des phrases d’un texte ; analyse de marqueurs spécifiques – Visualisation des interrogations sur les annotations apportées grâce à ANALEC – Analyse des marqueurs de temporalité et d’aspect dans un corpus
Visée Annotation -VISU – AFC – Tables de corrélations
Scénarios Possibilité de faire évoluer la structure des annotations (schéma d’annotation) tout en annotant (de manière dynamique)

2. Fiche renseignée par : Frédéric Landragin (LaTTiCe) et Laurence Longo (Université de Strasbourg)

Objectifs de recherche Analyse de la structure discursive (macro-syntaxe) d’un texte, chaînes de coréférence
Visée Annotation XML manuelle de segments et de relations entre unités du texte
Scénarios Annotation, possibilité d’interroger les données annotées via un langage de requête évolué, GLOZZQL, prise en compte des différents annotateurs et calcul de scores inter-annotateurs

 

EXEMPLES D’UTILISATEURS INSTITUTIONNELS

  • LaTTiCe (ENS-CNRS) – Projet PEPS MC4 « Modé­li­sation Contrastive et Com­pu­ta­tion­nelle des Chaînes de Coréférence »

 
Signaler des erreurs et/ou proposer des modifications
 
 
Donner votre avis sur l’outil : 

Interface - Ergonomie
3
Fonctionnalités
3
Facilité d utilisation
3
Moyenne
  Chargement, attendez s'il vous plait yasr-loader