CLAN

 

CLAN est un logiciel permettant l’analyse de données transcrites dans le format CHILDES. Ce logiciel facilite la transcription et l’analyse d’interactions verbales et non verbales sous forme de liste de segments textuels (chaque ligne/paragraphe correspond par exemple à une prise de tour) qui peuvent être alignés avec un signal audio ou vidéo. CLAN facilite l’insertion de la représentation de catégories syntaxiques, morphologiques et phonétiques sous forme d’annotations linéaires (segmentation des prises de tours et annotation dans des lignes parallèles).

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projet Brian MacWhinney et Leonid Spektor, Carnegie Mellow University
Dernière version
Accessibilité
Site web http://childes.psy.cmu.edu/
Systèmes Macintosh, Windows, Unix
Interface – Ergonomie
Format des corpus en entrée
Format des corpus en sortie
Fonctionnalités  Annotation, Alignement, Visualisation, Video, Fouille/Analyse
Annotations gérées par l’outil
Documentation http://childes.psy.cmu.edu/manuals/CLAN.pdf
Type d’outil

Nom de l'outil (obligatoire)

Votre nom (obligatoire)

Votre email (obligatoire)

Pour ajouter des pratiques et des usages, merci de remplir le fichier joint et de le transmettre par mail à l’adresse : explorationcorpus@gmail.com

Interface - Ergonomie
2
Fonctionnalités
2
Facilité d utilisation
2
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

Arbil

Arbil is an application for arranging research material and associated metadata into a format appropriate for archiving. Arbil is designed so that it can be used off line in remote locations. The data can be entered at any stage in part or as a whole. When an internet connection is available the work can then be transferred to the main archive via Lamus.

 

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projet
Dernière version
Accessibilité Téléchargement : https://tla.mpi.nl/tools/tla-tools/arbil/
Site web https://tla.mpi.nl/tools/tla-tools/arbil/
Systèmes Windows, Linux, MacOs
Interface – Ergonomie
Format des corpus en entrée
Format des corpus en sortie
Fonctionnalités Organisation des données
Annotations gérées par l’outil
Documentation https://tla.mpi.nl/tools/tla-tools/arbil/
Type d’outil

 

Signaler des erreurs et/ou proposer des modifications
 
 

Donner votre avis sur l’outil : 

Interface - Ergonomie
0
Fonctionnalités
0
Facilité d utilisation
0
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

Anvil

ANVIL is a free video annotation tool, developed by Michael Kipp. It offers multi-layered annotation based on a user-defined coding scheme. During coding the user can see color-coded elements on multiple tracks in time-alignment. Some special features are cross-level links, non-temporal objects, timepoint tracks, coding agreement analysis, 3D viewing of motion capture data and a project tool for managing whole corpora of annotation files. Originally developed for gesture research in 2000, ANVIL is now being used in many research areas including human-computer interaction, linguistics, ethology, anthropology, psychotherapy, embodied agents, computer animation and oceanography.

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projet Michael Kipp
Dernière version Version 5.1.16
24 Apr 2016
Accessibilité Téléchargement : http://www.anvil-software.org/download/index.html
Site web http://www.anvil-software.org/#
Systèmes Windows, Linux
Interface – Ergonomie
Format des corpus en entrée
Format des corpus en sortie
Fonctionnalités Organisation des données, Annotation, Alignement, Visualisation, Video, Fouille/Analyse
Annotations gérées par l’outil
Documentation  http://www.anvil-software.org/#
Type d’outil

Nom de l'outil (obligatoire)

Votre nom (obligatoire)

Votre email (obligatoire)

Pour ajouter des pratiques et des usages, merci de remplir le fichier joint et de le transmettre par mail à l’adresse : explorationcorpus@gmail.com

 

 

Interface - Ergonomie
0
Fonctionnalités
0
Facilité d utilisation
0
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

UAM Corpus Tool

The UAM CorpusTool is a state-of-the-art environment for annotation of text corpora. So, whether you are annotating a corpus as part of a linguistic study, or building a training set for use in statistical language processing, this is the tool for you.

 
 

FICHE DESCRIPTIVE DE L’OUTIL

 
 

Responsable du projet Mick O’Donnell
Dernière version 3.3
Accessibilité Téléchargement : http://www.corpustool.com/download.html
Site web http://www.corpustool.com/
Systèmes Windows, MacOS
Interface – Ergonomie
Format des corpus en entrée
Format des corpus en sortie
Fonctionnalités
Annotations gérées par l’outil
Documentation
Type d’outil

 
Signaler des erreurs et/ou proposer des modifications
 
 
Donner votre avis sur l’outil : 

Interface - Ergonomie
0
Fonctionnalités
0
Facilité d utilisation
0
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

ANNIS

A web browser-based search and visualization architecture for complex multilayer linguistic corpora with diverse types of annotation.
ANNIS is an open source, cross platform (Linux, Mac, Windows), web browser-based search and visualization architecture for complex multi-layer linguistic corpora with diverse types of annotation. ANNIS, which stands for ANNotation of Information Structure, was originally designed to provide access to the data of the SFB 632 – “Information Structure: The Linguistic Means for Structuring Utterances, Sentences and Texts”. It has since then been extended to a large number of projects annotating a variety of phenomena. Since complex linguistic phenomena such as information structure interact on many levels, ANNIS addresses the need to concurrently annotate, query and visualize data from such varied areas as syntax, semantics, morphology, prosody, referentiality, lexis and more. For projects working with spoken language, support for audio / video annotations is also required.

 

FICHE DESCRIPTIVE DE L’OUTIL

 
 

Responsable du projet Thomas Krause (LAUDATIO, Humboldt-Universität zu Berlin), Amir Zeldes (Georgetown University), Shuo Zhang (Georgetown University), Florian Zipser (LAUDATIO, Humboldt-Universität zu Berlin), Martin Klotz
Dernière version 3.4.4
Accessibilité Téléchargement : http://corpus-tools.org/annis/download.html
Site web http://corpus-tools.org/annis/
Systèmes Windows, Linux, MacOS
Interface – Ergonomie
Format des corpus en entrée
Format des corpus en sortie
Fonctionnalités
Annotations gérées par l’outil  Multiples
Documentation
Type d’outil Analyse, Annotation

 

 

Signaler des erreurs et/ou proposer des modifications
 
 

Donner votre avis sur l’outil : 

Interface - Ergonomie
0
Fonctionnalités
0
Facilité d utilisation
0
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

The Sketch Engine

Ce système de gestion de corpus payant est accessible en ligne (il existe aussi une version téléchargeable). Il offre actuellement l’accès à 286 corpus en 66 langues différentes (relevé en août 2015). Les utilisateurs et utilisatrices disposent également d’un espace personnel, partageable avec d’autres personnes inscrites. Sketch Engine permet le dépôt de ses propres corpus, dans la limite d’un million de mots en tout. Ce volume peut être augmenté moyennant des frais mensuels ou annuels supplémentaires. Il est également possible de créer, par webcrawling, des corpus dits « spécialisés » à partir de mots-clés que l’on choisit personnellement.

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projet Kilgarriff, A. (†2015), Rychly, P. & Pomikalek J.
Dernière version Version stable : 3.56.6 ; version beta : 3.71
Accessibilité Téléchargement : https://www.sketchengine.co.uk/local-installations/
Site web https://www.sketchengine.co.uk/
Systèmes Linux
Interface – Ergonomie Interface très conviviale et intuitive
Format des corpus en entrée XML
Format des corpus en sortie XML
Fonctionnalités
Annotations gérées par l’outil Annotation automatique des corpus bruts. Les types d’annotation dépendent des langues. Pour l’allemand, il s’agit actuellement de RFTagger
Documentation https://www.sketchengine.co.uk/xdocumentation/wiki
Type d’outil Analyse, Annotation

PRATIQUES ET USAGES – The Sketch Engine

  • Fiche renseignée par : Eva Schaeffer-Lacroix

Objectifs de recherche
Dans un contexte d’enseignement-apprentissage d’un langue étrangère, un corpus représentant un genre textuel en particulier, déposé par l’enseignant-e de langues, peut servir d’aide à la production écrite et / ou de support pour des discussions métalinguistiques entre apprenant-e-s, avec ou sans l’enseignant-e (cf. les concepts d’apprenant-chercheur ou apprenant-linguiste).
Visée  Mieux percevoir la « résonance » d’un terme ; se rendre compte de son’usage en contexte, etc.
Pratiques Concordancier, listes de fréquence, collocations, ConcDesc
Scénarios Projets ayant comme tâche principale la réalisation d’une production écrite (exemples : écrire une critique de film ; remplir le journal de bord en lien avec une sortie de type geocaching).

 

Signaler des erreurs et/ou proposer des modifications
 
 
Donner votre avis sur l’outil : 

Interface - Ergonomie
1
Fonctionnalités
1
Facilité d utilisation
1
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

TextObserver

Le chantier Textopol du Céditec développe TextObserver, outil de d’observation et d’exploitation des données textuelles multidimensionnelles. TextObserver a été conçu pour répondre à des questions de recherche faisant intervenir la variation. La conception de TextObserver repose sur un principe ergonomique et cognitif essentiel qui le différencie des outils textométriques ou lexicométriques classiques: l’interactivité. Chaque action de l’utilisateur entraîne un résultat, unique et immédiat. Grâce à ce principe essentiel l’utilisateur saisit immédiatement la signification de ce qui se passe à l’écran.

 
 

FICHE DESCRIPTIVE DE L’OUTIL

 
 

Responsable du projet Jean-Marc Leblanc
Dernière version Alpha : Textobserver 39
Accessibilité Téléchargement : http://textopol.u-pec.fr/textobserver/textobserver39.zip
Site web http://textopol.u-pec.fr/textobserver/
Systèmes Windows
Interface – Ergonomie
Format des corpus en entrée txt, xls, png, svg
Format des corpus en sortie txt, xls, png, svg
Fonctionnalités
Annotations gérées par l’outil xml (sur les parties : création d’attributs libres, sur les mots : pos, lemme, et balises libres voir les spécificités sur le site de textobserver)
Documentation http://textopol.u-pec.fr/textobserver/
Type d’outil Analyse

PRATIQUES ET USAGES – Textobserver

  • Fiche renseignée par : Jean-Marc LEBLANC
Objectifs de recherche
Examiner les phénomènes de variation
Visée
Pratiques Exploration de corpus implémentation du mouvement, proposition de visualisations originales
Scénarios

 
Signaler des erreurs et/ou proposer des modifications
 
 
Donner votre avis sur l’outil : 

Interface - Ergonomie
8
Fonctionnalités
8
Facilité d utilisation
8
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

IRaMuTeQ

IRaMuTeQ  est un logiciel d’analyse statistiques de données textuelles.

 
 

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projet  Pierre Ratinaud
Dernière version  0.7 alpha 2
Accessibilité Téléchargement : http://www.iramuteq.org/telechargement
Site web  http://www.iramuteq.org
Systèmes  Windows, Linux, MacOS
Interface – Ergonomie  wxpython
Format des corpus en entrée  csv
Format des corpus en sortie  csv
Fonctionnalités  
Annotations gérées par l’outil
Documentation http://www.iramuteq.org/documentation
Type d’outil Analyse

PRATIQUES ET USAGES – IRaMuTeQ

  • 1. Fiche renseignée par : Pierre Ratinaud
Objectifs de recherche
Détermination des thématiques d’un texte.
Détermination de l’organisation des formes dans un texte
Recherche de lien entre métadonnées et thématiques
Visée
Pratiques
Scénarios

 

[Signaler des erreurs et/ou proposer des modifications
 
 
Donner votre avis sur l’outil : 

Interface - Ergonomie
4
Fonctionnalités
3
Facilité d utilisation
3
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

ELAN

 

ELAN (EUDICO Linguistic Annotator) is an annotation tool that allows you to create, edit, visualize and search annotations for video and audio data. It was developed at the Max Planck Institute for Psycholinguistics, Nijmegen, The Netherlands, with the aim to provide a sound technological basis for the annotation and exploitation of multi-media recordings. ELAN is specifically designed for the analysis of language, sign language, and gesture, but it can be used by everybody who works with media corpora, i.e., with video and/or audio data, for purposes of annotation, analysis and documentation.

 
 

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projet Max Planck Institute for Psycholinguistics, The Language Archive, Nijmegen, The Netherlands
Dernière version ELAN v 4.9.0
Site Web https://tla.mpi.nl/tools/tla-tools/elan/
Accessibilité https://tla.mpi.nl/tools/tla-tools/elan/download/
Systèmes Windows, Linux, MacOS
Interface – Ergonomie
Licence Freeware.
Open source : the source code is available upon request under the Gnu Public License 2 (in some cases GPL 3).
Format des corpus en entrée Format XML spécialisé (« EAF »: ELAN Annotation Format). Export possible dans d’autres formats
Format des corpus en sortie Format XML spécialisé (« EAF »: ELAN Annotation Format). Export possible dans d’autres formats
Fonctionnalités
Annotations gérées par l’outil With ELAN a user can add an unlimited number of annotations to audio and/or video streams. An annotation can be a sentence, word or gloss, a comment, translation or a description of any feature observed in the media. Annotations can be created on multiple layers, called tiers. Tiers can be hierarchically interconnected. An annotation can either be time-aligned to the media or it can refer to other existing annotations. The textual content of annotations is always in Unicode and the transcription is stored in an XML format.
ELAN provides several different views on the annotations, each view is connected and synchronized to the media playhead.
(Source : https://tla.mpi.nl/tools/tla-tools/elan/elan-description/)
Documentation https://tla.mpi.nl/tools/tla-tools/elan/
Type d’outil Annotation, Analyse

Pratiques et usages

Fiche renseignée par : Aurore Paligot (Université de Namur – Belgique)

Objectifs de recherche Annotation et analyse de ressources audio et vidéo.
Pratiques Application Areas
Typical areas where such annotations are manipulated are:
• documentation of endangered languages
• studying and comparing sign languages
• studying multimodal communication
• studying cognitive processes
• training speech recognition systems
• studying whale communication patterns
• studying social interactions of primates
• etc.
(Source: https://tla.mpi.nl/wpcontent/uploads/2012/01/ANNEX-ELAN_Flyer_2006-05-11.pdf
Scénarios

 

Signaler des erreurs et/ou proposer des modifications
 
 

Donner votre avis sur l’outil : 

Interface - Ergonomie
4
Fonctionnalités
4
Facilité d utilisation
4
Moyenne
  Chargement, attendez s'il vous plait yasr-loader

BioTex

L’extraction de termes est une tâche essentielle dans l’acquisition des connaissances, l’indexation des documents, la formulation de requêtes. Le contenu du Web évolue plus vite que notre capacité de formaliser et de cataloguer ces informations. Par conséquent, nous nous intéressons aux termes techniques utilisés dans un corpus afin de les indexer et les utiliser pour la construction/enrichissement de ressources, telles que les terminologies ou des ontologies. L’extraction de termes et l’extraction de mots clés sont largement utilisés dans les applications de recherche d’information et/ou d’annotation de textes. Nous présentons BIOTEX, une application qui intègre des approches et mesures pour extraire et ordonner des termes biomédicaux à partir de textes en l’anglais, français, et espagnol.

 
 

FICHE DESCRIPTIVE DE L’OUTIL

Responsable du projet Juan Antonio Lossio-Ventura, Clement Jonquet, Mathieu Roche, Maguelonne Teisseire
Dernière version Mis-à-jour le 13/04/2015
Accessibilité Accessible ici
Site web http://tubo.lirmm.fr/biotex/
Systèmes Windows, Linux, MacOS
Interface – Ergonomie http://tubo.lirmm.fr/biotex/
Format des corpus en entrée txt, xml
Format des corpus en sortie txt, xml
Fonctionnalités
Annotations gérées par l’outil
Documentation Manuel d’utilisation
Type d’outil Annotation, Analyse

 

Signaler des erreurs et/ou proposer des modifications
 
 
Donner votre avis sur l’outil : 

Interface - Ergonomie
0
Fonctionnalités
0
Facilité d utilisation
0
Moyenne
  Chargement, attendez s'il vous plait yasr-loader