Hyperbase

Logiciel d'analyse de données textuelles

Présentation de Laurent.Vanni @unice.fr

Historique

50 ans de travaux

Punched_card
Hyperbase
Hyperbase
HyperbaseWeb
1967
1989
1999
2015

Concepteurs et développeurs : Etienne Brunet depuis 1967, Laurent Vanni depuis 2013

1989

Première version du logiciel Hyperbase

Sur Apple Macintosh

Punched_card
Hyperbase
HyperbaseWeb
Environement monochrome
MacOS 9
Nouveau langage de programmation
Hypercard
Premiers outils documentaires et
statistiques

1999

Hyperbase version 2

Sur Windows (version 98 et ultérieur)

Punched_card
Hyperbase
HyperbaseWeb
Recherches documentaires
Recherches statistiques
Outils graphiques

2015

Hyperbase version 10 et version Web

Toutes plateformes confondues

HyperbaseV10
HyperbaseWeb
Gratuit et téléchargeable
Gratuit et surfable

Hyperbase

Logiciel d'analyse de données textuelles



Qu'est-ce que la donnée textuelle pour Hyperbase ?

Du texte brut

Exemple: monfichier.txt

De Gaulle, Allocution radiotélévisée, 13 Juin 1958

Hyperbase

Logiciel d'analyse de données textuelles



Quels types d'analyses dans Hyperbase ?

Recherches documentaires

Contexte


Exemple : recherche du mot "France"

Contexte

Recherches documentaires

Concordance

Exemple : recherche du mot "France"

concordance

Recherches documentaires avancées

La lemmatisation


Par défaut dans Hyperbase : TreeTagger
Annotation du texte, détection automatique des parties du discours et des lemmes
Multi-langues : Francais, Anglais, Portugais, ...

Latin et Grec,lemmatisation proposée par le : L.A.S.L.A

Autre alternative pour le français : Cordial

Recherches documentaires avancées

Codes grammaticaux

Exemple : recherche du code NOM

rechercheNOM

Recherches documentaires avancées

Lemmes

Exemple : recherche du lemme AVOIR

rechercheNOM

Recherches documentaires avancéess

Recherche complexe et motifs


Exemple : recherche de l'expression : LEM:un NOM ??? VER

rechercheNOM

Et la statistique ?

Recherche statistique

Spécificité

Il représente le nombre d’occurrences du mot exprimé par un écart par rapport à la norme (usage « moyen ») du corpus
rechercheNOM

Recherche statistique

Analyse factorielle des correspondances (AFC)

rechercheNOM

Recherche statistique

Analyse arborée


rechercheNOM

Recherche statistique

Cooccurences


rechercheNOM

Préparation des données

Bien utiliser la stat sur mon corpus

Composition d'un corpus

L'unité textuelle : le texte

rechercheNOM

Composition d'un corpus

Les méta-données

Métas-données = Information / Description du texte
rechercheNOM



Exemple :
Titre = Allocution
Auteur = De Gaulle
Jour = 13
Mois = Juin
Année = 1958
Bonne pratique : Nom de fichier = méta-données (sans accents, sans espaces)

Composition d'un corpus

Exemple : corpus presdentiel

rechercheNOM
Bonne pratique : Nom de fichier = méta-données (sans accent, sans espace)

Composition d'un corpus

Plusieurs Méta-données => Plusieurs points de vue

arboree
arboree

A vous de jouer

Créez votre base en ligne ou en local

HyperbaseV10
HyperbaseWeb