logo
logo Web Edition
New project
Existing project
Library
default_profile
meigret
Louis Meigret
Cendrine Pagani

135078 occurrences - 11543 Words - 6538 Isolated Words

Menteur (17860 occ.) - Defenses (8383 occ.) - Grammaire (78878 occ.) - Pelletier (4908 occ.) - DesAutels (25142 occ) - TOTAL 135171 occurrences 11146 vocables -- La saisie et la lemmatisation ont ete assurees par Olivier Bettens.

default_profile
poetae
Oeuvres poétiques latines classiques traitées par le L.A.S.L.A. (ULg)
LASLA

385258 occurrences - 47594 Words - 22948 Isolated Words

La base POETAE comprend l’ensemble des œuvres des poètes latins classiques traitées par le LASLA - Laboratoire d’analyse statistique des langues anciennes de l’Université de Liège, disponibles au 1er mars 2017. A chaque mot de la base, sont associées plusieurs informations systématiquement vérifiées par un philologue : le lemme (complété par un indice permettant de distinguer les lemmes homographes ou de marquer les noms propres et les adjectifs qui en dérivent ; cfr le dictionnaire associé), une analyse morphologique complète et, pour les verbes, un code indiquant le type de la proposition dans lesquels ils apparaissent. Le logiciel Hyperbase permet des interrogations portant sur l’ensemble de ces informations. La base POETAE a été conçue en vue d’une exploitation statistique et organisée selon un ordre chronologique. Pour éviter une trop grande disparité dans la longueur des textes, certains ont été regroupés et d’autres scindés en plusieurs parties.

default_profile
seneca
Oeuvres de Sénèque le Philosophe traitées par le L.A.S.L.A. (ULg)
LASLA

332202 occurrences - 42952 Words - 22462 Isolated Words

La base SENECA comprend les œuvres de Sénèque le Philosophe traitées par le LASLA - Laboratoire d’analyse statistique des langues anciennes de l’Université de Liège, disponibles au 1er mars 2017. A chaque mot de la base, sont associées plusieurs informations systématiquement vérifiées par un philologue : le lemme (complété par un indice permettant de distinguer les lemmes homographes ou de marquer les noms propres et les adjectifs qui en dérivent ; cfr le dictionnaire associé), une analyse morphologique complète et, pour les verbes, un code indiquant le type de la proposition dans lesquels ils apparaissent. Le logiciel Hyperbase permet des interrogations portant sur l’ensemble de ces informations. La base SENECA a été conçue en vue d’une exploitation statistique et organisée selon un ordre chronologique. Pour éviter une trop grande disparité dans la longueur des textes, certains ont été regroupés et d’autres scindés en plusieurs parties.

default_profile
moliere
Moliere
logometrie

468096 occurrences - 17576 Words - 7946 Isolated Words

ETOURDI (23238 occ.), DEPIT (20615 occ.), Précieuses (8417 occ.), SGANARELLE (7540 occ.), GARCIE (20127 occ.), MARIS (13026 occ.), FACHEUX (9832 occ.), FEMMES (20534 occ.), Critique (10794 occ.), Impromptu (9133 occ.), Mariage (7945 occ.), ELIDE (14087 occ.), TARTUFFE (22456 occ.), DonJuan (21758 occ.), Amour (7856 occ.), MISANTHROPE (20936 occ.), MalgréLui (12189 occ.), MELICERTE (6955 occ.), Sicilien (6804 occ.), AMPHITRYON (18837 occ.), Dandin (14468 occ.), Avare (26480 occ.), Pourceaugnac (15799 occ.), Amants (14649 occ.), Bourgeois (22120 occ.), PSYCHE (18673 occ.), Scapin (18409 occ.), Escarbagnas (7141 occ.), SAVANTES (21054 occ.), Malade (26481 occ.)

default_profile
tragoediae
Tragédies de Sénèque traitées par le L.A.S.L.A.
LASLA

65177 occurrences - 14524 Words - 7721 Isolated Words

La base TRAGOEDIAE comprend l’ensemble des tragédies de Sénèque traitées par le LASLA - Laboratoire d’analyse statistique des langues anciennes de l’Université de Liège, disponibles au 1er mars 2017. A chaque mot de la base, sont associées plusieurs informations systématiquement vérifiées par un philologue : le lemme (complété par un indice permettant de distinguer les lemmes homographes ou de marquer les noms propres et les adjectifs qui en dérivent ; cfr le dictionnaire associé), une analyse morphologique complète et, pour les verbes, un code indiquant le type de la proposition dans lesquels ils apparaissent. Le logiciel Hyperbase permet des interrogations portant sur l’ensemble de ces informations. La base TRAGOEDIAE a été conçue en vue d’une exploitation statistique et organisée selon l’ordre chronologique supposé de la rédaction des œuvres.

default_profile
latin
selection des textes latins de la base classique du L.A.S.L.A. (ULg)
LASLA

2035176 occurrences - 129348 Words - 56242 Isolated Words

La base LATIN comprend une selection parmi les textes latins classiques traités par le LASLA - Laboratoire d’analyse statistique des langues anciennes de l’Université de Liège, disponibles au 1er mars 2017. A chaque mot de la base, sont associées plusieurs informations systématiquement vérifiées par un philologue : le lemme (complété par un indice permettant de distinguer les lemmes homographes ou de marquer les noms propres et les adjectifs qui en dérivent ; cfr le dictionnaire associé), une analyse morphologique complète et, pour les verbes, un code indiquant le type de la proposition dans lesquels ils apparaissent. Le logiciel Hyperbase permet des interrogations portant sur l’ensemble de ces informations. La base LATIN a été conçue en vue d’une exploitation statistique et organisée selon un ordre chronologique. Pour éviter une trop grande disparité dans la longueur des textes, certains ont été regroupés et d’autres scindés en plusieurs parties. Des œuvres isolées, relativement courtes et ne pouvant pas être regroupées (comme celles des continuateurs de César) n’ont pas intégrées à cette base.

hyperbase

HYPERBASE

Hyperbase est un logiciel universitaire téléchargeable d'exploration documentaire et statistique des textes. Il est diffusé par le CNRS et l'Université Nice Sophia Antipolis et est conçu et développé par Étienne Brunet, assisté de Laurent Vanni, au sein de l'UMR Bases, Corpus, Langage1. Entre sa naissance en 1989 et sa dernière version 10 en 2017, Hyperbase a implémenté continuement le savoir-faire lexicométrique français en matière de statistique textuelle et d'exploration documentaire des grands corpus. Le logiciel est principalement utilisé pour les thèses et ouvrages de linguistique2, littérature 3, histoire 4, sociologie ou sciences politiques 5.

Historique

La première version du logiciel Hyperbase date de 1989. Après vingt ans d’expériences en divers langages sur gros systèmes, Étienne Brunet se tourne vers les microordinateurs et crée à l’occasion du Bicentenaire de la Révolution française, au Centre Georges-Pompidou, un logiciel micro-installable d'analyse des textes. D'abord développé sous Mac avec Hypercard, Hyperbase s'épanouit à partir de la fin des années 1990 sous Windows. Dans les années 2000, Hyperbase s'articule aux lemmatiseurs/étiqueteurs TreeTagger ou Cordial et dépasse ainsi le seul traitement statistique des mots graphiques par le traitement combiné des formes, des lemmes, des codes grammaticaux ou des enchainements syntaxiques. En 2010, Hyperbase traite à côté du français et du latin, des grandes langues européennes (anglais, espagnol, allemand, italien, portugais). En 2017, Hyperbase est développé, d'une part, sous une version 10.0 desktop qui offre plusieurs nouvelles fonctionnalités dont un traitement approfondi des cooccurrences, la comparaison des données avec GoogleBooks (70 milliards de mots) et une meilleure articulation avec des logiciels partenaires comme Iramuteq ou Gephi et, d'autre part, sous une version Web allégée 6.

Fonctionnalités

Hyperbase combine deux types de fonctions, documentaires et statistiques, qui permettent à l'analyste de décrire, caractériser, classer et interpréter les textes.

Utilisation

Hyperbase est utilisé dans plusieurs disciplines des Sciences humaines et sociales soucieuses de décrire et interpréter des textes (œuvres littéraires, archives historiques, discours politiques, questionnaires et entretiens sociologiques). Hyperbase permet d'établir des chronologies endogènes dans des corpus socio-historiques, de faire des typologies d'auteurs dans des corpus littéraires ou de caractériser les genres dans des corpus linguistiques. Le logiciel est particulièrement utilisé pour déceler les thématiques ou isotopies des discours, notamment grâce au calcul des univers lexicaux d'un mot-pole ou le traitement généralisé des cooccurrences.

Le logiciel se présente comme une outil heuristique qui permet grâce à l'articulation du quantitatif (statistique textuelle) et du qualitatif (retour assisté et systématique au texte) de nourrir et contrôler l'acte interprétatif au fondement des Humanités.


HYPERBASE WEB - Logométrie - Mentions Légales - UMR 7320 : Bases, Corpus, Langage - Contact

Loading

patientez svp The database is being loaded, thank you for waiting...

Password :

×
à bientôt !

« Ici s'achève
Trop vite
Votre visite
Trop brève. »
E. Brunet

ok annuler
error

Reload Ignore