Hyperbase
Logiciel de lexicométri, dont le descriptif est accessible sur le site Internet http://ancilla.unice.fr.
Il est possible d'utiliser des procédures statistiques plus synthétiques que de simples histogrammes. Le programme Analyse Factorielle permet de soumettre au calcul une série de formes, qui seront traitées ensemble selon les méthodes multidimensionnelles. Le programme utilisé a été emprunté à l'association ADDAD, qui distribue un logiciel complet pour l'analyse des données. Le module ici mis en oeuvre est celui de l'analyse de correspondance, qui suit l'algorithme proposé par Jean-Paul Benzécri. On a prévu la distorsion que peut amener dans les données linguistiques l'effet de taille, c'est-à-dire une trop grande disproportion entre les lignes (les mots peuvent avoir des fréquences très inégales), ou entre les colonnes (les textes - ou parties de texte - peuvent avoir des étendues fort déséquilibrées). Afin d'atténuer ces inégalités, on peut convertir les fréquences en écarts réduits ou en logarithmes et l'analyse factorielle prend pour base ces données ainsi pondérées. Les écarts réduits sont d'abord translatés dans la zone positive, la valeur la plus faible s'alignant sur zéro. Quant aux logarithmes,ils obéissent à la formule de transformation suivante (n étant la fréquence observée d'un mot dans un texte, log le logarithme népérien et round la fonction d'arrondi à l'entier le plus proche):
x = round (log (n +1)*10)+100