Les bases de données lexicales

Je me lance en espérant que d’autrescorrigeront et/ou compléteront.

Il faut bien noter qu’on ne parle ici que de bases de données lexicales (BDL) monolingues francophones qui sont sans rapport avec le traitement automatique des langues (TAL) et des textes.

Le point central des BDL repose sur un calcul de la fréquence des mots. Ce calcul est réalisé, selon les BDL, sur des corpus de langage différents et c’est souvent en fonction de cela que l’on choisira, selon la population à laquelle on s’adresse, d’utiliser telle ou telle BDL.
Sur ce sujet, je vous renvoie à l’article suivant paru dans les cahiers de la Société Belge des Logopèdes Universitaires :
– Langage et fréquence de l’information. Les bases de données lexicales : pourquoi et comment les utiliser en logopédie ? Par Marie-Anne Schelstraete & Christelle Maillart (article paru dans les Cahiers de la SBLU, 2001, n°6, 5-9.
http://www.code.ucl.ac.be/sblu/basededonnee.htm

Chaque BDL contient d’autres informations que la fréquence. Certaines de ces informations (strictement formelles) ne varient pas d’une BDL à l’autre pour un mot particulier (nombre de lettres, de graphèmes, de phonèmes ?) mais d’autres sont évidemment relatives au corpus de langage exploité (nombre de voisins orthographiques, point d’unicité ?) ou à l’étude qui a servi à estimer telle ou telle propriété (ex : degré d’imageabilité ou de concrétude des mots).
Par ailleurs, toutes les BDL ne fournissent pas nécessairement les mêmes critères de recherche. Et elles adoptent toutes des opérateurs et des codages personnels pour les données qu’elles renferment (ces codages concernent essentiellement les abréviations utilisées pour les critères de recherche et la représentation particulière des phonèmes).
On comprendra dès lors que, pour exploiter telle ou telle BDL, il est nécessaire de se référer à l’article publié par les auteurs et au manuel d’utilisation.

Enfin, certaines BDL sont directement exploitables sur le net alors que d’autres doivent être téléchargées sur le disque dur de votre ordinateur. Il faut alors maîtriser le logiciel (recherche par critères ?) dans lequel la BDL a été installée.

Voici une liste non exhaustive de BDL.

BRULEX

Article :
http://www.lexique.org/public/Brulex.pdf

Téléchargement :
ftp://ftp.ulb.ac.be/pub/packages/psyling/Brulex/
Dans le répertoire Brulex_PC, il faut charger BRLX_DBF. Ensuite exécuter ce fichier pour en extraire le fichier DBF (Brulex), un fichier dbase, et l?ouvrir avec un Système de Gestion de Base de Données (comme Access, MySQL,…). Plus que cela, je ne peux dire car Brulex est installé chez moi sur un vieux Mac et je l?exploite de temps en temps avec FileMakerPro (au départ du fichier Brulex.hqx).

LEXIQUE

Article :
http://www.lexique.org/outils/Lexique_Annee.pdf
Voir aussi : http://www.pallier.org/

Téléchargement et exploitation en ligne (Open Lexique permet d’interroger plusieurs BDL) :
http://www.lexique.org/
Site très riche en informations diverses sur les BDL générales et plus spécifiques.

MANULEX

http://leadserv.u-bourgogne.fr/bases/manulex/manulexbase/indexFR.htm

NOVLEX

Article :
Lambert, E. & Chesnet, D. (2001). Novlex: une base de données lexicales pour les élèves de primaire. L’Année Psychologique, 101, 277-288.

Téléchargement et exploitation en ligne :
http://www.mshs.univ-poitiers.fr//ressources/novlex/

OMNILEX

Guide d’utilisation et exploitation en ligne :
http://www.omnilex.uottawa.ca/scrServices.asp

Voir aussi :
BDLEX

http://www.technolangue.net/

D’un autre genre. Si quelqu’un veut nous en parler? :

Base DICO et Dicouèbe

http://idefix.ling.umontreal.ca/dicofr.html
http://olst.ling.umontreal.ca/dicouebe/

VOCOLEX

http://leadserv.u-bourgogne.fr/bases/vocolex/

Pour d’autres liens encore, voyez :
http://lexicall.widged.com/

Et plus particulièrement :
ICI

Cordialement,
Bill

5 réflexions sur “Les bases de données lexicales”

  1. re bonjour, je suis responsable du site SORR(syndicat des orthophonistes de la région Réunion) , on peut contacter le responsable webmaster en cliquant sur l’onglet « nous contacter », c’est lui
    qui pourrait vous renseigner, de mon côté, je suis novice et bien incapable de vous donner des info sur cet outil qui par contre facilite la vie, cordialement V.Blanc

    • Bonjour,
      Voilà, NOVLEX est réapparu sur la toile. Et j’ai trouvé un outil (Xenu) mais pontt proposant des milliers de liens, je n’ai pas encore pu les vérifier.
      J’irai voir votre site. C’est promis.
      Amicalement,

  2. Bonjour, le lien vers NOVLEX (univ.de poitiers ne fonctionne plus)

    je m’occupe d’un site pour mon syndicat d’orthophoniste et notre webmaster nous a mis un petit logiciel pour lister les liens cassés et c’est bien pratique, cordialement, V.Blanc

     

    • Bonjour,
      La connexion ne s’établit pas avec le site de l’Université de Poitiers : « Service temporairement indisponible ». A suivre donc.
      Votre logiciel m’intéresse. De quoi s’agit-il, svp ?
      Cordialement,

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.