Lebart Ludovic  /  DtmVic

 Directeur de recherches C.N.R.S. (R)
 TELECOM-ParisTech

  Contact: - ludovic [arobase] lebart.org

 



 Français 
 
 


 English 
 
 


 Castellano 
 
 


 Portuguese 
 
 


 Italiano 
 
 
 

     

Thèmes de recherche

Cadre général

Les recherches portent sur les Méthodes d'Analyse Statistique des données qualitatives et textuelles. Les travaux réalisés relèvent de la méthodologie du traitement statistique et informatique des vastes recueils de données individuelles, dont les fichiers d'enquêtes socio-économiques fournissent le domaine d'application principal. Ces traitements se situent en général soit en amont de la modélisation de type économétrique, soit dans des domaines d'investigation où celle-ci est exclue ou prématurée (données textuelles, importantes batteries de variables qualitatives par exemple). Ces travaux portent simultanément sur la mise au point de nouveaux outils, la validité des outils, l'étude critique de leur utilisation, et enfin sur l'exploration de nouveaux domaines d'investigation.

1 -Analyses des données textuelles

Traitements statistiques des textes et des recueils de données mixtes numériques/textuelles. Applications aux traitements des réponses aux questions ouvertes dans les enquêtes socio-économiques.

2 - Méthodologie des enquêtes par sondage en socio-économie

Les techniques d'enquêtes en socio-économie. Le contrôle de la qualité de l'information. Les non-réponses, les fusions de fichier. Stratégies de traitement.

3 - Structures a priori

La prise en compte des structures a priori dans les analyses exploratoires (Données spatiales, longitudinales, meta-information) et des structures a posteriori, issues des connaissances acquises sur les données elles-mêmes. Analyses de contiguïté et méthodes dérivées. Classification avec contraintes.

4 - Inférences dans le cadre multidimensionnel

Problèmes inférentiels, validité des résultats : inférences classiques, techniques de rééchantillonnage (bootstrap, bootstrap partiel, bootstrap sur variables, validation croisée).

5 - Logiciels d'Analyse des données qualitatives et textuelles

La mise en oeuvre des méthodes statistiques multidimensionelles dans le cadre des fichiers d'enquêtes a demandé le développements de logiciels dédiés. Le logiciel SPAD (L. Lebart, A. Morineau) a été développé au départ dans un cadre associatif (association loi de 1901: CESIA) et dans l'esprit des logiciels académiques (publication des codes sources) jusqu'en 1987. Depuis cette date, des interfaces de ce logiciel ont été développés par une société privée (le CISIA) et le logiciel SPAD est devenu un produit commercial. L'implémentation de nos travaux se fait maintenant dans le cadre d'un "atelier logiciel" DtmVic (Data and Text Mining : Visualisation, Inférence, Classification) qui reste un produit académique au service des thésards et de la recherche.