|
Lebart Ludovic / DtmVic Directeur de recherches C.N.R.S. (R) |
|
Les recherches portent sur les Méthodes d'Analyse Statistique des données qualitatives et textuelles. Les travaux réalisés relèvent de la méthodologie du traitement statistique et informatique des vastes recueils de données individuelles, dont les fichiers d'enquêtes socio-économiques fournissent le domaine d'application principal. Ces traitements se situent en général soit en amont de la modélisation de type économétrique, soit dans des domaines d'investigation où celle-ci est exclue ou prématurée (données textuelles, importantes batteries de variables qualitatives par exemple). Ces travaux portent simultanément sur la mise au point de nouveaux outils, la validité des outils, l'étude critique de leur utilisation, et enfin sur l'exploration de nouveaux domaines d'investigation.
Traitements statistiques des textes et des recueils de données mixtes numériques/textuelles. Applications aux traitements des réponses aux questions ouvertes dans les enquêtes socio-économiques.
Les techniques d'enquêtes en socio-économie. Le contrôle de la qualité de l'information. Les non-réponses, les fusions de fichier. Stratégies de traitement.
La prise en compte des structures
a priori dans les analyses exploratoires
(Données spatiales, longitudinales,
meta-information) et des structures a posteriori,
issues des connaissances acquises sur les
données elles-mêmes. Analyses de
contiguïté et méthodes
dérivées. Classification avec
contraintes.
Problèmes inférentiels, validité des résultats : inférences classiques, techniques de rééchantillonnage (bootstrap, bootstrap partiel, bootstrap sur variables, validation croisée).
La mise en oeuvre des méthodes statistiques multidimensionelles dans le cadre des fichiers d'enquêtes a demandé le développements de logiciels dédiés. Le logiciel SPAD (L. Lebart, A. Morineau) a été développé au départ dans un cadre associatif (association loi de 1901: CESIA) et dans l'esprit des logiciels académiques (publication des codes sources) jusqu'en 1987. Depuis cette date, des interfaces de ce logiciel ont été développés par une société privée (le CISIA) et le logiciel SPAD est devenu un produit commercial. L'implémentation de nos travaux se fait maintenant dans le cadre d'un "atelier logiciel" DtmVic (Data and Text Mining : Visualisation, Inférence, Classification) qui reste un produit académique au service des thésards et de la recherche.