|
Lebart Ludovic / DtmVic Directeur de recherches C.N.R.S. (R) |
|
La investigación se centra en los Métodos de Análisis Estadístico de datos cualitativos y textuales. El trabajo realizado se incluye dentro de las metodologías de tratamiento estadístico y de procesamiento de grandes colecciones de datos, dentro de los cuales, los archivos de encuestas socioeconómicas constituyen el principal ámbito de aplicación. Estos tratamientos suelen ser previos al modelaje econométrico, en áreas de investigación donde dicho modelaje es excluí do o es prematuro (por ejemplo : datos textuales, grandes colecciones de variables cualitativas). Este trabajo se centra de manera simultánea en el desarrollo de nuevas herramientas, en la validez de las herramientas, en el estudio crítico de su uso, y en la exploración de nuevas áreas de investigación.
Tratamiento estadístico de textos y de colecciones de datos mixtos digitales/textuales. Aplicaciones para el tratamiento de respuestas a preguntas abiertas en el caso de encuestas socioeconómicas.
Técnicas de encuesta en socioeconomía. Control de calidad de la información. La no respuesta, las fusiones de archivos. Estrategias de tratamiento.
La inclusión de estructuras a priori en
el análisis exploratorio (datos espaciales,
longitudinales, metainformación) y de estructuras
a posteriori, producidas a partir de los conocimientos
sobre los propios datos. Análisis de contigüidad
y métodos derivados. Clasificación con
restricciones.
Problemas inferenciales, validez de los resultados: inferencias convencionales, técnicas de remuestreo (bootstrap, bootstrap parcial sobre variables, validación cruzada).
El desarrollo de software ha sido necesario para el tratamiento de archivos de encuestas por medio de métodos estadísticos multidimensionales. El programa SPAD (L. Lebart, A. Morineau) fue desarrollado inicialmente en el contexto de una asociación (ley 1901: CESIA) y bajo el espíritu de software académico (publicación de código fuente) hasta 1987. Desde entonces, las interfaces de este software han sido desarrolladas por una empresa privada (la CISIA) y el software SPAD se ha convertido en un producto comercial. La aplicación de nuestro trabajo se hace actualmente en el contexto del " taller de software " DtmVic (Datos y Text Mining: Visualización, inferencia, clasificación), que sigue siendo un producto puesto al servicio académico de los estudiantes de doctorado y de la investigación.