Lebart Ludovic  /  DtmVic

 Directeur de recherches C.N.R.S. (R)
 TELECOM-ParisTech

  Contact: - ludovic [arobase] lebart.org

 



 Français 
 
 


 English 
 
 


 Castellano 
 
 


 Portuguese 
 
 


 Italiano 
 
 
 

     

Ricerca: i campi principali

Quadro generale

Il nostro principale campo di ricerca è il trattamento statistico dei dati qualitativi e testuali . Il "leading case" potrebbe essere un vaste collezioni di dati individuali che comprende sia chiuso e aperto questione. Questi trattamenti sono in generale a monte di modellizzazione statistica, riguardano principalmente grandi batterie di dati qualitativi e grandi corpora di dati testuali. Si tratta di opere che consistono in l'ideazione di nuove tecniche di analisi con la corrispondente convalida o strumenti di valutazione, scrutare i loro usi e (possibile, probabile) gli abusi, e ad esplorare nuovi campi di inchiesta.

1 - Analisi dei dati testuali

Trattamento statistico di testo corpora e di complessi insiemi di dati che comprende sia dati numerici e testuali. Le domande riguardano principalmente il trattamento delle risposte a domande aperte en campione indagini.

2 - Metodologia del campione indagini nel campo delle scienze sociali e economia

tecniche di indagine in sociale scienze. Controllo della qualità dei dati. Nonresponses e tassi di risposta nel campione casuale e contingente indagini. Tecniche di statistical matching, l'indagine innesto, ascription, l'imputazione di valori mancanti. Strategia di trattamento dei dati di indagine

3 - A priori strutture in analisi dei dati

Trattare con a priori strutture di analisi esplorativa dei dati (dati spaziali, dati longitudinali, meta-dati, esterni informazioni). Tali a priori struttura potrebbe essere uno a posteriori struttura, ottenuto a partire da una precedente fase di analisi effettuate su lo stesso insieme di dati, o su un insieme di dati.
Contiguità e dei relativi metodi di analisi.
La classificazione (clustering) che coinvolgono contiguità vincoli.

4 - Inference in multidimensionale contesti

validità dei risultati (caso di metodi fattoriali), le valutazioni di tecniche di visualizzazione: inferenza classica, tecniche di ricampionamento (bootstrap, partial bootstrap, total bootstrap, bootstrap per variabili, cross-validazione).

5 - Software per l'analisi categorico e multidimensionale dei dati testuali

Applicando i metodi di multivariata analisi descrittiva di indagini a campione richiede l'attuazione di dati specifici e dedicati software. Il software SPAD, concepito dalla L. Lebart e A. Morineau, è stato sviluppato sin dall'inizio in un contesto freeware fino all'anno 1987 ("non-profit" organizzazione Cesia), nello spirito di la maggior parte del software accademico a quel tempo (libero accesso ai il codice sorgente). Quindi, le interfacce di microcomputer è stato sviluppato da un privato società (CISIA, seguita da DECISIA) e la SPAD acronimo designa ormai un commerciali prodotto. L'attuazione dei nostra ricerca è svolta attualmente nel quadro accademico di un software chiamato DtmVic (Data and Text Mining: Visualization, Inference, classificazione) che possono essere liberamente utilizzate da studenti e ricercatori scienziati.