|
|
Lebart Ludovic / DtmVic Directeur de recherches C.N.R.S. (R) Contact: - ludovic [arobase] lebart.org |
|
Il nostro principale campo di ricerca è il trattamento statistico dei dati qualitativi e testuali . Il "leading case" potrebbe essere un vaste collezioni di dati individuali che comprende sia chiuso e aperto questione. Questi trattamenti sono in generale a monte di modellizzazione statistica, riguardano principalmente grandi batterie di dati qualitativi e grandi corpora di dati testuali. Si tratta di opere che consistono in l'ideazione di nuove tecniche di analisi con la corrispondente convalida o strumenti di valutazione, scrutare i loro usi e (possibile, probabile) gli abusi, e ad esplorare nuovi campi di inchiesta.
Trattamento statistico di testo corpora e di complessi insiemi di dati che comprende sia dati numerici e testuali. Le domande riguardano principalmente il trattamento delle risposte a domande aperte en campione indagini.
tecniche di indagine in sociale scienze. Controllo della qualità dei dati. Nonresponses e tassi di risposta nel campione casuale e contingente indagini. Tecniche di statistical matching, l'indagine innesto, ascription, l'imputazione di valori mancanti. Strategia di trattamento dei dati di indagine
Trattare con a priori
strutture di analisi esplorativa dei dati (dati spaziali,
dati longitudinali, meta-dati, esterni
informazioni). Tali a priori struttura potrebbe
essere uno a posteriori struttura, ottenuto a partire da
una precedente fase di analisi effettuate su
lo stesso insieme di dati, o su un insieme di dati.
Contiguità e dei relativi metodi di analisi.
La classificazione (clustering) che coinvolgono contiguità
vincoli.
validità dei risultati (caso di metodi fattoriali), le valutazioni di tecniche di visualizzazione: inferenza classica, tecniche di ricampionamento (bootstrap, partial bootstrap, total bootstrap, bootstrap per variabili, cross-validazione).
Applicando i metodi di multivariata analisi descrittiva di indagini a campione richiede l'attuazione di dati specifici e dedicati software. Il software SPAD, concepito dalla L. Lebart e A. Morineau, è stato sviluppato sin dall'inizio in un contesto freeware fino all'anno 1987 ("non-profit" organizzazione Cesia), nello spirito di la maggior parte del software accademico a quel tempo (libero accesso ai il codice sorgente). Quindi, le interfacce di microcomputer è stato sviluppato da un privato società (CISIA, seguita da DECISIA) e la SPAD acronimo designa ormai un commerciali prodotto. L'attuazione dei nostra ricerca è svolta attualmente nel quadro accademico di un software chiamato DtmVic (Data and Text Mining: Visualization, Inference, classificazione) che possono essere liberamente utilizzate da studenti e ricercatori scienziati.