Torna alla pagina principale
Tutorial per DtmVic
(Il software DtmVic deve essere scaricato in precedenza,
dato che il tutorial si avvale degli insiemi di dati ad esempio)
Tutorial A: Una introduzione a DtmVic
Sei esempi elementari di scoprire DtmVic
- A1- Analisi delle Componenti Principali (PCA)
Attiva e complementare variabili. Complementare categorie. Bootstrap convalida.
PCA è seguita da un raggruppamento di osservazioni, e una descrizione dei cluster ottenuti.
- A2- Analisi delle Corrispondenze (CA).
Analisi delle corrispondenze di una piccola tabella di contingenza. Bootstrap convalida.
- A3- Analisi delle Corrispondenze Multiple (MCA).
Attiva e complementare categorie. Bootstrap convalida.
MCA è seguita da un raggruppamento di osservazioni, e una descrizione dei cluster ottenuti.
- A4- Analisi delle Corrispondenze di una tabella lessicale.
L'elaborazione di una semplice serie di testi (20 prima Sonetti shakespeariani).
Codificazione numerica. Analisi delle Corrispondenze delle tabella "parole x poesie".
Bootstrap convalida. Caratteristica parole e versi. Mappe de Kohonen. Seriazione.
- A5- Domande aperte in un sondaggio campione.
Utilizzando i dati sia numerici e testuali. L'elaborazione delle risposte
ad una domanda aperta con una specifica variabile categoriale.
Codificazione numerica delle risposte. Analisi delle Corrispondenze delle
parole lessicali tabella x categorie. Bootstrap convalida.
Descrizione delle categorie attraverso le loro parole caratteristiche e le risposte.
Mappa Kohonen simultanea per le parole e le categorie.
- A6- domande aperte in un sondaggio: link con chiusi domande
Questo esempio prende in considerazione le informazioni sulle domande chiuse.
Codificazione numerica delle risposte. CA delle parole lessicali tabella intervistati x parole.
Questo esempio prende in considerazione le informazioni sulle domande chiuse. Clustering delle risposte,
e una descrizione dei clusters ottenuti attraverso le loro parole caratteristici,
le risposte, e anche attraverso le rispettive categorie caratteristica (domande chiuse).
Mappe de Kohonen per le parole e per i rispondenti.
Tutorial B: DtmVic e testuali dati
Tre esempi più per praticare DtmVic con i dati testuali
A differenza Tutorial A, i seguenti esempi uso esistenti file di comando (o: file di parametri).
Ogni esempio corrisponde ad una directory inclusa nella directory "DtmVic-Examples_B_Texts"
che è stato scaricato con DtmVic.
- B1- Domande aperte in un'indagine a campione: prima esplorazione
Codificazione numerica delle risposte. Esempi di modifiche della soglia di frequenza per le parole.
Esempio di concordanze (contesto sintattico) per alcune parole. Analisi delle Corrispondenze (CA),
della tabella lessicale intervistati x parole. Clustering delle intervistati, e una descrizione
dei clusters ottenuti attraverso le loro parole caratteristiche e le risposte.
Mappa de Kohonen per le parole e per i rispondenti.
- B2- Domande aperte e MCA in un sondaggio campione
Analisi delle corrispondenze multiple e clustering degli intervistati con domande chiuse.
Trasformazione aggregati [e lemmatised] risposte a domande aperte.
L'esempio propone un'altra tecnica per il raggruppamento e l'elaborazione delle
risposte ad aprire questione in una indagine campionaria. In una prima fase,
una analisi delle corrispondenze multiple è effettuata su un insieme selezionato
di variabili categoriali (cioè: le risposte alle domande chiuse-end).
Il principale asse di visualizzazione è completata da un clustering,
seguita da una descrizione automatica dei cluster.
Questi cluster vengono poi utilizzati per aggregare le risposte a una questione aperta.
- B3- Visualizzazione della rete semantica dei verbi francesi
Visualizzazione delle connessioni semantiche esistenti tra i 829 verbi francesi.
Ogni verbo è descritto da una lista di "sinonimi".
Tutorial C : DtmVic con i dati numerici
DtmVic con i dati numerici:
Semiometry, Dati "Iris di Fisher", Grafi, Immagini.
- C1- Visualization in Analisi delle Componenti Principali
Esempio C1 utilizza un estratto dei dati semiometric.
Il principale asse di visualizzazione è completato da un raggruppamento,
con una descrizione automatica dei cluster. Bootstrap procedure,
mappe di Kohonen sono seguiti da vari strumenti di visualizzazione
fornite nel sub-menu "Visualization" della fase di "VIC": visualizzazione
di cluster (o categorie) con simboli o colori, gli scafi convessa o ellissi
di densità per i cluster, Minimum Spanning Tree, disegno di vari grafi
più vicini prossimi.
- C2- PCA e contiguità analisi sui dati di Fisher Iris
Esempio C2 si propone di analizzare una serie classica di variabili numeriche
(I dati Iris insieme di Anderson / Fisher) tramite Analisi delle Componenti
Principali, classificazione, contiguità Analisi, Analisi Discriminante.
Il principale asse di visualizzazione è completata da un raggruppamento
tra cui uno automatico per la descrizione dei cluster. In via preliminare,
esempio C2 è molto simile al esempio A1: analisi dei componenti principali
e classificazione (clustering) di una serie di dati numerici, con vari strumenti
di visualizzazione, coinvolgendo anche i dati specifici categorico. Si presenta
quindi i miglioramenti apportati per contiguità e di analisi e un caso particolare più
classico di contiguità Analisi: Analisi Discriminante Lineare.
- C3- Descrizione dei grafi attraverso la Analisi delle corrispondenze
Visualizzazione di una serie di semplici grafi planari,
principalmente attraverso l'analisi delle corrispondenze.
I tre grafi sono grafi planari: un grafo a forma di scacchiera, un ciclo,
e due grafi empirici dovrebbero rappresentare circa le mappe delle regioni
del Giappone e della Francia. Questi esempi forniscono un ponte tra le diverse
sfaccettature di DtmVic: uno stesso grafo può portare a dati di input diversi:
classico dati numerici, i dati testuali, e di uno specifico "modello esterno".
- C4- strutturali compressione delle immagini tramite SVD e CA
Esempio C4 potrebbe essere visto come un appendice pedagogico.
Ci mostrano come le due tecniche (Singular Value Decomposition e Correspondence Analysis) di contribuire alla compressione delle immagini.
Non fa uso di dati in formato DtmVic, dal momento che si tratta di
immagini digitalizzate. Un semplice array rettangolare di
numeri interi è sufficiente : non è necessario per gli identificatori di righe o colonne.
Si mostra come le immagini vengano progressivamente compresse e come vengono ricostituiti con SVD e CA.
Il confronto è fatto con la serie di Fourier.
L'interfaccia specializzata è fornita tramite il pulsante "SVD and CA of Images"
del menu principale.
Tutorial D : L'importazione dei dati
Quattro esempi di dati per l'importazione per DtmVic
Il tutorial D inizia da descrivere i dati in formato interno per il software DtmVic.
Si tratta di un formato specifico, ma non proprietario (testo: .txt). E trasparente per l'utente.
Infine, vi presentiamo quattro tipi di importazioni i più comuni.
- D1- Importazione di dati numerici e testuali da Excel ® file
- D2- Importazione di dati numerici da un file (formato fisso)
- D3- Importazione di dati testuale da un formato libero
- D4- Importazione di entrambi numerici e testuali dati da un formato di file XML
Torna alla pagina principale