Torna alla pagina principale
Tutorial per DtmVic
(Il software DtmVic deve essere scaricato in precedenza,
dato che il tutorial si avvale degli insiemi di dati ad esempio)
Tutorial A: Una introduzione a DtmVic
- A1- Analisi delle Componenti Principali (PCA)
Attiva e complementare variabili. Complementare categorie. Bootstrap convalida.
PCA è seguita da un raggruppamento di osservazioni, e una descrizione dei cluster ottenuti.
- A2- Analisi delle Corrispondenze (CA).
Analisi delle corrispondenze di una piccola tabella di contingenza. Bootstrap convalida.
- A3- Analisi delle Corrispondenze Multiple (MCA).
Attiva e complementare categorie. Bootstrap convalida.
MCA è seguita da un raggruppamento di osservazioni, e una descrizione dei cluster ottenuti.
- A4- Analisi delle Corrispondenze di una tabella lessicale.
L'elaborazione di una semplice serie di testi (20 prima Sonetti shakespeariani).
Codificazione numerica. Analisi delle Corrispondenze delle tabella "parole x poesie".
Bootstrap convalida. Caratteristica parole e versi. Kohonen maps. Seriazione.
- A5- Domande aperte in un sondaggio campione.
Utilizzando i dati sia numerici e testuali. L'elaborazione delle risposte
ad una domanda aperta con una specifica variabile categoriale.
Codificazione numerica delle risposte. Analisi delle Corrispondenze delle
parole lessicali tabella x categorie. Bootstrap convalida.
Descrizione delle categorie attraverso le loro parole caratteristiche e le risposte.
Mappa Kohonen simultanea per le parole e le categorie.
Tutorial B: DtmVic e testuali dati
A differenza Tutorial A, i seguenti esempi uso esistenti file di comando (o: file di parametri).
Ogni esempio corrisponde ad una directory inclusa nella directory "DtmVic-Examples_B_Texts"
che è stato scaricato con DtmVic.
- B1- Domande aperte in un'indagine a campione: prima esplorazione
In primo luogo l'elaborazione delle risposte alla domanda uno a tempo indeterminato.
Codificazione numerica delle risposte. Analisi delle Corrispondenze (CA),
della tabella delle parole sparse lessicale intervistati x, il raggruppamento delle
risposte, e una descrizione dei cluster ottenuti attraverso le loro parole
caratteristiche e le risposte. Mappa Kohonen per le parole e per i rispondenti.
- B2- domande aperte in un sondaggio: link con chiusi domande
Questo esempio, che coinvolge 14 passi, contiene l'esempio B.1, ma prende in
considerazione le informazioni sulle domande chiuse. Codificazione numerica delle risposte.
Esempi di modifiche della soglia di frequenza per le parole.
Esempio di concordanze (contesto sintattico) per alcune parole.
CA delle parole lessicali tabella intervistati x, il raggruppamento delle risposte,
e una descrizione dei cluster ottenuti attraverso le loro parole caratteristici,
le risposte, e anche attraverso le rispettive categorie caratteristica (domande chiuse).
Mappe Kohonen per le parole e per i rispondenti.
- B3- Domande aperte e MCA in un sondaggio campione
Analisi delle corrispondenze multiple e clustering degli intervistati con domande chiuse.
Trasformazione aggregati [e lemmatised] risposte a domande aperte.
L'esempio propone un'altra tecnica per il raggruppamento e l'elaborazione delle
risposte ad aprire questione in una indagine campionaria. In una prima fase,
una analisi delle corrispondenze multiple è effettuata su un insieme selezionato
di variabili categoriali (cioè: le risposte alle domande chiuse-end).
Il principale asse di visualizzazione è completata da un clustering,
seguita da una descrizione automatica dei cluster.
Questi cluster vengono poi utilizzati per aggregare le risposte a una questione aperta.
- B4- Visualizzazione della rete semantica dei verbi francesi
Visualizzazione delle connessioni semantiche esistenti tra i 829 verbi francesi.
Ogni verbo è descritto da una lista di "sinonimi".
Tutorial C : DtmVic con i dati numerici
- C1- Visualization in Analisi delle Componenti Principali (1)
C1 esempio utilizza un estratto dei dati semiometric.
Il principale asse di visualizzazione è completato da un raggruppamento,
con una descrizione automatica dei cluster. Bootstrap procedure,
mappe di Kohonen sono seguiti da vari strumenti di visualizzazione
fornite nel sub-menu "Visualization" della fase di "VIC": visualizzazione
di cluster (o categorie) con simboli o colori, gli scafi convessa o ellissi
di densità per i cluster, Minimum Spanning Tree, disegno di vari grafi
più vicini prossimi.
- C2- Visualization in Analisi delle Componenti Principali (2)
Lo stesso insieme di variabili numeriche (dati semiometric).
Il principale asse di visualizzazione è completato da un raggruppamento di variabili.
Bootstrap procedure, mappe di Kohonen sono seguiti da vari strumenti di
visualizzazione fornite nel menu "Visualizza contiguità": visualizzazione
di raggruppamenti di variabili con simboli o colori, gli scafi convessa
o ellissi di densità per i cluster, Minimum spanning tree tratti su variabile punti,
disegnando dei vari grafici più vicini prossimi.
- C3- PCA e contiguità analisi sui dati di Fisher Iris
C3 Esempio si propone di analizzare una serie classica di variabili numeriche
(I dati Iris insieme di Anderson / Fisher) tramite Analisi delle Componenti
Principali, classificazione, contiguità Analisi, Analisi Discriminante.
Il principale asse di visualizzazione è completata da un raggruppamento
tra cui uno automatico per la descrizione dei cluster. In via preliminare,
C3 esempio è molto simile alla C2 esempio: analisi dei componenti principali
e classificazione (clustering) di una serie di dati numerici, con vari strumenti
di visualizzazione, coinvolgendo anche i dati specifici categorico. Si presenta
quindi i miglioramenti apportati per contiguità e di analisi e un caso più
classico particolare di contiguità Analisi: Analisi Discriminante Lineare.
- C4- Descrizione dei grafi attraverso la Analisi delle corrispondenze
Visualizzazione di una serie di semplici grafi planari,
principalmente attraverso l'analisi delle corrispondenze.
I tre grafi sono grafi planari: un grafo a forma di scacchiera, un ciclo,
e due grafi empirici dovrebbero rappresentare circa le mappe delle regioni
del Giappone e della Francia. Questi esempi forniscono un ponte tra le diverse
sfaccettature di DtmVic: uno stesso grafo può portare a dati di input diversi:
classico dati numerici, i dati testuali, e di uno specifico "modello esterno".
- C5- strutturali compressione delle immagini
tramite SVD e CA
C5 esempio potrebbe essere visto come un appendice pedagogico.
Ci mostrano come le due tecniche (Singular Value Decomposition e CA) di contribuire alla compressione delle immagini.
Non fa uso di dati in formato DtmVic, dal momento che si tratta di
immagini digitalizzate. Un semplice array rettangolare di
numeri interi è sufficiente : non è necessario per gli identificatori di righe o colonne.
L'interfaccia specializzata è fornita tramite il pulsante "DtmVic Tools"
del menu principale.
Tutorial D : L'importazione dei dati
- D1- Importazione di dati numerici e testuali da Excel ® file
- D2- Importazione di dati numerici da un file (formato libero)
- D3- Importazione di dati numerici da un file (formato fisso)
- D4- Importazione di dati testuale da un formato libero
- D5- Importazione di entrambi numerici e testuali dati da un formato di file XML
Torna alla pagina principale