Accueil
Tutoriel Interne pour DtmVic
(Ces tutoriels supposent que le logiciel a été téléchargé)
[Le tutoriel interne est en Anglais, mais le manuel d'utilisation, plus élaboré est en Francais]
Tutoriel A : Introduction à DtmVic à partir de 6 exemples
On présente dans ce tutoriel six exemples d'analyses
classiques offrant une vue générale des possibilités du logiciel:
gestion des variables actives et supplémentaires, complémentarité systématique
avec la classification, validation des visualisations par bootstrap, cartes de Kohonen.
- A1- Analyse en composantes principales.
Variables Actives et supplémentaires. Catégories supplémentaires. Validation Bootstrap.
L'ACP est suivie d'une classification des observations, et d'une description automatique des classes obtenues.
- A2- Analyse des Correspondances.
Analyse des Correspondances d'un petit tableau de contingence. Validation Bootstrap.
- A3- Analyse des correspondances multiples.
Catégories actives et supplémentaires. Validation Bootstrap.
L'ACM est suivie d'une classification des observations, et d'une description automatique des classes obtenues.
- A4- Analyse des correspondances d'un tableau lexical.
Traitement d'une simple série de textes (20 premiers sonnets de Shakespeare).
Codage numérique. Analyse des Correspondances du tableau lexical mots x poèmes. Validation Bootstrap.
Mots et vers caractéristiques. Cartes de Kohonen. Sériation.
- A5- Questions ouvertes dans une enquête par sondage.
On utilise ici des données à la fois numériques et textuelles. Le traitement des réponses à une question ouverte utilise ici
une variable nominale spécifique. Codage numérique des réponses. Analyse des correspondances d'un tableau lexical mots x catégories.
Validation Bootstrap. Description des catégories par leurs mots caractéristiques et leurs réponses modales.
Carte de Kohonen simultanée pour les mots et les catégories.
- A6- Questions ouvertes dans une enquête par sondage: Première exploration, liens ouvert-fermé.
Premier traitement des réponses à une question ouverte. Codage numériques des réponses.
Analyse des correspondances (CA) de la table lexicale clairsemée (sparse) répondants x mots.
Lien avec les questions fermées
Classification des réponses, et description des classes obtenues par leurs mots et réponses
caractéristiques, et aussi à travers leurs catégories caractéristique
(questions fermées). Cartes de Kohonen pour les mots et pour les répondants.
Tutoriel B : Trois exemples d'analyses de données textuelles
Le tutoriel B s'adresse à des utilisateurs plus avancés qui veulent
aller au delà des analyses pré-programmées et utiliser les fichiers de commandes
(modèles fournis). Les trois exemples concernent les données textuelles.
- B1- Questions ouvertes dans une enquête par sondage: Première exploration, concordances.
Premier traitement des réponses à une question ouverte. Codage numériques des réponses.
Exemples de modification du seuil de fréquence pour les mots. Exemple de concordances (contexte syntaxique) pour certains mots.
Analyse des correspondances (CA) de la table lexicale clairsemée (sparse) répondants x mots, Classification des réponses, et description des
classes obtenues par leurs mots et leurs réponses caractéristiques. Carte de Kohonen pour les mots et pour les répondants.
- B2- Analyse des correspondances multiples et questions ouvertes
Analyse des correspondances multiples et classification des répondants à l'aide de questions fermées.
Traitement des réponses aux questions ouvertes agrégées
[et lemmatisées]. L'exemple met en avant une autre technique pour le regroupement des
réponses. Dans une première phase, une analyse des correspondances multiples est
effectuées sur un ensemble de variables nominales (par exemple: les réponses aux questions fermées).
La visualisation est complétée par une classification, suivie d'une description automatique des classes. Ces classes
sont ensuite utilisées pour agréger les réponses à à une question ouverte.
La table obtenue est ensuite analysée comme lors de l'exemple A.5.
- B3- Visualisation du réseau sémantique des verbes français
Visualisation des liens sémantiques existant entre 829 verbes français. Chaque verbe est décrit par une liste de
"synonymes".
Tutoriel C : Quatre exemples d'analyse de données numériques
On présente dans ce tutoriel quatre exemples pour approfondir les analyses de donnes numériques.
- C1- Diverses visualisations en Analyse en composantes principales
L'exemple C1 utilise un extrait des données sémiometriques (voir l'ouvrage "La sémiométrie",
par L. Lebart, M. Piron t J.-F. Steiner, téléchargeable en pdf á partir de l'item "Publications" du menu).
La visualisation á partir des axes principaux est complétée par une classification et une
description automatique des classes. La validation Bootstrap puis les cartes de Kohonen sont suivies par
les différents outils de visualisation prévues dans le sous-menu "Visualisation" de la
phase "VIC" (VIC = Visualisation, Inférence, Classification): visualisation des clusters
(ou catégories) en utilisant des symboles ou des couleurs, enveloppes convexes ou ellipses de densité
pour les classes, arbre de longueur minimale (MST=Minimum spanning tree), mise en évidence des plus proches voisins.
- C2- Analyse de Contiguïté et analyse discriminante (Iris de Fisher)
L'exemple C3 vise à analyser un ensemble classique de variables numériques (les données
IRIS de Anderson / Fisher) par Analyse en composantes principales, Classification, Analyse de contiguïté,
Analyse discriminante. La visualisation à partir des axes principaux est complétée par
une classification comprenant une description automatique des classes.
Au départ, l'exemple C3 est très similaire à l'exemple C2: Analyse en composantes principales et classification
(clustering) d'un ensemble de données numériques, avec différents outils de visualisation,
impliquant aussi une variable nominale spécifique (les trois groupes d'iris). L'exemple présente
ensuite les améliorations apportées par l'analyse de contiguïté et un cas particulier
important de l'analyse de Contiguïté : l'Analyse discriminante de Fisher (Linear Discriminant Analysis).
- C3- Description de graphes par analyse des correspondances
Visualisation d'une série de graphes planaires simples symétriques, principalement à
partir de l'analyse des correspondances. Les trois graphes sont des graphes planaires: un graphe en forme de
damier, un cycle, et deux graphes empiriques censés représenter les cartes des
régions du Japon et de la France. Ces exemples jettent un pont entre les aspects spécifiques
de DtmVic: un même graphique peut conduire à des données d'entrée différentes:
des données numériques classiques, des données textuelles, et des données sous un
"format externe" spécifique.
- C4- Compression d'images par Décomposition aux Valeurs Singulières
et par Analyse des Correspondances
L'exemple C5 peut être considéré comme une annexe pédagogique.
Il ne fait pas usage de données au format DtmVic, car il traite d'images numérisées.
Un simple tableau rectangulaire de nombres entiers suffit : il n'est pas nécessaire de disposer
d'identificateurs de lignes ou de colonnes. Cette étape montre comment la décomposition aux valeurs singulières
et l'analyse des correspondances peuvent reconstituer progressivemnts des images. Comparaison avec les
séries de Fourier discrètes.
Une interface spécialisée est fournie via le bouton "DtmVic Tools" du menu principal.
Tutoriel D : Importation des données et des textes au format DtmVic
Après avoir décrit les formats de données internes à DtmVic, On présente
dans ce tutorial trois exemples d'importations de données et de textes :
- D1- Importation de données numériques et textuelles en format "Excel" ®
- D2- Importation de données textuelles en format libre
- D3- Importation de données numériques et textuelles en format XML
Accueil