Menu

Analyse des données multidimensionnelles


Début du cours : 5 mars 2018

A propos du cours

Ce cours vise à comprendre et appliquer les méthodes fondamentales de l'analyse des données : analyse en composantes principales, analyse factorielle des correspondances, analyse des correspondances multiples, classification ascendante hiérarchique. Une extension vers l'analyse factorielle multiple permettra d'aborder le traitement de données plus complexes (nouveauté par rapport à la première édition).


Conçu en vue des applications, ce cours donne une large place aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR de R). La présentation des méthodes recourt le moins possible au formalisme mathématique en privilégiant l'approche géométrique.


L'objectif est de rendre les participants autonomes dans la mise en œuvre et l'interprétation d'analyses exploratoires multidimensionnelles.



A qui s'adresse ce MOOC ?

Ce MOOC a été conçu pour ceux qui, sans être statisticiens, sont confrontés à l'analyse statistique de données. Tous les domaines où l'on recueille des données sont concernés : enquêtes d'opinion, marketing, biologie, écologie, géographie, etc.




Pré-requis

Ce cours est destiné aux étudiants et professionnels ayant un niveau master et/ou un background dans une discipline scientifique.

Des connaissances de base en statistique sont nécessaires : coefficient de corrélation, test du Chi2, analyse de variance à un facteur.

Enfin, une initiation au langage R est suffisante pour la mise en œuvre concrète des méthodes.
 


Plan du cours

Semaine 1 : Analyse en composantes principales
  • Données, problématique et exemples
  • Recherche d'une représentation des individus
  • Interprétation de la représentation des individus grâce aux variables
  • Représentation des variables
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR
Semaine 2 : Analyse factorielle des correspondances
  • Données, notations, questions
  • Liaison et indépendance entre deux variables qualitatives
  • Comment l'AFC appréhende-t-elle l'écart à l'indépendance ?
  • Nuages des lignes et des colonnes et leur représentation
  • Pourcentages d'inertie et inerties en AFC
  • Représentation simultanée des lignes et des colonnes
  • Aides à l'interprétation
  • Mise en œuvre sous FactoMineR
Semaine 3 : Analyse des correspondances multiples
  • Données, objectifs et problématique
  • Transformation du tableau des données
  • Représentation des individus
  • Représentation des modalités comme aide à l'interprétation de la représentation des individus
  • Nuage des modalités et sa représentation optimale
  • Représentation simultanée des deux nuages
  • Interprétation des valeurs propres
  • Représentation des variables
  • Aides à l'interprétation
  • Tableau de Burt
  • Mise en œuvre sous FactoMineR
Semaine 4 : Classification
  • Données, définitions
  • Principe de construction d'un arbre hiérarchique
  • Algorithme de partitionnement : les K-means
  • Consolidation des classes
  • Classification sur données de grande dimension
  • Analyse factorielle et classification
  • Caractérisation des classes d'individus
  • Mise en œuvre sous FactoMineR
Semaine 5 : Analyse Factorielle Multiple
  • Données, problématique
  • Equilibre des groupes et choix d'une pondération des variables
  • Etude et représentation des groupes de variables
  • Représentation des points partiels
  • Représentation des analyses séparées
  • Prise en compte de groupes de variables qualitatives
  • Prise en compte de tableaux de contingence
  • Aide à l'interprétation
  • Mise en œuvre sous FactoMineR

Cette 4ème édition du cours d'analyse de données multidimensionnelles débutera le 5 mars 2018.

Notez

Recherche

    Aucun événement à cette date.