Accueil - Connexion

Analyse de donnees en grande dimension (Master IDM)

3IMR6 Analyse de donnees en grande dimension (Master IDM) Informatique S9
Cours : 20 h TD : 10 h TP : 0 h Projet : 0 h Total : 30 h
Responsable : Regis Clouard
Pré-requis
Notions de probabilités de base (probabilités, variables aléatoires, loi normale,…).
Maîtrise a minima de l’outil informatique.
Objectifs de l'enseignement
Apporter un bagage statistique solide pour l’analyse de données classiques et avancées, avec l’accent porté sur les données de grande dimension.
Programme détaillé
Statistique descriptive
Tests statistiques
Régression linéaire multiple
Études des résidus
Sélection de variables
Régression non-linéaire
Régression logistique
Arbres de classification
Arbres de régression
Forêts aléatoires
Applications (TD ou TP)
Le CM est illustré par de nombreuses applications sur machine, et de nombreux TPs complètent la mise en œuvre. Le logiciel utilisé est R.
Compétences acquises
Solide bagage en Statistique
Solide maîtrise du logiciel R
Bibliographie
Pierre-André Cornillon, Arnaud Guyader, François Husson, Nicolas Jégou, Julie Josse, Maela Kloareg, Eric Matzner-Lober, and Laurent Rouviere. Statistiques avec R. Didact Statistiques. Presses Universitaires de Rennes, 2nd edition, 2010.
Pierre André Cornillon and Eric Matzner-Lober. Régression avec R. Springer, Collection Pratique R, 1st edition, 2011.
Trevor Hastie, Robert Tibshirani, and Jerome Friedman. The elements of statistical learning : data mining, inference and prediction. Springer, 2 edition, 2009
Christophe Chesneau, Statistique : méthode et applications avec le logiciel R, Editeur : Spartacus-Cassini, 2021.

© 2021 - ENSICAEN ( Mentions Légales - Crédits )