Informations pratiques
Cet enseignement est plutôt destiné à des étudiant·es de fin de licence (L3), de master ou de doctorat car il suppose une maîtrise déjà approfondie de la statistique bivariée.
Dans le format retenu pour l’école d’été EE·CIST·2023 (2h de cours & 2h de TD) l’enseignement proposé constitue avant tout une introduction à la modélisation d’une variable quantitative faisant appel à la régression simple, la régression multiple et l’analyse de variance. Mais une maîtrise avancée de chacun de ces outils supposerait un minimum de 30h (pour des étudiant·s connaissant déjà la régression simple et l’analyse de variance) voire 60h s’il faut rappeler les bases de statistique bivariée.
Prérequis
La maîtrise de l’outil informatique est requise pour suivre ce module, ainsi qu’une connaissance de l’outil R et Rstudio.
D’un point de vue méthodologique il est nécessaire, a minima, d’avoir suivi ces deux modules :
Résumé
L’objectif de ce module est d’apprendre à construire des modèles statistiques de la forme \(Y = a_0 + a_1X_1 + a_2X_2 + … a_nXn + \varepsilon_i\) où \(Y\) est une variable quantitative et \(X_1 ...X_n\) des variables qualitatives ou quantitatives.
Il fait appel aux outils statistiques suivants : régression linéaire simple ou multiple, analyse de variance à un ou plusieurs facteurs, analyse de covariance. Dans la perspective d’une initiation, on insistera sur deux types d’applications :
L’analyse de l’hétérogénéité spatiale à travers la modélisation d’indicateurs décrivant des localisations géographiques (taux de mortalité infantile par pays, quantité de précipitations par station) en fonction de variables qualitatives ou quantitatives caractérisant ces mêmes lieux.
L’analyse des comportements économiques au travers de modèles décrivant des relations entre des variables économiques : consommation, épargne, revenu, salaire, production, prix, emploi, investissement, taux d’intérêt, etc.
Le module associe un cours théorique avec des applications dans R.
Programme
Cours
- Introduction non technique à la régression multiple : Les précipitations en Californie
- Cours de modélisation économétrique par régression simple ou multiple
Applications sur R
- Modélisation de la mortalité infantile des pays africains
- Modélisation des revenus des ménages du Bénin
Support de cours
Le site internet de ce module propose :
- Une introduction simple à la régression linéaire (y compris dans le diaporama, avec un exercice d’introduction et l’exercice 1)
- Un approfondissement en économétrie (avec des exercices d’application)
- Des exercices plus avancés pour les utilisateurs maîtrisant à la fois la régression multiple et l’analyse de variance (exercices n°2, 3 et 4)
Support de TD et données mobilisées
Le lien ci-dessous permet de télécharger indépendamment chaque exercice avec ses données.
Cinq des six exercices sont à effectuer avec R. Le dossier “exo_cours” contient plutôt une application du cours à faire sur papier, par exemple à l’occasion d’un examen.
Données
- Précipitations en Californie
- Développement des pays africains
- Enquête consommation Bénin