CIST·EE2023
  • École d’été
  • Equipe
  • Modules
  • Conditions d’utilisation
  • Mentions légales
  • Contact
  1. D. Modèles de régression
  2. MOD1 - Régression multiple
  • École d’été
  • Équipe
  • Tous les modules
  • A. Collecte des données
    • TYP1 - Données d’enquête
    • TYP2 - Données de recensement
    • TYP3 - L’information Géographique
  • B. Statistique exploratoire
    • EXP1 - Statistique univariée
    • EXP2 - Statistique bivariée
    • EXP3 - Statistique multivariée
  • C. Cartographie
    • CAR1 - Cartographie Thématique
    • CAR2 - Cartographie dynamique
  • D. Modèles de régression
    • MOD1 - Régression multiple
    • MOD2 - Logit et multiniveau
  • E. Analyse spatiale
    • SPA1 - Semis de Points
    • SPA2 - Distance et accessibilité
  • F. Outils
    • OUT1 - TIG’R
    • OUT2 - Initiation à QGIS
    • OUT3 - Initiation à KoboToolBox

Sur cette page

  • Informations pratiques
  • Prérequis
  • Résumé
  • Programme
  • Support de cours
  • Support de TD et données mobilisées
    • Données
  • Références

MOD1 - Régression multiple

Introduction à la modélisation : régression multiple et analyse de variaance

Modelisation
Auteurs

Mme Gbètoton Nadège DJOSSOU

M. Claude GRASLAND

Date de publication

3 mars 2023

Informations pratiques

Cet enseignement est plutôt destiné à des étudiant·es de fin de licence (L3), de master ou de doctorat car il suppose une maîtrise déjà approfondie de la statistique bivariée.

Dans le format retenu pour l’école d’été EE·CIST·2023 (2h de cours & 2h de TD) l’enseignement proposé constitue avant tout une introduction à la modélisation d’une variable quantitative faisant appel à la régression simple, la régression multiple et l’analyse de variance. Mais une maîtrise avancée de chacun de ces outils supposerait un minimum de 30h (pour des étudiant·s connaissant déjà la régression simple et l’analyse de variance) voire 60h s’il faut rappeler les bases de statistique bivariée.

Prérequis

La maîtrise de l’outil informatique est requise pour suivre ce module, ainsi qu’une connaissance de l’outil R et Rstudio.

D’un point de vue méthodologique il est nécessaire, a minima, d’avoir suivi ces deux modules :

  • EXP1 - Statistique descriptive univariée

  • EXP2 - Statistique descriptique bivariée

Résumé

L’objectif de ce module est d’apprendre à construire des modèles statistiques de la forme Y=a0+a1X1+a2X2+…anXn+εi où Y est une variable quantitative et X1...Xn des variables qualitatives ou quantitatives.

Il fait appel aux outils statistiques suivants : régression linéaire simple ou multiple, analyse de variance à un ou plusieurs facteurs, analyse de covariance. Dans la perspective d’une initiation, on insistera sur deux types d’applications :

  • L’analyse de l’hétérogénéité spatiale à travers la modélisation d’indicateurs décrivant des localisations géographiques (taux de mortalité infantile par pays, quantité de précipitations par station) en fonction de variables qualitatives ou quantitatives caractérisant ces mêmes lieux.

  • L’analyse des comportements économiques au travers de modèles décrivant des relations entre des variables économiques : consommation, épargne, revenu, salaire, production, prix, emploi, investissement, taux d’intérêt, etc.

Le module associe un cours théorique avec des applications dans R.

Programme

  1. Cours

    1. Introduction non technique à la régression multiple : Les précipitations en Californie
    2. Cours de modélisation économétrique par régression simple ou multiple
  2. Applications sur R

    1. Modélisation de la mortalité infantile des pays africains
    2. Modélisation des revenus des ménages du Bénin

Support de cours

Le site internet de ce module propose :

  1. Une introduction simple à la régression linéaire (y compris dans le diaporama, avec un exercice d’introduction et l’exercice 1)
  2. Un approfondissement en économétrie (avec des exercices d’application)
  3. Des exercices plus avancés pour les utilisateurs maîtrisant à la fois la régression multiple et l’analyse de variance (exercices n°2, 3 et 4)
Suivre le cours et les TD en ligne

Télécharger

Support de TD et données mobilisées

Le lien ci-dessous permet de télécharger indépendamment chaque exercice avec ses données.

Cinq des six exercices sont à effectuer avec R. Le dossier “exo_cours” contient plutôt une application du cours à faire sur papier, par exemple à l’occasion d’un examen.

Données

  • Précipitations en Californie
  • Développement des pays africains
  • Enquête consommation Bénin
Télécharger sur

Références

Bourbonnais R. 2018. Économétrie. Dunod: Paris. Disponible sur: https://www.cairn.info/econometrie--9782100773459.htm
Denis DJ. 2020. Univariate, bivariate, and multivariate statistics using R: quantitative tools for data analysis and data science. Wiley: Hoboken, NJ.
Feuillet T, Cossart É, Commenges H. 2019. Manuel de géographie quantitative. Concepts, outils, méthodes. Armand Colin: Paris. Disponible sur: https://www.cairn.info/manuel-de-geographie-quantitative--9782200622336.htm
Taylor PJ. 1977. Quantitative methods in geography: an introduction to spatial analysis. Houghton Mifflin: Boston.

Citation

BibTeX
@article{nadègedjossou2023,
  author = {Gbètoton Nadège Djossou and Claude Grasland},
  publisher = {Zenodo},
  title = {MOD1 - Régression multiple},
  journal = {CIST-EE2023 : Methodes et outils des sciences du
    territoire},
  date = {2023-03-03},
  url = {https://doi.org/10.5281/zenodo.14191820},
  doi = {10.5281/zenodo.14191820},
  langid = {fr}
}
Veuillez citer ce travail comme suit :
Gbètoton Nadège Djossou, Claude Grasland. 2023. MOD1 - Régression multiple. CIST-EE2023 : Methodes et outils des sciences du territoire DOI: 10.5281/zenodo.14191820
CC-BY-NC-SA GitHub
EE CIST·2023 - licensebuttons by-nc-sa - CIST · INED · IRD · LaReSPD · UPC