CIST·EE2023
  • École d’été
  • Equipe
  • Modules
  • Conditions d’utilisation
  • Mentions légales
  • Contact
  1. D. Modèles de régression
  2. MOD2 - Logit et multiniveau
  • École d’été
  • Équipe
  • Tous les modules
  • A. Collecte des données
    • TYP1 - Données d’enquête
    • TYP2 - Données de recensement
    • TYP3 - L’information Géographique
  • B. Statistique exploratoire
    • EXP1 - Statistique univariée
    • EXP2 - Statistique bivariée
    • EXP3 - Statistique multivariée
  • C. Cartographie
    • CAR1 - Cartographie Thématique
    • CAR2 - Cartographie dynamique
  • D. Modèles de régression
    • MOD1 - Régression multiple
    • MOD2 - Logit et multiniveau
  • E. Analyse spatiale
    • SPA1 - Semis de Points
    • SPA2 - Distance et accessibilité
  • F. Outils
    • OUT1 - TIG’R
    • OUT2 - Initiation à QGIS
    • OUT3 - Initiation à KoboToolBox

Sur cette page

  • Informations pratiques
  • Prérequis
  • Résumé
  • Support de cours et TD
  • Données
  • Références

MOD2 - Logit et multiniveau

Modélisations d’une variable non linéaire (logistique simple et extension multiniveau)

Modelisation
Auteurs

Mme France GUERIN-PACE

M. Arnaud BRINGE

M. Issa ABDOU YONLIHINZA

Date de publication

21 novembre 2024

Informations pratiques

Ce module cible les utilisateurs ayant à modéliser des données non linéaires.

Par souci pédagogique, on se limitera à des données binaires (variables à modéliser à deux modalités de type Présence/Absence). Les variables explicatives peuvent être définies simplement à un niveau individuel (régression logistique simple), ou prises en compte plus précisément selon un niveau hiérarchique à différentes échelles géographiques, en disposant de données au niveau de l’individu et de son contexte (analyse multiniveau).

Ce processus peut être étendu à une variable à modéliser de type multinomiale (plus de 2 modalités). Cette extension ne rentre pas dans le cadre de cet apprentissage.

Il propose des applications sur les données du Bénin (Echantillon recensement 2013). Les traitements sont effectués dans r à partir des packages stats (régression logistique simple, chargé par défaut) et lme4 (régression multiniveau, à installer et charger).

Prérequis

Public avec connaissances nécessaires en modèles de régression.

Il est à noter que les analyses multiniveaux peuvent aussi être effectuées dans le cadre de régressions linéaires. Toutefois, en SHS, il est habituellement plus fréquent de les utiliser dans le cadre de régressions logistiques, c’est le cadre pédagogique que nous avons volontairement privilégié. Voir les références en bas de pages pour une utilisation en régression linéaire dans le cadre des sciences de l’éducation.

Programmations en R, tidyverse nécessaire pour suivre les instructions de programmation utilisées.

Résumé

Les modèles multiniveaux sont mis en œuvre dans le cadre d’une structure hiérarchique des données, et permettent une modélisation qui prend en compte à la fois les caractéristiques de l’individu et de son contexte (environnement).

Objectifs :

  • Identifier un problème à deux niveaux (individuel et contextuel) et appliquer un modèle de régression prenant en compte ces deux niveaux. Tester et valider le modèle. Déterminer l’intérêt de son application.

  • Étendre à l’analyse multiniveau : Mettre en pratique un modèle de régression logistique dans le cas d’une structure hiérarchique à deux niveaux. Montrer l’intérêt d’une démarche d’une analyse multiniveau et aides à l’interprétation des résultats dans ce cadre. Présentation du modèle à constante aléatoire, puis modèle à pente aléatoire dans le cadre logistique. Introduction d’une variable contextuelle.

Support de cours et TD

Modélisation via une régression logistique, puis extension à une analyse multiniveau

Un exercice est à réaliser dans r, le contenu est téléchargeable ci-dessous.

Télécharger sur

Données

  • Extrait du fichier recensement Bénin 2013 (fichier IPUMS)

Références

Agresti A. 2007. An introduction to categorical data analysis. Wiley-Interscience: Hoboken, NJ.
Analysis of Binary Data, Second Edition. 2018.Routledge. DOI: 10.1201/9781315137391
Bringé A, Golaz V. 2017. Manuel pratique d’analyse multiniveau. INED éditions: Paris.
Collett D. 2002. Modelling Binary Data. Chapman; Hall/CRC. DOI: 10.1201/b16654
Courgeau D. 2004. Du groupe à l’individu: synthèse multiniveau. INED éditions: Paris.
Goldstein H. 2011. Multilevel statistical models. Wiley: Chichester, West Sussex.
Hosmer DW, Lemeshow S, Sturdivant RX. 2013. Applied logistic regression. Wiley: Hoboken, NJ.
Osborne JW. 2015. Best Practices in Logistic Regression. SAGE Publications, Ltd: 1 Oliver’s Yard, 55 City Road London EC1Y 1SP. DOI: 10.4135/9781483399041

Citation

BibTeX
@article{guérin-pace2025,
  author = {France Guérin-Pace and Arnaud Bringé and Issa Abdou
    Yonlihinza},
  publisher = {Zenodo},
  title = {MOD2 - Logit et multiniveau},
  journal = {CIST-EE2023 : Methodes et outils des sciences du
    territoire},
  date = {2024-21-11},
  url = {https://doi.org/10.5281/zenodo.14191892},
  doi = {10.5281/zenodo.14191892},
  langid = {fr}
}
Veuillez citer ce travail comme suit :
France Guérin-Pace, Arnaud Bringé, Issa Abdou Yonlihinza. 2024. MOD2 - Logit et multiniveau. CIST-EE2023 : Methodes et outils des sciences du territoire DOI: 10.5281/zenodo.14191892
EE CIST·2023 - licensebuttons by-nc-sa - CIST · INED · IRD · LaReSPD · UPC