Régression Logistique (Partie 2)

Jun 24, 2024

Cours sur la Régression Logistique (Partie 2)

Introduction

  • Modèle avec plusieurs variables explicatives
  • Question principale : association d'un haut risque suicidaire en prison avec :
    1. Durée d'incarcération
    2. Mesures disciplinaires
    3. Antécédents d'abus dans l'enfance

Régression Logistique Multiple

  • Utilisation de la fonction glm
  • Syntaxe : variable à expliquer ~ variables explicatives, family="binomial"
  • Stockage dans un objet & obtention de résultats avec summary(objet)

Interprétation des Résultats

  • p-values : Tous < 5%
    • Les trois variables explicatives sont statistiquement associées à un haut risque suicidaire

Coefficients

  • Signe des coefficients

    • Codage des variables :
      • Abus (1 = oui, 0 = non)
      • Mesures disciplinaires (1 = oui, 0 = non)
      • Durée d'incarcération (de 1 à 5)
    • Interpretation : variables élevées = hauts risques
      • Coefficients positifs pour abus et mesures disciplinaires
      • Coefficient négatif pour durée d'incarcération
  • Amplitude des coefficients

    • Prendre l'exponentielle du coefficient : exp(coefficient)
    • Variables abus et disciplinaire interprétées comme des odds ratios (autour de 1.9, 1.7)
    • Durée d'incarcération interprétée par rapport à l'odds ratio (~0.7)
      • Passer d'un cran supérieur réduit le risque de 30%

Variables Catégorielles

  • Variables à plus de deux classes
    • Recodage automatique en k-1 variables binaires
    • Utilisation de drop1 avec test="Chisq" pour l'effet global

Termes d'Interaction

  • Ex : Interaction entre durée d'incarcération et mesures disciplinaires
    • Produit des deux variables pour introduire un terme d'interaction

Conditions de Validité

  • Plus compliquées que pour la régression linéaire
  • Règle : au moins 5 à 10 évènements par variable explicative
  • Exemples pratiques avec le fichier santé mentale en prison
    • Variable à expliquer : forme grave de schizophrénie
    • 54 détenus présentent cette condition
    • 9 variables explicatives : age, trauma, profession (recodée en 7 variables)
    • Besoin de 45 détenus pour respect des conditions de validité (passe tout juste)