📊

Étude des données censurées

Jun 24, 2024

Étude des données censurées

Définition et Importance

  • Données de survie : Majoritairement mesurent des durées jusqu'à la survenue d'un événement.
    • Exemple : Chômage jusqu'à recouvrement du travail, infarctus jusqu'à récidive ou décès.
  • Censure : Connaissance partielle d'une variable mesurée lorsque l'événement n'est pas observé.
    • Exemple : Sujets au chômage n'ayant pas retrouvé de travail en un an.

Particularités des données censurées

  • Types de censure :
    • Exclus vivants : Sujets suivis jusqu'à un an et vivant au terme de l'étude.
    • Perdus de vue : Sujets non suivis pendant toute la durée prévue (Ex. déménagement).

Vocabulaire spécifique

  • **Survie **: Souvent métaphorique, se référant au délai jusqu'à la survenue d'un événement (pas forcément décès).
  • **Fonction de survie **: Pourcentage de sujets n'ayant pas encore subi l'événement au cours du temps.
    • Fonction décroissante partant de 100% à 0%.
  • Risque instantané de décès (h(t)) : Indicateur mathématique du risque immédiat de subir l'événement.

Calcul et représentation

  • Fonction de survie : Utilisation de la méthode de Kaplan-Meier pour des représentations graphiques.
    • Exemple : Étude d'efficacité d'un médicament dans la leucémie.
    • Syntaxe R : plot(survfit(Surv(t, événement)~1))
  • Exemple de données : Étude sur 125 patients alcooliques hospitalisés.
    • Variables : délai d'observation, sevrage, âge, sexe, événements de vie négatifs.
    • Syntaxe R pour courbe Kaplan-Meier : plot(survfit(Surv(alc$t, alc$SEVRE)~1), main="Courbe de maintien dans l'abstinence") plot(survfit(Surv(t, SEVRE)~SEXE, data=alc), col=c("black", "red"), main="Courbe de maintien dans l'abstinence")
  • Médiane de survie : Moment où 50% des sujets ont subi l'événement. Peut ne pas être disponible si plus de 50% des sujets n'ont pas subi l'événement avant la fin de l'étude.
    • Syntaxe R pour médiane de survie : survfit(Surv(alc$t, alc$SEVRE)~1)

Recommandation

  • Pratiquez ces méthodes avec vos propres données.

  • Code R récapitulatif :

    alc <- read.csv2("D:/MOOC/Data/alcool.csv") library(survival) plot(survfit(Surv(alc$t, alc$SEVRE)~1), main="Courbe de maintien dans l'abstinence") plot(survfit(Surv(t, SEVRE)~SEXE, data=alc), col=c("black", "red"), main="Courbe de maintien dans l'abstinence") survfit(Surv(alc$t, alc$SEVRE)~1)