s
19 708 Pages

la estimateur de Kaplan-Meier,[1][2] également connu sous le nom l'estimateur de limite de produit, il est l'un valuer qui est utilisé pour estimer la fonction de survie les données concernant la durée de vie. Dans la recherche médicale, il est souvent utilisé pour mesurer la proportion de patients qui vivent pendant un certain laps de temps après le traitement. En économie, il peut être utilisé pour mesurer la longueur du temps que les gens restent au chômage après la perte d'un emploi. Dans l'ingénierie, vous pouvez être utilisé pour mesurer le temps avant l'échec des composants d'une machine. En écologie, il peut être utilisé pour estimer combien de temps les fruits charnus restent sur les plantes avant d'être retiré de frugivores. L'estimateur est nommé Edward L. Kaplan et Paul Meier.

Un diagramme des estimations de Kaplan-Meier de la fonction de survie est une série d'étapes horizontales d'amplitude décroissante que, quand on prend un échantillon suffisamment grand, se rapproche de la véritable fonction de survie de cette population. On suppose que la valeur de la fonction de survie entre les observations échantillonnées successives et distinctes ( « tirs ») est constante.

estimateur de Kaplan-Meier
Un exemple d'un complot de Kaplan-Meier pour deux conditions associées à la survie des patients

Un avantage important de la courbe de Kaplan-Meier est que certains de la méthode peut prendre en compte les types de données censurées, en particulier les droit de censure, qui se produit lorsqu'un patient retire d'une étude, que si vous perdez le premier échantillon est observé le résultat. Sur le graphique, les petits signes de tiques verticales indiquent les pertes, où le temps de survie d'un patient a été censuré à droite. Lorsque vous ne rencontrez pas de troncature ou la censure, la méthode de Kaplan-Meier est le complément de la fonction de répartition empirique.

en statistiques médicales, une application typique peut impliquer le regroupement des patients dans des catégories, par exemple, ceux qui ont le profil du gène A et Gene ceux qui ont le profil B. Dans le graphique, les patients meurent avec le gène B beaucoup plus rapidement que ceux avec le gène A . Au bout de deux ans, survivant environ 80% des patients atteints de gène A, mais moins de la moitié des patients atteints de Gene B.

formulation

les deux S(t) La probabilité qu'un membre d'une population donnée a une durée de vie de plus de t. Pour un échantillon de cette population taille N, sont le temps observé à la mort de N Les membres de l'échantillon

Correspondant à chaque tla il est nla, le nombre « à risque » juste avant le temps tla, et la, le nombre de décès au moment tla.

Notez que les intervalles entre les événements ne sont généralement pas uniformes. Par exemple, un petit ensemble de données pourrait commencer par 10 cas. Supposons que la première personne à mourir le jour 3, les sujets meurent 02h03 le 11 et le sujet 4 est perdu dans le contrôle suivant (censuré) le jour 9. Les données jusqu'à 11 jours serait le suivant.

1 2
3 11
1 2
10 8

L'estimateur de Kaplan-Meier est l'estimation nonparamétrique maximum de vraisemblance S(t). Il est un produit avec la forme

Quand il n'y a pas de censure, nla il est juste le nombre de survivants à l'avance tla. Par cette plainte, nla est le nombre de survivants, moins le nombre de pertes (cas censurés). Ils ne ont survécu à ces cas qui sont encore sous observation (non encore censurés) qui sont « en danger de mort » (observée).[3]

Il y a une autre définition qui est parfois utilisé, à savoir

Les deux définitions ne diffèrent que dans les temps des événements observés. La deuxième définition est Continuez vers la droite tandis que la première définition est toujours à gauche.

les deux T la variable aléatoire qui mesure le temps de la faute et les deux fa(t) Son fonction de distribution cumulative. Notez que

t] = 1-P [T \ leq t] = 1-F (t). \} « />

Par conséquent, la définition continue à droite de peut être préférée afin de rendre l'estimation compatible avec une estimation continue à droite de fa(t).

considérations statistiques

L'estimateur de Kaplan-Meier est un indicateur statistique, et divers estimateurs sont utilisés pour rapprocher sa variance. L'un des ces estimateurs le plus commun est la formule Greenwood:[4]

Dans certains cas, vous pouvez comparer différents Kaplan-Meier. Cela peut être fait en utilisant diverses méthodes, y compris:

  • la log-rank test de
  • Le test des risques proportionnels de Cox

notes

  1. ^ Kaplan, E. L. Meier, P:. Estimation non paramétrique à partir d'observations incomplètes. J. Amer. Étatiste. Assoc. 53: 457-481, 1958. JSTOR 2281868
  2. ^ Kaplan, E. L. dans une rétrospective sur le papier séminal sur « citation de cette semaine classique. » Current Contents 24, 14 (1983). Disponible à partir UPenn au format PDF.
  3. ^ John P. Costella, 2010 Une alternative simple aux courbes de Kaplan-Meier pour la survie.
  4. ^ M. Greenwood, La durée naturelle du cancer. Rapports sur la santé publique et médicale, Londres, Stationery Office de Sa Majesté, 1926; 33: 1-26.

Articles connexes

  • estimateur Nelson-Aalen
  • DL50

liens externes