s
19 708 Pages

en statistiques, ingénierie, économie et la recherche médicale, censure Elle se produit lorsque la valeur d'une mesure ou d'observation est connue seulement partiellement.

Par exemple, supposons qu'il a mené une étude pour mesurer l'impact d'un médicament sur la mortalité liée à la maladie. Dans cette étude, on peut savoir que l'âge de la mort d'un individu est d'au moins 75 ans. Cette situation pourrait se produire si l'individu avait retiré de l'étude à 75 ans, ou si l'individu était vivent actuellement à l'âge de 75 ans.

La censure se produit également lorsqu'une valeur se situe en dehors de la plage d'un instrument de mesure. Par exemple, une échelle pour la salle de bain pourrait nisurare que jusqu'à 140 kilogrammes. Si une personne de 160 kg est pesé à l'aide des échelles, l'observateur sait seulement que le poids de l'individu est d'au moins 140 kg.

types

  • gauche Censorship: L'observation est inférieure à une certaine valeur, mais ne sais pas combien.
  • intervalle de censure: Une observation est dans une plage entre deux valeurs, mais ne sais pas exactement à quel moment.
  • droit de censure: Une observation est au-dessus d'une certaine valeur, mais ne sais pas combien.
  • Type de censure I: Dans le contexte de l'analyse de survie se produit quand une expérience avec un nombre défini de matières ou éléments cesse à un instant prédéterminé, après quoi les sujets sont encore vivants sont censurés à droite.
  • type II Censorship: Dans le même contexte, il se produit dans le cas où l'expérience se termine seulement quand il reste un certain nombre de sujets vivants, qui sont censurés ainsi à droite.
  • La censure aléatoire (ou uninformative): Lorsque chaque personne a un temps qui est la censure stochastiquement indépendante au moment de sa mort. Le temps de survie observée est le minimum entre le moment de la censure et de la mort. Ceux qui quittent l'étude avant leur mort sont ceux qui sont censurés à droite.

La censure ne doit pas être confondu avec l'idée connexe de troncature. Par cette plainte, on sait que les observations censurées dépassent un certain seuil ou sont dans une certaine gamme, et cette information partielle peut être utilisé lorsque le modèle statistique du phénomène. Par troncature, les observations donnent jamais des valeurs en dehors d'une certaine plage; les valeurs de la population en dehors de cette gamme sont entièrement mis au rebut. Notez que dans la troncature statistique est quelque chose de différent de 'l'arrondissement.

Le problème des données censurées, où la valeur observée d'une certaine variable est partiellement connue, est liée au problème de la perte de données, la valeur observée d'une certaine variable est inconnue.

L'intervalle de censure peut se produire lorsque l'observation d'une valeur nécessite des contrôles ou des inspections ultérieures. La plainte à gauche et à droite sont des cas particuliers d'intervalle de censure, où l'extrême gauche d'intervalle, respectivement (début) est égal à zéro et l'extrémité droite (fin) est à l 'infini.

Les données censurées gauche sont observées, par exemple, dans les données d'analyse de l'environnement dans lequel les concentrations de traces de produits chimiques peuvent effectivement être présents dans un échantillon environnemental (par exemple. D'eau souterraine, le sol), mais ils sont « non détectables », à es. parce qu'ils sont sous la limite de détection la méthode d'instrument ou d'un laboratoire d'analyse. la méthodes d'estimation d'utiliser les données censurées gauche varient, et d'autre part toutes les méthodes d'estimation peuvent être appliqués, ou les plus fiables, pour tous les ensembles de données.[1]

épidémiologie

L'une des premières tentatives d'analyser un problème statistique concernant les données censurées était l'analyse de 1766 Daniel Bernoulli sur la morbidité et la mortalité variole pour démontrer l'efficacité de vaccination.[2]

tests de durée de vie

Censorship (statistiques)
Exemple de cinq essais répliquées qui se traduisent par quatre échecs et suspendu le temps.

la preuve fiabilité souvent consister à procéder à un essai sur un élément (dans des conditions définies) pour déterminer le temps nécessaire à l'apparition d'une défaillance.

  • Parfois, l'échec est prévu et prévu, mais ne se produit pas: erreur de l'opérateur, défaillance de l'équipement, l'échec du test, etc. Le résultat du test n'a pas été le temps voulu à l'échec, mais vous pouvez (et devez) utiliser comme heure de fin. L'utilisation des données censurées n'est pas intentionnel mais nécessaire.
  • Parfois, les ingénieurs planifient un programme de test de sorte qu'après une certaine limite de temps ou un certain nombre de défaillances, tous les autres tests seront conclus. Ces situations, qui sont définis comme temps suspendu, sont traités comme des données censurées à droite. Dans ce cas, l'utilisation des données censurées est intentionnel. Une analyse des données répliquées inclut à la fois les temps de défaillance des éléments qui ont échoué, à la fois le temps de donclusione pour ceux qui ne sont pas.

analyse

Pour gérer les données censurées vous pouvez utiliser des techniques spéciales. Les essais avec un temps de défaillance spécifiques sont codés comme des échecs réels; les données censurées sont codées pour le type de censure et pour l'intervalle ou la limitation connue. logiciels spéciaux (souvent axés sur 'fiabilité) Peut conduire à des estimations du maximum de vraisemblance pour les statistiques sommaires, les intervalles de confiance, et ainsi de suite.

notes

  1. ^ Helsel, D. Beaucoup de bruit pour presque rien: L'intégration Nondetects en sciences, Ann. Occup. Hyg., Vol 54., N ° 3, pp. 257-262, 2010
  2. ^ Bernoulli D. (1766) « Essai d'une nouvelle analyse de la mortalité par la petite causée vérole. Mem. Math. Phy. Acad. Roy. Sci. Paris, réimprimé à Bradley (1971) 21 et du ventilateur (2004)

bibliographie

  • Ventilateur, S. (2004), D, Bernoulli de « (PDF) », Avis sur Virolology médicale, 14: 275-288
  • Bradley, L. (1971) Ensemencement Variole: Un dix-huitième siècle Controverse mathématique, Nottingham
  • Mann, N. R. et al., Méthodes d'analyse statistique de la fiabilité et de données vie, New York, Wiley, 1975 ISBN 0-471-56737-X.
  • Bagdonavičius, V., Kruopis, J., Nikulin, M.S. (2011), "Tests non paramétriques pour les données Censored", Londres, ISTE / WILEY, ISBN 9781848212893.

Articles connexes

liens externes