Cet article, originellement publié en anglais sur le Blog de Minitab sous le titre Using Intervals to Get at the Tail Ends of the Problem in Healthcare and Medical Devices par la formatrice Cheryl Pammer, vous explique pourquoi l'étude des queues de distribution à l'aide des intervalles de confiance permet d'identifier les défauts.
Les intervalles de confiance représentent une plage de valeurs dans laquelle nous pouvons être confiants que la vraie valeur se situera. Ils jouent un rôle très important dans le domaine de la qualité. Je peux être sûr à 95% que le volume d'une canette de soupe se situera entre 390 et 410 ml, par exemple, ou je pourrais être confiant à 99% que 2% ou moins des produits de mon lot seront défectueux.Démontrer qu’une amélioration d’un processus est réelle implique souvent de prouver un changement statistiquement significatif de la moyenne. Pour cette raison, nous avons tendance à nous concentrer sur le centre de la distribution.
Mais en réalité les défauts ne se situent pas au centre, ils sont dans les extrémités de la distribution, à l’extérieur des spécifications. Les informations les plus pertinentes, sont souvent obtenues en examinant les queues de la distribution plutôt que le centre (la moyenne).
Considérons quelques intervalles de confiance non standards qui sont particulièrement utiles pour estimer le pourcentage de données qui se situent à l'intérieur ou à l'extérieur des limites de spécification.
Un diagramme de probabilité permet de déterminer si les données suivent une distribution normale (en fonction de la linéarité des points). C'est un bon point de départ pour comprendre les percentiles. Un percentile représente la valeur pour laquelle un pourcentage donné de la population lui est inférieur.
Les diagrammes de probabilité fournissent également des estimations des percentiles de la distribution. Vous pouvez choisir n'importe quel percentile sur l'axe Y et trouver la valeur de données correspondante sur l'axe des X. Les intervalles de confiance dans le diagramme de probabilité sont des intervalles de confiance pour chaque percentile spécifique.
Je travaillais récemment sur un projet dans un hôpital qui avait besoin d’estimer en combien de minutes le travail de préparation en vue d'une action chirurgicale serait terminé, dans 99% des cas.
La valeur de X qui correspondait à un Y de 99 sur la courbe de probabilité était de 204 minutes. On peut donc s’attendre à ce que dans 99% des cas, toutes les opérations de préparations soient terminées dans les 204 minutes.
L'intervalle de confiance autour de l'estimation, cependant, indique que nous pouvons être sûrs à 95% que 99% des préparations seront terminées entre 171 et 244 minutes. Cela explique pourquoi les opérations chirurgicales dépassaient si souvent les délais prévus.
Alors que les percentiles permettent d’estimer le pourcentage d'observations inférieures à une certaine valeur, les intervalles de tolérance fournissent des bornes entre lesquelles vous pouvez être sûr, avec un certain niveau de confiance, qu'un certain pourcentage des données se situera.
Ils sont très utiles pour déterminer dans quelle plage un pourcentage donné de la population se trouve par rapport à vos limites de spécification.
Par exemple, une entreprise de dispositifs médicaux avec laquelle je travaillais désirait démontrer une fiabilité de 95/99 sur la résistance à la traction de tubes en plastique. L'exigence spécifique était qu'ils devaient avoir 95% de confiance qu’un tuyau résisterait à une force de 3 kg pour 99% des produits.
Comme pour l’exemple de l'hôpital, ces données n'étaient pas normales. Un intervalle de tolérance a été utilisé pour étudier les queues de la distribution - pas la moyenne - l'hypothèse en ce qui concerne le type de distribution est donc importante. Ici, une distribution des valeurs extrêmes génère un bon ajustement. Parce que la résistance d’un tube ne devait pas être trop faible, seule une borne unilatérale inférieure était nécessaire. La borne inférieure de l’intervalle de tolérance à 99% avec un degré de confiance de 95% était de 10,7 kg. En d'autres termes, nous pouvons être sûrs à 95% que 99% de la population de tubes aura une résistance à la traction d'au moins 10,7 kg - bien au-dessus de la limite de spécification de 3 kg.
Vous pouvez utiliser des intervalles de confiance sur des percentiles, ou, des intervalles de tolérance pour l'estimation d'un intervalle contenant les queues d'une distribution :
Les différents intervalles disponibles dans le logiciel d'analyse statistique des données Minitab sont abordés dans le manuel de formation analyse de statistique de données non-normales, sollicitez nos formateurs et contactez-nous si vous souhaitez programmer ce cours pour votre organisation.