Entendiendo las Pruebas de Hipótesis: niveles de Significancia (Alfa) y Valores P en Estadística

Minitab Blog Editor 07 May, 2019

*Algunos enlaces relacionados pueden contener información en otros idiomas.

¿Qué significan los niveles de significancia y los valores p en las pruebas de hipótesis? Por cierto, ¿qué es significancia estadística? En esta publicación, me centraré en conceptos y gráficas para ayudarle a entender de una manera más intuitiva cómo funcionan las pruebas de hipótesis en estadística.

Para ilustrarlo con mayor claridad, agregaré el nivel de significancia y el valor p a la gráfica de mi publicación anterior para crear una versión gráfica de la prueba t de 1 muestra. ¡Es más fácil de entender cuando se puede ver qué significa en realidad “significancia estadística”!

Aquí es donde quedamos en mi última publicación. Queremos determinar si la media de nuestra muestra (330.6) indica que el costo promedio de energía de este año es significativamente diferente del costo promedio de energía del año pasado de $260.

estadisticos-descriptivos

distribucion-de-muestreo-para-la-hipotesis-nula-para-n

La gráfica de distribución de probabilidad anterior muestra la distribución de las medias de las muestras que obtendríamos bajo el supuesto de que la hipótesis nula es verdadera (media de la población = 260) y si tomáramos repetidamente un número grande de muestras aleatorias.

Eso nos deja con una pregunta: ¿dónde trazamos la línea de significancia estadística en la gráfica? Ahora agregaremos el nivel de significancia y el valor p, que son las herramientas de toma de decisiones que necesitamos.

Utilizaremos estas herramientas para probar las siguientes hipótesis:

  • Hipótesis nula: La media de la población es igual a la media hipotética (260).
  • Hipótesis alternativa: La media de la población es diferente de la media hipotética (260).

¿Qué es el Nivel de Significancia (Alfa)?

El nivel de significancia, también denotado como alfa o α, es la probabilidad de rechazar la hipótesis nula cuando es verdadera. Por ejemplo, un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una diferencia cuando en realidad no hay ninguna diferencia.

Estos tipos de definiciones pueden ser difíciles de entender debido a su carácter técnico. ¡Una imagen hace que sea mucho más fácil entender los conceptos!

El nivel de significancia determina qué tan lejos del valor de la hipótesis nula dibujaremos esa línea en la gráfica. Para graficar un nivel de significancia de 0.05, debemos sombrear el 5% de la distribución que está más alejado de la hipótesis nula.

region-critica-de-dos-colas-para-un-nivel-de-significancia-de-0.05

En la gráfica anterior, las dos áreas sombreadas son equidistantes del valor de la hipótesis nula y cada área tiene una probabilidad de 0.025, para un total de 0.05. En estadística, nos referimos a estas áreas sombreadas como la región crítica para una prueba de dos colas. Si la media de la población es de 260, esperaríamos obtener una media de la muestra que estuviera en la región crítica el 5% de las veces. La región crítica define qué tan lejos debe estar nuestro estadístico de muestra del valor de la hipótesis nula para que podamos decir que es lo suficientemente inusual como para rechazar la hipótesis nula.

La media de la muestra (330.6) se encuentra dentro de la región crítica, lo que indica que es estadísticamente significativa al nivel 0.05.

También podemos ver si es estadísticamente significativa usando el otro nivel de significancia común de 0.01.

region-critica-de-dos-colas-para-un-nivel-de-significancia-de-0.01

Cada una de las dos áreas sombreadas tiene una probabilidad de 0.005, lo que suma una probabilidad total de 0.01. Esta vez nuestra media de la muestra no está dentro de la región crítica y no podemos rechazar la hipótesis nula. Esta comparación muestra por qué debe elegir su nivel de significancia antes de comenzar un estudio. ¡Lo protege de elegir un nivel de significancia porque convenientemente le da resultados significativos!

Gracias a la gráfica, pudimos determinar que los resultados son estadísticamente significativos al nivel 0.05 sin utilizar un valor p. Sin embargo, cuando use la salida numérica producida por el software estadístico, deberá comparar el valor p con su nivel de significancia para tomar esa decisión.

minitab-statistical-software-hable-con-minitab

¿Qué son los Valores P?

Los valores p son la probabilidad de obtener un efecto por lo menos tan extremo como el de los datos de la muestra, asumiendo que la hipótesis nula es verdadera.

Esta definición de los valores p, aunque técnicamente correcta, es un poco complicada. ¡Es más fácil de entender con una gráfica!

Para graficar el valor p de nuestro conjunto de datos de ejemplo, debemos determinar la distancia entre la media de la muestra y el valor de la hipótesis nula (330.6 - 260 = 70.6). A continuación, podemos graficar la probabilidad de obtener una media de la muestra que sea por lo menos tan extrema en ambas colas de la distribución (260 +/- 70.6).

valor-p-para-nuestra-media-muestral

En la gráfica anterior, cada una de las dos áreas sombreadas tiene una probabilidad de 0.01556, para una probabilidad total de 0.03112. Esta probabilidad representa la probabilidad de obtener una media muestral que sea por lo menos tan extrema como nuestra media muestral en ambas colas de la distribución si la media de la población es 260. ¡Ese es nuestro valor p!

Cuando un valor p es menor que o igual al nivel de significancia, se rechaza la hipótesis nula. Si tomamos el valor p de nuestro ejemplo y lo comparamos con los niveles de significancia comunes, coincide con los resultados gráficos anteriores. El valor p de 0.03112 es estadísticamente significativo a un nivel de significancia de 0.05, pero no al nivel 0.01.

Si nos ceñimos a un nivel de significancia de 0.05, podemos concluir que el costo promedio de energía para la población es mayor que 260.

Un error común es interpretar el valor p como la probabilidad de que la hipótesis nula sea verdadera. Para entender por qué es incorrecta esa interpretación, por favor, lea mi publicación de blog Cómo interpretar correctamente los valores p.

Discusión sobre resultados estadísticamente significativos

Una prueba de hipótesis evalúa dos afirmaciones mutuamente contradictorias acerca de una población para determinar cuál afirmación es apoyada de mejor manera por los datos de la muestra. Un resultado es estadísticamente significativo cuando el estadístico de muestra es lo suficientemente inusual en relación con la hipótesis nula como para que podamos rechazar la hipótesis nula para toda la población. “Lo suficientemente inusual” en una prueba de hipótesis se define por:

  • El supuesto de que la hipótesis nula es verdadera (las gráficas se centran en el valor de la hipótesis nula).
  • El nivel de significancia (¿qué tan lejos dibujamos la línea de la región crítica?)
  • Nuestro estadístico de muestra (¿se encuentra dentro de la región crítica?)

Tenga en cuenta que no existe un nivel de significancia mágico que distinga entre los estudios en los que tenemos un efecto real y aquellos en los que no con 100% de precisión. Los valores comunes de alfa de 0.05 y 0.01 se basan simplemente en la tradición. Para un nivel de significancia de 0.05, espere obtener medias de la muestra en la región crítica el 5% de las veces cuando la hipótesis nula sea verdadera. En esos casos, usted no sabrá que la hipótesis nula es verdadera, pero la rechazará porque la media de la muestra se encuentra en la región crítica. ¡Por eso es que el nivel de significancia también se conoce como una tasa de error!

Este tipo de error no implica que el experimentador haya hecho algo mal ni requiere ninguna otra explicación inusual. Las gráficas muestran que, cuando la hipótesis nula es verdadera, es posible obtener estas medias de muestra inusuales sin que haya alguna otra razón que no sea el error de muestreo aleatorio. Es solo cuestión de suerte.

Los niveles de significancia y los valores p son herramientas importantes que le ayudan a cuantificar y controlar este tipo de error en una prueba de hipótesis. Al usar estas herramientas para decidir cuándo rechazar la hipótesis nula, aumenta la probabilidad de tomar la decisión correcta.

Si le gusta esta publicación, tal vez quiera leer las otras publicaciones de esta serie que utilizan el mismo marco gráfico:

Si desea ver cómo hice estas gráficas, lea: Cómo crear una versión gráfica de la prueba t de 1 muestra.