*Algunos enlaces relacionados pueden contener información en otros idiomas.
Las pruebas t son pruebas de hipótesis útiles en estadística cuando se desea comparar las medias. La media de una muestra se puede comparar con un valor hipotético u objetivo utilizando una prueba t de una muestra. Las medias de dos grupos se pueden comparar con una prueba t de dos muestras. Si tiene dos grupos con observaciones pareadas (por ejemplo, mediciones de antes y después), utilice la prueba t pareada.
¿Cómo funcionan las pruebas t? ¿Cómo encajan los valores t? En esta publicación, responderé a estas preguntas centrándome en conceptos y gráficas en lugar de ecuaciones y números. Después de todo, una razón clave para usar un software estadístico como Minitab es no enredarse con los cálculos y, en lugar de ello, poder centrarse en entender los resultados.
En esta publicación, explicaré los valores t, las distribuciones t y cómo las pruebas t los utilizan para calcular probabilidades y evaluar hipótesis.
Las pruebas t se llaman pruebas t porque todos los resultados se basan en los valores t. Los valores t son un ejemplo de lo que los expertos en estadística llaman estadísticos de prueba. Un estadístico de prueba es un valor estandarizado que se calcula a partir de los datos de la muestra durante una prueba de hipótesis. El procedimiento que calcula el estadístico de prueba compara los datos con lo que se espera bajo la hipótesis nula.
Cada tipo de prueba t utiliza un procedimiento específico para reducir todos los datos de muestra a un valor, el valor t. Los cálculos detrás de los valores t comparan las medias de las muestras con la hipótesis nula e incorporan el tamaño de la muestra y la variabilidad en los datos. Un valor t de 0 indica que los resultados de la muestra son exactamente iguales a la hipótesis nula. A medida que aumenta la diferencia entre los datos de la muestra y la hipótesis nula, aumenta el valor absoluto del valor t.
Supongamos que realizamos una prueba t y se calcula un valor t de 2 para los datos de la muestra. ¿Qué significa eso en realidad? ¡También podría haber dicho que nuestros datos son iguales a 2 fizzbins! No sabemos si eso es común o poco común cuando la hipótesis nula es verdadera.
Por sí solo, un valor t de 2 realmente no nos dice nada. Los valores t no están en las unidades de los datos originales, o cualquier otra cosa con la que pudiéramos estar familiarizados. Necesitamos un contexto más amplio en el que podamos colocar los valores t para poder interpretarlos. Aquí es donde entran en juego las distribuciones t.
Al realizar una prueba t para un solo estudio, se obtiene un único valor t. Sin embargo, si tomáramos múltiples muestras aleatorias del mismo tamaño de la misma población y realizáramos la misma prueba t, obtendríamos muchos valores t y podríamos graficar una distribución de todos ellos. Este tipo de distribución se conoce como una distribución de muestreo.
Afortunadamente, las propiedades de las distribuciones t se conocen bien en estadística, por lo que podemos graficarlas sin tener que recoger muchas muestras. Una distribución t específica se define por sus grados de libertad (GL), un valor estrechamente relacionado con el tamaño de la muestra. Por lo tanto, existen diferentes distribuciones t para cada tamaño de muestra. Las distribuciones t se pueden graficar usando las gráficas de distribución de probabilidad de Minitab.
Las distribuciones t presuponen que usted toma repetidas muestras aleatorias de una población donde la hipótesis nula es verdadera. Usted coloca el valor t de su estudio en la distribución t para determinar qué tan consistentes son sus resultados con la hipótesis nula.
La gráfica anterior muestra una distribución t que tiene 20 grados de libertad, lo que corresponde a un tamaño de muestra de 21 en una prueba t de una muestra. Es una distribución simétrica en forma de campana que es similar a la distribución normal, pero con colas más gruesas. Esta gráfica representa la función de densidad de probabilidad (FDP), que describe la probabilidad de cada valor t.
El pico de la gráfica se encuentra justo en el cero, lo que indica que lo más probable es que se obtenga un valor de muestra cercano a la hipótesis nula. Esto tiene sentido porque las distribuciones t asumen que la hipótesis nula es verdadera. Los valores t se vuelven menos probables a medida que usted se aleja del cero en cualquier dirección. En otras palabras, cuando la hipótesis nula es verdadera, es menos probable obtener una muestra que sea muy diferente de la hipótesis nula.
Nuestro valor t de 2 indica una diferencia positiva entre los datos de la muestra y la hipótesis nula. La gráfica muestra que existe una probabilidad razonable de obtener un valor t de -2 a +2 cuando la hipótesis nula es verdadera. Nuestro valor t de 2 es un valor inusual, pero no sabemos exactamente qué tan inusual. Nuestro objetivo final es determinar si el valor t es lo suficientemente inusual como para rechazar la hipótesis nula. Para hacerlo, tendremos que calcular la probabilidad.
La base que sustenta cualquier prueba de hipótesis es lograr tomar el estadístico de prueba de una muestra específica y colocarlo en el contexto de una distribución de probabilidad conocida. En el caso de las pruebas t, si usted toma un valor t y lo coloca en el contexto de la distribución t correcta, podrá calcular la probabilidad asociada a ese valor t.
Una probabilidad nos permite determinar qué tan común o poco común es nuestro valor t bajo el supuesto de que la hipótesis nula es verdadera. Si la probabilidad es lo suficientemente baja, podemos concluir que el efecto observado en nuestra muestra es inconsistente con la hipótesis nula. La evidencia en los datos de la muestra es lo suficientemente fuerte como para rechazar la hipótesis nula para toda la población.
Antes de calcular la probabilidad asociada con nuestro valor t de 2, debemos considerar dos detalles importantes.
En primer lugar, que realmente usaremos los valores t de +2 y -2 porque realizaremos una prueba de dos colas. Una prueba de dos colas es aquella que puede probar las diferencias en ambas direcciones. Por ejemplo, una prueba t de 2 colas para 2 muestras puede determinar si la diferencia entre el grupo 1 y el grupo 2 es estadísticamente significativa ya sea en la dirección positiva o negativa. Una prueba de una cola solo puede evaluar una de esas direcciones.
En segundo lugar, que solo podemos calcular una probabilidad distinta de cero para un rango de valores t. Como verá en la siguiente gráfica, un rango de valores t corresponde a una proporción del área total por debajo de la curva de distribución, que es la probabilidad. La probabilidad para cualquier punto específico es cero porque no produce un área por debajo de la curva.
Con estos puntos en mente, sombrearemos el área de la curva que tenga valores t mayores que 2 y valores t menores que -2.
La gráfica muestra la probabilidad de observar una diferencia con respecto a la hipótesis nula que sea al menos tan extrema como la diferencia presente en nuestros datos de muestra, asumiendo que la hipótesis nula realmente es verdadera. Cada una de las regiones sombreadas tiene una probabilidad de 0.02963, lo que suma una probabilidad total de 0.05926. Cuando la hipótesis nula es verdadera, el valor t se encuentra dentro de estas regiones casi el 6% de las veces.
Esta probabilidad tiene un nombre que tal vez haya escuchado: ¡se llama “valor p”! Aunque la probabilidad de que nuestro valor t esté dentro de estas regiones es bastante baja, no es lo suficientemente baja como para rechazar la hipótesis nula utilizando el nivel de significancia común de 0.05.
Aprenda a interpretar correctamente el valor p.
Como se mencionó anteriormente, las distribuciones t se definen por los GL, que están estrechamente asociados al tamaño de la muestra. A medida que aumentan los GL, disminuye la densidad de probabilidad en las colas y la distribución se agrupa más estrechamente alrededor del valor central. La siguiente gráfica muestra distribuciones t con 5 y 30 grados de libertad.
La distribución t con menos grados de libertad tiene colas más gruesas. Esto ocurre porque la distribución t está diseñada para reflejar la incertidumbre adicional asociada al análisis de muestras pequeñas. En otras palabras, si tiene una muestra pequeña, la probabilidad de que el estadístico de muestra esté lejos de la hipótesis nula es mayor aun cuando la hipótesis nula sea verdadera.
Las muestras pequeñas son más propensas a ser inusuales. Esto afecta a la probabilidad asociada a cualquier valor t dado. Para 5 y 30 grados de libertad, un valor t de 2 en una prueba de dos colas tiene valores p de 10.2% y 5.4%, respectivamente. ¡Las muestras más grandes son mejores!
He demostrado cómo los valores t y las distribuciones t trabajan conjuntamente para producir probabilidades. Para ver cómo funciona cada tipo de prueba t y cómo calcula realmente los valores t, lea la otra publicación de esta serie, Comprensión de las pruebas t: pruebas t de 1 muestra, de 2 muestras y pareadas.
Si desea saber cómo funciona la prueba F de ANOVA, lea mi publicación, Comprensión del análisis de varianza (ANOVA) y la prueba F.