*Alguns dos links relacionados podem conter informações em outros idiomas
Se você não é um estatístico, olhando para resultados estatísticos pode fazer com que você se sinta mais ou menos como Alice no País das Maravilhas. De repente, você entra em um mundo fantástico onde fantasmas estranhos e misteriosos aparecem do nada.
Por exemplo, considere o T e o P nos resultados do seu teste-t.
"Cada vez mais e mais curioso!", você pode exclamar, como Alice, enquanto olha para a saída estatística.
Em termos reais, o que são esses valores? De onde eles vêm? Mesmo que você tenha usado inúmeras vezes o valor-p para interpretar a significância estatística de seus resultados, sua origem real pode permanecer obscura para você.
T e P: Os gêmeos Tweedledee e Tweedledum de um teste t
T e P estão inextricavelmente ligados. Eles andam de braços dados, como os gêmeos Tweedledee e Tweedledum, dos contos de Alice. Eis o porquê.
Quando você realiza um teste t, geralmente está tentando encontrar evidências de uma diferença significativa entre as médias populacionais (teste t para 2 amostras) ou entre a média populacional e um valor hipotético (teste t para 1 amostra). O valor-t mede o tamanho da diferença em relação à variação em seus dados amostrais. Dito de outra forma, T é simplesmente a diferença calculada representada em unidades de erro padrão. Quanto maior a magnitude de T, maior a evidência contra a hipótese nula. Isso significa que há maior evidência de que há uma diferença significativa. Quanto mais próximo T estiver de 0, maior a probabilidade de que não haja uma diferença significativa.
Lembre-se de que o valor-t em sua saída é calculado a partir de uma única amostra da população inteira. Se você pegasse amostras aleatórias repetidas de dados da mesma população, obteria valores-t um pouco diferentes a cada vez, devido a um erro aleatório de amostragem (que não é realmente um erro, mas apenas a variação aleatória esperada nos dados).
Qual poderia ser a sua expectativa em relação valores-t das muitas amostras aleatórias da mesma população? E como o valor-t de seus dados amostrais se compara aos valores-t esperados?
Você pode usar uma distribuição t para descobrir.
Como utilizar a distribuição T para calcular a probabilidade
A título de ilustração, assumiremos que você está usando um teste t para 1 amostra a fim de determinar se a média da população é maior do que um valor hipotético, como 5, com base em uma amostra de 20 observações, como mostrado acima na saída do teste t.
- No Minitab, selecione Gráfico > Gráfico de Distribuição de Probabilidade.
- Selecione Visualizar Probabilidade, e clique em OK.
- Em Distribuição, selecione t.
- Em Graus de liberdade, digite 19. (Para um teste t para 1 amostra, os graus de liberdade são iguais ao tamanho da amostra menos 1).
- Clique em Área Sombreada. Selecione Valor de X. Selecione Lateral Direita.
- Em Valor de X, digite 3,25 (o valor de t), em seguida, clique em OK.
A parte mais alta (pico) da curva de distribuição mostra onde devem ficar a maioria dos valores-t. A maior parte do tempo, seria possível esperar valores-t próximos de zero. Isso faz sentido, não faz? A explicação é que, se você selecionar aleatoriamente amostras representativas de uma população, as médias da maioria dessas amostras aleatórias da população devem estar próximas da média geral da população, fazendo com que suas diferenças (e, portanto, os valores-t calculados) se aproximem de zero.
Valores-t, valores-p e as mãos de pôquer
Os valores-t de magnitudes superiores (negativos ou positivos) são menos prováveis. As "caudas" mais à esquerda e mais à direita da curva de distribuição representam instâncias de obtenção de valores extremos de t, distantes de zero. Por exemplo, a região sombreada representa a probabilidade de obter um valor-t de 3,25 ou maior. Imagine um dardo mágico que pode ser lançado aleatoriamente em qualquer lugar sob a curva de distribuição. Qual a chance de ele fincar na região sombreada? A probabilidade calculada é 0,002107... que arredonda para 0,002... que é... o valor-p obtido nos resultados do teste t!
Em outras palavras, a probabilidade de obter um valor-t de 3,25 ou superior, quando a amostragem da mesma população (aqui, uma população com uma média hipotética de 5), é de aproximadamente 0,002.
Qual a probabilidade disso acontecer? Não muito alta! Para efeito de comparação, a probabilidade de receber 3 cartas do mesmo naipe entre as 5 dadas em uma mão de pôquer é mais de três vezes mais alta (≈ 0,021).
Dado que a probabilidade de obter um valor-t tão alto como ou maior a este quando tomando uma amostra desta população é tão baixa, o que é mais provável? É mais provável que essa amostra não venha dessa população (com a média hipotética de 5). É muito mais provável que essa amostra venha de uma população diferente, uma com uma média maior que 5.
A saber: Como o valor-p é muito baixo (< nível alfa), você deve rejeitar a hipótese nula e concluir que há uma diferença estatisticamente significativa.
Desse modo, T e P estão inextricavelmente ligados. Considere-os simplesmente maneiras diferentes de quantificar os "extremos" de seus resultados de acordo com a hipótese nula. Não é possível alterar o valor de um sem alterar o outro.
Quanto maior o valor absoluto do valor-t, menor o valor-p e maior a evidência em relação à hipótese nula (você pode verificar isso inserindo valores-t mais baixos e mais altos para a distribuição t na etapa 6 acima).
Experimente este acompanhamento bilateral...
O exemplo de distribuição t mostrado acima toma como base um teste t unilateral para determinar se a média da população é maior que um valor hipotético. Portanto, o exemplo de distribuição-t mostra a probabilidade associada ao valor-t de 3,25 somente em uma direção (a cauda direita da distribuição).
Como você usaria a distribuição t para encontrar o valor-p associado a um valor-t de 3,25 para o teste t bicaudal (em ambas as direções)?
Dica: No Minitab, ajuste as opções na etapa 5 para encontrar a probabilidade para As Duas Laterais. Se você não tiver uma cópia do Minitab, faça o download de uma versão de avaliação gratuita de 30 dias.