Blog da Minitab

Como escolher entre um teste não paramétrico e um teste paramétrico

Written by Minitab Blog Editor | 10/abr/2019 16:37:34

*Alguns dos links relacionados podem conter informações em outros idiomas

 

Podemos dizer com segurança que a maioria das pessoas que usam estatísticas está mais familiarizada com análises paramétricas do que com análises não paramétricas. Os testes não paramétricos também são chamados de testes sem distribuição, porque não pressupõem que seus dados sigam uma distribuição específica.

Talvez você tenha ouvido em algum lugar que deve usar testes não paramétricos quando seus dados não atendem às suposições do teste paramétrico, especialmente a suposição sobre dados normalmente distribuídos. Essa parece ser uma maneira boa e simples de escolher, mas há outras coisas a serem consideradas.

Neste post, ajudarei você a determinar quando usar:

  • Uma análise paramétrica para testar as médias dos grupos.
  • Uma análise não paramétrica para testar medianas de grupo.

Em particular, vou me concentrar em um motivo importante para usar testes não paramétricos que não são mencionados com frequência suficiente!

Teste de hipóteses da média ou mediana

Os testes não paramétricos são como um universo paralelo em relação aos testes paramétricos. A tabela mostra pares relacionados de testes de hipóteses que o software estatístico Minitab oferece.

Testes paramétricos (médias)

Testes não paramétricos (medianas)

Teste t para 1 Amostras

Teste do Sinal para 1 Amostra, teste de Wilcoxon para 1 Amostra

Teste t para 2 Amostras

Teste de Mann-Whitney

ANOVA com um Fator

Kruskal-Wallis, Teste de Mood para a Mediana

DOE fatorial com um fator e um bloco

Teste de Friedman

Razões para usar testes paramétricos

Razão 1: Os testes paramétricos podem apresentar um bom desempenho com distribuições assimétricas e não normais

Isso pode ser uma surpresa, mas os testes paramétricos podem funcionar bem com dados contínuos que sejam não normais se você atender às orientações de tamanho amostral na tabela abaixo. Essas orientações são baseadas em estudos de simulação realizados por estatísticos aqui na Minitab. Para saber mais sobre esses estudos, leia nossos artigos técnicos.

Análises paramétricas

Orientações sobre tamanho amostral para dados não normais

Teste t para 1 Amostras

Maior do que 20

Teste t para 2 Amostras

Cada grupo deve ser maior do que 15

ANOVA com um Fator

  • Se você tiver de 2 a 9 grupos, cada um deles deverá ser maior do que 15.
  • Se você tiver de 10 a 12 grupos, cada um deles deverá ser maior do que 20.

Razão 2: Os testes paramétricos podem apresentar um bom desempenho quando a dispersão de cada grupo é diferente

Embora os testes não paramétricos não assumam que seus dados seguem uma distribuição normal, eles têm outras suposições para as quais pode ser difícil encontrar uma correspondência. Para testes não paramétricos que comparam grupos, uma suposição comum é que os dados para todos os grupos devem ter a mesma dispersão. Se seus grupos tiverem uma dispersão diferente, pode ser que os testes não paramétricos não forneçam resultados válidos.

Por outro lado, se você usar o teste t para duas amostras ou ANOVA com um fator, basta acessar a subcaixa de diálogo Opções e desmarcar Assumir variâncias iguais. Prontinho! Você estará pronto para prosseguir mesmo quando os grupos têm dispersões diferentes!

Razão 3: Poder estatístico

Os testes paramétricos geralmente têm mais poder estatístico que os testes não paramétricos. Assim, é mais provável que você detecte um efeito significativo quando ele realmente existir.

Razões para usar testes não paramétricos

Razão 1: Sua área de estudo é mais bem representada pela mediana

Esta é a minha razão favorita para usar um teste não paramétrico e que frequentemente não é mencionada! O fato de você poder realizar um teste paramétrico com dados não normais não significa que a média seja a melhor medida da tendência central dos seus dados.

Por exemplo, o centro de uma distribuição assimétrica, como a renda, pode ser mais bem medido pela mediana, em que 50% estão acima da mediana e 50% estão abaixo. Se você adicionar alguns bilionários a uma amostra, a média matemática aumenta muito, mesmo que a renda da pessoa típica não mude.

Quando sua distribuição é assimétrica o suficiente, a média é fortemente afetada por mudanças distantes na cauda da distribuição, enquanto a mediana continua a refletir mais proximamente o centro da distribuição. Para essas duas distribuições, uma amostra aleatória de 100 de cada distribuição produz médias significativamente diferentes, mas medianas que não são significativamente diferentes.

Dois outros posts no blog ilustram bem este ponto:

Razão 2: Você tem um tamanho amostral muito pequeno

Se você não atender às orientações de tamanho amostral para os testes paramétricos e não tiver certeza de que os dados seguem uma distribuição normal, deverá usar um teste não paramétrico. Quando você tem uma amostra muito pequena, pode não conseguir de determinar a distribuição de seus dados porque os testes de distribuição não terão poder suficiente para proporcionar resultados significativos.

Nesse cenário, você está em uma situação difícil sem alternativa válida. Os testes não paramétricos têm menos poder para começar e, ter também um tamanho amostral baixo, representa aumenta o problema!

Razão 3: Você tem dados ordinais, dados ordenados ou outliers que não podem ser removidos

Os testes paramétricos típicos só podem avaliar dados contínuos e os resultados podem ser significativamente afetados por outliers. Em contrapartida, alguns testes não paramétricos podem manusear dados ordinais, dados ordenados e não serem seriamente afetados por outliers. Certifique-se de verificar as suposições para o teste não paramétrico, porque cada um possui seus próprios requisitos de dados.

Se você tiver dados de Likert e quiser comparar dois grupos, leia meu post Melhor maneira de analisar dados de itens do tipo Likert:Teste T para duas amostras versus teste de Mann-Whitney.

Considerações finais

É comum pensar que a necessidade de escolher entre um teste paramétrico e não paramétrico ocorre quando seus dados não atendem a uma suposição do teste paramétrico. Esse pode ser o caso quando você tem um tamanho amostral pequeno e dados não normais. No entanto, outras considerações muitas vezes desempenham um papel porque, com frequência, os testes paramétricos podem manusear dados não normais. Por outro lado, os testes não paramétricos têm suposições estritas que não podem ser ignoradas.

A decisão geralmente depende se a média ou a mediana representa com mais precisão o centro da distribuição dos seus dados.

  • Se a média representar com precisão o centro de sua distribuição e o tamanho de sua amostra for grande o suficiente, considere a realização de um teste paramétrico, pois ele será mais eficiente.
  • Se a mediana representar melhor o centro da sua distribuição, considere o teste não paramétrico mesmo quando tiver uma amostra grande.

Por fim, se você tiver um tamanho amostral muito pequeno, poderá ficar travado ao usar um teste não paramétrico. Se for possível, colete mais dados da próxima vez! Como você pode ver, as orientações não são de tamanhos amostrais grandes demais. Sua chance de detectar um efeito significativo quando ele existe pode ser muito pequena quando você tem um tamanho amostral pequeno e precisa usar um teste não paramétrico menos eficiente!