Blog da Minitab

Entenda o cliente através das árvores de classificação e regressão

Written by Jenn Atlas | 27/jan/2021 0:27:00

Pense na última vez que você voou de avião. Como foi essa experiência? Provavelmente, a maioria das pessoas pode pensar em alguns aspectos que afetaram seus voos anteriores, tanto positiva quanto negativamente, e acabaram influenciando sua satisfação.

Quando se trata de viagens aéreas, a satisfação do passageiro é uma métrica crucial para as companhias aéreas. Saber que seus passageiros estão satisfeitos é bom, mas saber a razão deles estarem satisfeitos é ainda melhor. Esses insights podem ajudar bastante uma companhia aérea a entender onde estão seus pontos fortes e onde podem melhorar, do ponto de vista de seus clientes. Vamos ver mais detalhadamente.

Um estudo sobre a satisfação do cliente pediu aos passageiros que avaliassem sua satisfação geral, juntamente com outros aspectos de seu voo (por exemplo, conforto do assento, facilidade de reserva online, espaço para as pernas, atrasos na partida e chegada, medidos em minutos). Esta pesquisa constatou que 54% dos passageiros ficaram satisfeitos com seu voo, o que nos mostra que, de modo geral, a maioria dos clientes está satisfeita com sua experiência.

Compreender o motivo dos clientes estarem satisfeitos

É muito bom saber que a maioria dos clientes está satisfeita com sua experiência de voo. As próximas questões lógicas são: por que os clientes estão satisfeitos e o que separa um cliente satisfeito de um cliente neutro/insatisfeito? A pesquisa nos forneceu muitos preditores (>20) para investigar e muitos dados (mais de 100.000 linhas). Tirando partido do menu de Análise preditiva, na versão mais recente do Minitab Statistical Software, podemos usar o CART® para identificar rapidamente os principais motivadores da satisfação do cliente.

Pronto para saber mais sobre a versão mais recente do Minitab?


O CART®, ou Árvores de classificação e regressão, é um algoritmo de árvore de decisão usado para ajudar a encontrar padrões e relacionamentos importantes em variáveis de dados. Se a pergunta ou problema que você está enfrentando tem uma resposta do tipo categórica binomial ou multinomial, use a Classificação CART, e qualquer coisa que tenha uma resposta contínua com muitos preditores categóricos ou contínuos deve usar a Regressão CART.

Nesta pesquisa, estamos categorizando os clientes em dois grupos (satisfeitos ou neutros/insatisfeitos), então usaremos a Classificação CART. A ideia principal por trás do CART é que particionamos as variáveis preditoras em diferentes regiões para que a variável dependente (também conhecida como variável alvo, que neste caso é a satisfação) possa ser predita com mais precisão. O Minitab Statistical Software encontrará automaticamente a melhor árvore de decisão para você e fornecerá as estatísticas do modelo, para que possa entender se o modelo é útil.

Ao analisar esses dados, o modelo padrão é bastante grande - o que é perfeitamente normal. Suponha que você realmente queira se concentrar e compreender os principais motivadores da satisfação. Nesse caso, o gráfico de Importância relativa da variável pode informar quais preditores são as variáveis mais importantes para a árvore.

Como você pode ver abaixo, o entretenimento a bordo e o conforto do assento são as variáveis mais importantes ao prever a satisfação, seguidos pela facilidade de reserva online e suporte online, que também foram classificados como muito importantes.

Flexibilidade para ajustar um modelo alternativo

Em geral, as árvores CART podem ser muito grandes. Visualizar uma árvore menor com informações semelhantes pode ser útil, especialmente se planejamos comunicar nossas descobertas a outras pessoas. Felizmente, a versão mais recente do Minitab Statistical Software contém uma visualização interativa do modelo que nos permite explorar, visualizar e examinar modelos alternativos em uma janela conveniente.

Como você pode ver abaixo, uma árvore muito menor foi selecionada, para que possamos visualizar as principais variáveis e divisões.

Diagramas de árvore para ajudá-lo a compreender os detalhes

Agora, olhando a árvore com mais detalhamento, podemos ver que, quando o entretenimento a bordo é classificado como sendo maior que 3,5, aproximadamente 81% dos clientes classificaram sua experiência como satisfatória.

A barra indicadora vermelha e azul (mostrada acima e em cada nó da árvore) torna esses resultados fáceis de ver. O azul representa a resposta “satisfeito” e o vermelho é “neutro/insatisfeito”. Isso também ajuda a perceber que quando os clientes classificam o entretenimento a bordo como sendo menor que 3,5, eles tendem a ficar mais satisfeitos se o conforto do assento for alto, mas muito menos satisfeitos se o conforto do assento for baixo (siga o caminho pelo lado esquerdo do árvore).


As árvores CART são muito úteis quando você deseja entender as variáveis​ importantes, mas também tornam mais fácil para qualquer pessoa explorar as variáveis visualizando os valores que geram as divisões no modelo. Usando a árvore acima, as companhias aéreas provavelmente não ficarão muito surpresas ao saber que os clientes querem um bom entretenimento a bordo e um assento confortável - mas saber que mesmo que o entretenimento a bordo não seja ótimo, eles podem manter os passageiros satisfeitos com um assento confortável - é uma informação importante.

O CART é uma ferramenta útil para sua caixa de ferramentas de análise, pois não requer muitas suposições e pode ser concluído rapidamente. Se você tiver dados que não analisou porque a análise preditiva e o aprendizado de máquina parecem muito intimidadores para você - experimente o CART - que ficou ainda mais fácil na versão mais recente do Minitab Statistical Software.

Quer mais dicas e truques sobre como usar o CART® no Minitab?