Aviso de assunto polêmico! Nem todos os estatísticos concordam com o que eu coloco aqui. Podemos discutir.
Na jurimetria, variáveis categóricas são muito comuns. Favorável/desfavorável, classe/assunto do processo, comarca/vara, são todas variáveis categóricas. Por isso, gráficos de pizza e gráficos de barras são muito comuns neste universo.
Existe uma fama de que estatísticos são completamente contra gráficos de pizza. Talvez eu até tenha defendido isso por algum tempo, mas eu mesmo uso gráficos de pizza nos dias de hoje, em projetos sérios. Por isso, nessa discussão proponho uma solução um pouco menos agressiva
Afinal, qual é o problema da ?
Para mim, o problema desses gráficos é o sistema de coordenadas. Um gráfico de setores, como as pessoas mais sérias costumam chamar o gráfico de pizza, nada mais é do que uma transformação de um gráfico de barras em coordenadas polares. Não acredita? veja aqui:
O problema nessa transformação – e isso é discutível – é que é mais difícil comparar tamanhos das barras quando estamos em um sistema de coordenadas polares. O argumento é que nosso cérebro está mais acostumado a ler diferenças lineares do que angulares.
Isso fica mais evidente quando temos muitas categorias. Veja, por exemplo, esses gráficos:
library(ggplot2)
set.seed(1)
da <- as.data.frame(table(LETTERS[rpois(100, 15)]))
# barras
ggplot(da) +
aes(reorder(Var1, Freq), Freq) +
geom_col()
# pizza
ggplot(da) +
aes(x = "", y = Freq, fill = reorder(Var1, Freq)) +
geom_col(width = 1, colour = "black") +
coord_polar("y")
Created on 2021-02-09 by the reprex package (v0.3.0)
Não é muito evidente que as barras mostram melhor a diferença entre Q e M do que a pizza?
Por outro lado, nós também já somos treinados culturalmente para ler gráficos de pizza. Como ele é muito utilizado, ser fácil de fazer e ter um apelo visual bacana – também discutível – acaba sendo utilizado e consumido por frequência. Por isso, dependendo do interlocutor, pode ser mais fácil transmitir a informação desejada através de uma pizza do que através de um gráfico de barras.
Dito isso, uma coisa que resolve bem o problema são gráficos dinâmicos. Ao colocar o mouse sobre um gráfico em um dashboard interativo, por exemplo, geralmente conseguimos acessar os números exatos e proporções. Isso permite que os gráficos de barras possam ser utilizados até mesmo em situações mais controversas.
Wrap up
Minha recomendação, portanto, é:
- Se você acha que as pessoas que farão a leitura do seu gráfico gostam de gráfico de pizza e a variável que você quer analisar tem poucas categorias, seja feliz.
- Se não, faça um gráfico de barras.
- Se seu gráfico é interativo, seja feliz e conquiste seus clientes com o voosh das visualizações
E claro, por favor não faça gráficos de pizza 3D. Nunca. Eles distorcem os dados e só atrapalham a visualização. O uso de pizza 3D só é permitido para trollar: