Gráficos de pizza são ruins?

:warning: Aviso de assunto polêmico! Nem todos os estatísticos concordam com o que eu coloco aqui. Podemos discutir.

Na jurimetria, variáveis categóricas são muito comuns. Favorável/desfavorável, classe/assunto do processo, comarca/vara, são todas variáveis categóricas. Por isso, gráficos de pizza e gráficos de barras são muito comuns neste universo.

Existe uma fama de que estatísticos são completamente contra gráficos de pizza. Talvez eu até tenha defendido isso por algum tempo, mas eu mesmo uso gráficos de pizza nos dias de hoje, em projetos sérios. Por isso, nessa discussão proponho uma solução um pouco menos agressiva :hugs:

Afinal, qual é o problema da :pizza: ?

Para mim, o problema desses gráficos é o sistema de coordenadas. Um gráfico de setores, como as pessoas mais sérias costumam chamar o gráfico de pizza, nada mais é do que uma transformação de um gráfico de barras em coordenadas polares. Não acredita? veja aqui:

O problema nessa transformação – e isso é discutível – é que é mais difícil comparar tamanhos das barras quando estamos em um sistema de coordenadas polares. O argumento é que nosso cérebro está mais acostumado a ler diferenças lineares do que angulares.

Isso fica mais evidente quando temos muitas categorias. Veja, por exemplo, esses gráficos:

library(ggplot2)

set.seed(1)

da <- as.data.frame(table(LETTERS[rpois(100, 15)]))

# barras
ggplot(da) +
  aes(reorder(Var1, Freq), Freq) +
  geom_col()

# pizza
ggplot(da) +
  aes(x = "", y = Freq, fill = reorder(Var1, Freq)) +
  geom_col(width = 1, colour = "black") +
  coord_polar("y")

Created on 2021-02-09 by the reprex package (v0.3.0)

Não é muito evidente que as barras mostram melhor a diferença entre Q e M do que a pizza?

Por outro lado, nós também já somos treinados culturalmente para ler gráficos de pizza. Como ele é muito utilizado, ser fácil de fazer e ter um apelo visual bacana – também discutível – acaba sendo utilizado e consumido por frequência. Por isso, dependendo do interlocutor, pode ser mais fácil transmitir a informação desejada através de uma pizza do que através de um gráfico de barras.

Dito isso, uma coisa que resolve bem o problema são gráficos dinâmicos. Ao colocar o mouse sobre um gráfico em um dashboard interativo, por exemplo, geralmente conseguimos acessar os números exatos e proporções. Isso permite que os gráficos de barras possam ser utilizados até mesmo em situações mais controversas.

Wrap up

Minha recomendação, portanto, é:

  • Se você acha que as pessoas que farão a leitura do seu gráfico gostam de gráfico de pizza e a variável que você quer analisar tem poucas categorias, seja feliz.
  • Se não, faça um gráfico de barras.
  • Se seu gráfico é interativo, seja feliz e conquiste seus clientes com o voosh das visualizações :slight_smile:

E claro, por favor não faça gráficos de pizza 3D. Nunca. Eles distorcem os dados e só atrapalham a visualização. O uso de pizza 3D só é permitido para trollar:

A questão dos gráficos de pizza é que são realmente mais difíceis de serem lidos.

Esse artigo famoso explica como diferentes aspectos de uma visualização são codificados, e como nossas estimativas são mais ou menos precisas segundo o tipo de visualização.

Em ordem decrescente de precisão:

  • Posição em mesmas escalas alinhadas;
  • Posição em mesmas escalas desalinhadas;
  • Comprimento;
  • Direção / ângulo;
  • Área;
  • Volume;
  • Brilho e/ou saturação;
  • Matiz.

O gráfico de pizza se utiliza do ângulo e do volume de cada pedaço para comparar valores, enquanto que o gráfico de barra usa comprimento. Logo, conseguirmos ter estimativas mais precisas dos valores de um gráfico de barras, como o Julio já comentou.

1 Curtida