Big Data Analytics para Profissionais Non-Tech | Data Storytelling: Qual o melhor tipo de gráfico? (Parte II) - por Fabiano Castello

Artigo

12 Maio, 2019

São seis os passos para contar uma boa história (leia novamente aqui), e vamos continuar a falar sobre tipos de visualizações. Na última coluna falamos sobre o seu melhor amigo, o gráfico de barras, e o gráfico de linhas. Hoje damos sequência falando sobre gráficos de dispersão, animações e gauges, ou medidores.

Sobre animações, ou gráficos animados, a regra é simples: use com cuidado! Existe lugar e hora certa. São excelentes quando se trata de mostrar mudanças ao longo do tempo, mas funcionam muito mais para impactar a audiência do que propriamente para fazer análise de dados. O melhor benchmark para gráficos animados são os TEDs do Hans Hosling. Recomendo fortemente este playlist aqui.

medidores, ou gauges, são importantes para montar painéis de controle porque entregam a mensagem rapidamente. Veja nos exemplos abaixo: instantaneamente é possível saber se determinada situação está boa, média ou ruim.  É importante ter em mente, no entanto, que são gráficos auxiliares, porque pouco precisos e carecem de informação analítica que possibilite aprofundar análises. Para usar um medidor você precisa ter na manga algum material analítico que suporte o que o medidor está indicando.



Finalmente, gráficos de dispersão. Um dos meus favoritos. Na sua versão mais simples, é utilizado simplesmente para mostrar como duas variáveis se relacionam. Um gráfico "X-Y" básico! Veja o exemplo abaixo: a satisfação decresce a medida que os dias de atraso aumentam.



Mas um gráfico de dispersão pode apresentar quatro dimensões além das duas mencionadas anteriormente: o tamanho e a cor de cada ponto plotado no gráfico. No exemplo abaixo temos um gráfico de dispersão de quatro dimensões. A versão "básica" relaciona o custo de produção de filmes no eixo X em relação ao faturamento de bilheteria no cinema, no eixo Y. Notem que ET e Caçadores da arca perdida custaram pouco e faturaram pouco; já Avatar foi caro e faturou alto. Foi melhor que Piratas do Caribe, que custou quase a mesma coisa e faturou muito menos. Mas o que interessa mesmo é o ROI ("return on investment" ou retorno sobre o investimento), que no gráfico é representado pelo "tamanho da bola". De longe ET foi o que mais trouxe retorno sobre o investimento, em termos percentuais. Finalmente, fica fácil comparar entre gêneros porque esta informação está nas cores dos pontos. 


Um último ponto, e talvez seja por isso que dispersão seja um dos meus favoritos. Antes de iniciar qualquer tipo de análise, é importante explorar os dados, ter uma ideia se são razoáveis. Aqui não estamos falando de PowerBI, QliSense ou Tableu, mas de uma biblioteca de Python chamada Seaborn, e de um tipo de gráfico chamado "pairplot", que monta vários gráficos de dispersão correlacionando diversas variáveis numéricas de uma base de dados, de uma vez só, lado a lado. Se existe algo perfeito na face da terra, é isto ? Rapidamente é possível perceber correlação entre variáveis, como é sua distribuição e eventuais outliers. Rapidamente e de graça!


O exemplo acima é de uma biblioteca de Python, mas existem os mesmos recursos para [R]. E tão bons quanto! É isso aí! Na próxima coluna escreverei sobre o próximo passo para contar uma boa história: eliminar o que não é necessário. Até lá.

IMPORTANTE: se você chegou até aqui provavelmente terá interesse em conhecer três cursos da Inova Business School que iniciarão em breve: 4a Revolução Industrial & Emerging Technologies (Junho), Data Storytelling com Power BI (Julho) e Inteligência Artificial para Negócios (Julho).

* * *


Chat