O Papel da Visualização na Análise Estatística
Como os estatísticos usam a visualização pra melhorar sua análise e comunicação.
― 7 min ler
Os estatísticos usam Visualização de dados há muito tempo. Eles não só usam para mostrar seus resultados, mas também durante a análise. Este estudo investigou como 18 estatísticos profissionais usam visualização no dia a dia. O objetivo era entender como esses experts pensam sobre estatística inferencial e o que recomendam para criar ferramentas visuais melhores.
A Importância da Visualização em Estatística
Inferência estatística é sobre fazer previsões ou conclusões sobre um grupo maior baseado em uma amostra menor de dados. Os estatísticos usam diferentes métodos para analisar dados e tirar conclusões. A visualização ajuda eles a ver padrões e relações nos dados que talvez não sejam tão óbvios se só olharem para os números.
Os estatísticos muitas vezes confiam em representações visuais. Muitos acreditam que a visualização tem um papel crítico na compreensão dos dados e na tomada de decisões. Eles comentaram que visualização não é só para mostrar resultados; faz parte de todo o processo de análise.
Principais Descobertas
Uso da Visualização: Todos os participantes usaram visualização regularmente. Eles usaram tipos comuns de gráficos, como gráficos de dispersão e histogramas. A maioria mencionou que usava frequentemente visualizações especializadas para tarefas específicas.
Modelos Mentais: Estatísticos costumam pensar no trabalho em termos visuais. Muitos relataram ter uma imagem mental dos métodos estatísticos relacionados a gráficos. Eles usam técnicas visuais para ajudar a entender os dados.
Opiniões Diversas: Alguns estatísticos expressaram dúvidas sobre depender unicamente da visualização. Eles apontaram que, embora ferramentas visuais possam ajudar, elas devem ser combinadas com métodos numéricos para confirmar as descobertas. Isso levou a uma compreensão mais rica do processo.
Visualização e Seu Papel
A visualização serve para vários propósitos na análise estatística. Para muitos estatísticos, o primeiro passo após obter dados é criar um gráfico. Esse gráfico ajuda a ver como os dados estão, quais padrões podem existir e se há problemas como valores faltantes ou outliers.
Gráficos e tabelas facilitam a Comunicação. Estatísticos frequentemente usam visuais para apresentar descobertas a outros, especialmente para quem pode não ter uma formação estatística. Eles acreditam que visuais são mais eficazes em transmitir ideias complexas do que números sozinhos.
Porém, nem todos os visuais são vistos como iguais. Alguns estatísticos acham que gráficos casuais ou pouco refinados não contam como visualização séria. Eles acreditam que visualizações eficazes precisam ter clareza e apelo estético.
Entendendo a Estatística Inferencial
Estatística inferencial envolve métodos usados para inferir as características de uma população maior baseado em uma amostra. Essa área da estatística foca em usar probabilidade e cálculos para fazer afirmações sobre uma população. Estatísticos usam frequentemente testes de hipótese, que envolvem comparar uma hipótese nula a uma hipótese alternativa para tirar conclusões.
Estatísticos expressaram a importância da Análise Exploratória de Dados (AED). Diferente da análise confirmatória de dados (ACD), que testa uma hipótese específica, AED é sobre examinar os dados para descobrir padrões e insights. Esse processo muitas vezes envolve visualizar os dados para entendê-los melhor antes de realizar testes estatísticos mais formais.
Visualização como uma Ferramenta para Análise
Estatísticos veem a visualização como uma ferramenta valiosa em todo o trabalho. Eles mencionaram usar visualizações nas seguintes etapas:
Planejamento: A visualização ajuda a planejar a análise, permitindo que os estatísticos conceptualizem sua abordagem e identifiquem os dados necessários.
Análise Exploratória: Durante essa fase, eles criam vários gráficos para explorar os dados, checar outliers e identificar tendências. Esses checagens visuais estabelecem a base para análises mais profundas.
Análise Confirmatória: Muitos participantes notaram que usam visualização para validar seus achados após testes estatísticos, procurando conexões entre o que os números mostram e o que as visuais indicam.
Comunicação: Visuais são um meio primário de comunicar resultados. Estatísticos frequentemente confiam em gráficos para transmitir suas mensagens claramente a partes interessadas ou clientes que podem não entender jargão estatístico.
Equilibrando Visualização e Métodos Numéricos
Embora muitos estatísticos valorizem a visualização, eles frequentemente ressaltam as limitações. Alguns notaram que depender muito de visuais pode introduzir viés, pois os humanos podem ver o que querem ver. Portanto, eles também enfatizaram a importância de métodos numéricos no processo de análise.
Estatísticos geralmente preferem combinar evidências visuais e numéricas. Essa abordagem dupla permite que eles tenham uma compreensão mais completa dos dados e garante que não percam descobertas significativas devido à dependência de visuais apenas.
Recomendações para Melhores Ferramentas de Visualização
Baseado em suas experiências e insights, os estatísticos deram várias recomendações:
Propósito Claro: As visualizações devem ter um propósito claro. Seja explorando dados ou apresentando resultados, o design deve refletir o objetivo.
Informação Integrada: Visualizações eficazes devem incluir detalhes estatísticos, como tamanhos de efeito. Isso ajuda a entender as implicações da análise além dos apenas p-values, promovendo uma compreensão mais nuançada dos resultados.
Design Amigável: Gráficos devem ser intuitivos e fáceis de entender. Complexidade no design muitas vezes prejudica a clareza, então a simplicidade é fundamental.
Mecanismos de Feedback: Estatísticos enfatizaram a necessidade de ferramentas que permitam ajustes baseados em feedback. Esse aspecto facilitador encoraja a melhoria contínua das visualizações.
Várias Perspectivas: Ferramentas de visualização devem acomodar diferentes perspectivas sobre os dados. Oferecer múltiplas maneiras de olhar para os mesmos dados pode ajudar os usuários a ter uma compreensão mais completa.
A Complexidade da Relação dos Estatísticos com a Visualização
A relação entre estatísticos e visualização é multifacetada. Embora a visualização seja uma parte fundamental do fluxo de trabalho, seu uso varia entre indivíduos. Alguns estatísticos podem depender mais de visuais, enquanto outros veem métodos numéricos como superiores.
Apesar das diferenças, existe um fio comum entre estatísticos: a necessidade de verificação. Eles expressaram o desejo de confirmar descobertas por diferentes métodos, garantindo que suas análises sejam robustas e confiáveis. Essa verificação muitas vezes envolve checar achados visuais contra dados numéricos, criando um ciclo de feedback que enriquece sua compreensão.
Conclusão
Resumindo, a visualização é uma parte indispensável da análise estatística para estatísticos profissionais. Eles a utilizam em todas as etapas do trabalho-do planejamento e exploração até a comunicação dos achados. As percepções dos estatísticos ressaltam a importância de combinar ferramentas visuais com análise numérica para garantir uma compreensão abrangente e uma comunicação clara.
Ao entender como os estatísticos percebem e usam a visualização, podemos desenvolver melhores ferramentas que apoiem a análise de dados para todos, sejam profissionais experientes ou recém-chegados na área.
Título: Visualization According to Statisticians: An Interview Study on the Role of Visualization for Inferential Statistics
Resumo: Statisticians are not only one of the earliest professional adopters of data visualization, but also some of its most prolific users. Understanding how these professionals utilize visual representations in their analytic process may shed light on best practices for visual sensemaking. We present results from an interview study involving 18 professional statisticians (19.7 years average in the profession) on three aspects: (1) their use of visualization in their daily analytic work; (2) their mental models of inferential statistical processes; and (3) their design recommendations for how to best represent statistical inferences. Interview sessions consisted of discussing inferential statistics, eliciting participant sketches of suitable visual designs, and finally, a design intervention with our proposed visual designs. We analyzed interview transcripts using thematic analysis and open coding, deriving thematic codes on statistical mindset, analytic process, and analytic toolkit. The key findings for each aspect are as follows: (1) statisticians make extensive use of visualization during all phases of their work (and not just when reporting results); (2) their mental models of inferential methods tend to be mostly visually based; and (3) many statisticians abhor dichotomous thinking. The latter suggests that a multi-faceted visual display of inferential statistics that includes a visual indicator of analytically important effect sizes may help to balance the attributed epistemic power of traditional statistical testing with an awareness of the uncertainty of sensemaking.
Autores: Eric Newburger, Niklas Elmqvist
Última atualização: 2023-09-22 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2309.12684
Fonte PDF: https://arxiv.org/pdf/2309.12684
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.