Tuesday, December 10, 2024

Quando consultar um estatístico?

       

            

          O estatístico desempenha papel crucial na pesquisa científica e na ciência de dados, pois usa a arte e a ciência da Estatística para resolver problemas práticos. É o estatístico que faz a ponte entre dados e resultados, e propicia ao pesquisador as condições para fazer inferências válidas, dentro de uma margem calculada de erro.

          Por conta da aplicação prática, é preciso que o estatístico entenda as questões que lhe são propostas, e saiba traduzir  as análises que faz para o pesquisador. Portanto, esse profissional precisa ter formação teórica, mas tem de se familiarizar com a terminologia da área em que trabalha.

         O papel que um estatístico desempenha em uma pesquisa depende das necessidades do trabalho. O estatístico pode ser colaborador ou parceiro integral. Ao longo de um período de colaboração, cada colaborador educa o outro nas reuniões e discussões regulares, que abrangem muitos aspectos do estudo.

        Quando o estatístico é funcionário da instituição, ele  é, evidentemente, membro natural da equipe. É o estatístico quem avalia o projeto, propõe a análise dos dados e, eventualmente, vê problemas que não são óbvios para os demais pesquisadores. Ele tem, no trabalho,  responsabilidades que são próprias da profissão, independentemente de seu cargo e de seu status na instituição. 

       Embora seja melhor envolver um consultor estatístico no design de um estudo, ele também pode ser trazido para um projeto após os dados terem sido coletados. O consultor pode ajudar a selecionar e implementar métodos de análise que sejam apropriados e eficazes para os tipos de dados obtidos. Para fazer isso,  precisa ter uma descrição completa e detalhada do design e da conduta do trabalho, bem como uma exposição clara das questões a serem abordadas.

       Um estatístico deve saber (ou pode ser capaz de desenvolver) maneiras estatisticamente válidas de obter respostas para as perguntas do pesquisador. Além disso, ele examinará os dados em busca de ameaças à validade das conclusões, variando de dados ausentes a outliers questionáveis ​​e fatores de confusão. No entanto, se os procedimentos do estudo não forneceram dados que possam responder às questões da pesquisa, o estatístico não pode remediar isso com métodos estatísticos; ele pode, porém, apontar informações que, eventualmente, possam ser extraídas dos dados.

    Depois de os dados terem sido analisados, os resultados devem ser interpretados e transmitidos a um público como uma agência reguladora, um periódico de pesquisa um meio de comunicação ou à gerência. Um estatístico é valioso nesta fase para verificar se as conclusões do trabalho provieram dos resultados da análise, sugerir as melhores maneiras de descrever e exibir os dados e assegurar que não há declarações errôneas ou incompletas sobre as descobertas.

      Quando o estatístico é consultado nesta fase pela primeira vez,  pode querer reanalisar os dados usando métodos que ele considera mais apropriados do que aqueles aplicados. Isso pode ser ou não benéfico – depende de avaliação criteriosa. De qualquer forma, a discussão em ciência exige foco - e isso em aspectos específicos de uma questão complexa. Ao contrário dos argumentos cotidianos, o argumento científico é gerado sob critérios de aceitabilidade, como consistência com leis físicas, simplicidade, suporte empírico e, obviamente, estatística.


         💡 Dica. Um estatístico é especialmente útil quando:


1.    O pesquisador precisa de ajuda para planejar um estudo que responda às suas perguntas;

2.       É preciso determinar o tamanho da amostra;

3.    A pesquisa resultou em diferentes tipos de dados, que exigem diferentes  tipos de análises;

4.       O volume de dados para analisar é muito grande;

5.      O método de análise que os dados exigem são complexos, além da experiência do pesquisador sobre o assunto;

6.   O pesquisador simplesmente prefere contar com um estatístico profissional.


          💡 Dica importante

        🛑 Cuidado. Um consultor de Estatística precisa:

 

1.         Ter bom conhecimento de estatística;

2.        Ter capacidade de comunicação, escrita e oral;

3.        Ser bom ouvinte;

4.        Saber solucionar problemas de estatística;

5.        Ser agradável para trabalhar;

6.   Ser paciente com clientes que têm pouco conhecimento de Estatística;

7.        Ter  ética;

8.      E, ainda, como a Estatística têm diferentes áreas de especialização, um consultor precisa ter habilidades que correspondam às necessidades da área de pesquisa que assessora. Por exemplo, um estatístico que trabalha na área experimental provavelmente não é versado nos melhores métodos para assessorar e analisar grande levantamentos de dados.



 


     

Friday, November 01, 2024

Colisão de táxis: Bayes resolve

 


                                   A 21 de fevereiro de 2022 publiquei, no meu blog, sob o título de

Inferência Bayesiana, um problema que encontrei no extraordinário livro

Kahneman, D. Thinking...fast and slow. Farrar, Straus and Giroux.  2011 p.167-168.

🔴 PROBLEMA

Um táxi que causou um acidente de trânsito se evadiu. Para julgar o caso, são fornecidos os seguintes dados: 85% dos táxis da cidade são da empresa Verde e 15% da empresa Azul. Uma testemunha que presenciou o acidente disse que o táxi era da empresa Azul. Essa testemunha foi colocada em teste e se verificou que nas condições do acidente, acertava a cor dos táxis 80% das vezes. Qual é a probabilidade de o táxi que causou o acidente ser da empresa Azul, dado que a testemunha disse que era da Azul?

                                                   A SOLUÇÃO

Este é um problema clássico de inferência bayesiana. Há duas fontes de informação: uma estatística populacional e o relato de uma testemunha não perfeitamente confiável. Essas duas informações devem ser combinadas usando o teorema de Bayes.

Veja as probabilidades:

·       P(A): Probabilidade de o táxi ser da empresa Azul (0,15).

·       P(V): Probabilidade de o táxi ser da empresa Verde (0,85).

·   P(TA): Probabilidade de a testemunha dizer que o táxi é da empresa Azul dado que o táxi é realmente da empresa Azul (0,80).

·   P(TV): Probabilidade de a testemunha dizer que o táxi é da empresa Azul dado que o táxi é da empresa Verde (0,20).

·     P(T): Probabilidade de a testemunha dizer que o táxi é da empresa Azul.

Queremos calcular P(AT), que é a probabilidade de o táxi ser da empresa Azul dado que a testemunha disse que era da empresa Azul. Usamos a fórmula de Bayes:


               


A probabilidade de a testemunha dizer que o táxi é da empresa azul é


  A probabilidade de o táxi ser da empresa Azul dado que a testemunha disse que era da empresa Azul é


Portanto, a probabilidade de o táxi ser da empresa Azul dado que a testemunha disse que era da empresa Azul é 41,4%.

 

 


Sunday, September 22, 2024

ESTIMATION: problem set

                           


From: Andrew F. Siegel

Practical Business Statistics�(Sixth Edition), 2012

SUMMARY

                          Here you will find five exercises on statistical estimation.

                        To solve them, you need to understand percentiles, uniform

                        distribution, exponential distribution, and confidence intervals.

















Sunday, September 08, 2024

HYPOTHESIS TESTING: PROBLEMS FOR ENGINEERS



                                                                     SUMMARY                      

                                 Here, you will find six exercises on hypothesis testing.

                         To solve them, you need knowledge of the following concepts: 

                           Normal distribution, Binomial distribution, Hypothesis testing,

                           Hypothesis testing when the standard deviation is unknown, 

                                  Level of significance and Power of the test.





             

                                           Os exercícios aqui apresentados são do livro:

                                           Gibra,I.N. Probability and statistical inference for

                                                         scientists and engineers.










Monday, September 02, 2024

Teste de hipóteses (um parâmetro)



 

RESUMO

Estão aqui apresentados quatro exercícios que exigem conhecimento dos seguintes tópicos: Erro tipo I. Erro tipo II. Probabilidade de erro tipo I. Probabilidade de erro tipo II. Alfa e beta. Poder do teste. Tamanho da amostra para ter poder do teste com valor especificado. Os exercícios aqui apresentados são do livro:

       Gibra, I.N. Probability and statistical inference for scientists and engineers.

                               

                                          






Saturday, August 17, 2024

RUNS TEST OU TESTE DE RUNS OU TESTE DAS SEQUÊNCIAS


                                                                             


RESUMO

Você encontra aqui: a definição de run ou sequência; o teste de runs para 

verificar se uma sequência de dados é aleatória; o teste de runs para verificar 

a aleatoriedade da amostra; e o procedimento para o teste de runs em uma amostra.

                                                                    INTRODUÇÃO





Os exemplos estão simplificados. Para sequências maiores e mais complexas, o teste de runs pode ser calculado usando software estatístico.