Friday, August 13, 2021

Consultoria estatística

 

    O planejamento da amostragem, o delineamento de ensaios, a análise de dados e a interpretação de estatísticas exigem competência profissional. Por conta disso, os pesquisadores das mais diferentes áreas buscam consultoria estatística, uma vez que Estatística é a ciência que fornece os princípios e a metodologia para o planejamento da coleta de dados, a organização, o resumo e a análise de resultados. A consultoria estatística exige, porém, não apenas conhecimento na área, mas também habilidade do consultor para estabelecer bom relacionamento com outros profissionais.


    A quantidade de atenção dada pelo consultor de estatística a um pesquisador depende de diversos fatores, tais como competência profissional do consultor, propostas alternativas de trabalho, conhecimento do pesquisador sobre estatística, status profissional do pesquisador, política do ambiente de trabalho e simpatia e sentimentos pessoais. A ideia de que a interação pessoal não ocorre em ciência e que o consultor é um indivíduo calmo e reservado não confere com a realidade. A consultoria estatística é um caos: trabalha-se sob a pressão de tempo, da falta de verba, da política do ambiente de trabalho e da discriminação profissional.


    Entretanto, a melhoria do status profissional do estatístico nas áreas da saúde depende tanto de o estatístico aprender a dar consultoria como de o pesquisador aprender metodologia científica. O estatístico precisa entender o problema e – para isso – os protocolos de pesquisa precisam estar ser feitos. No entanto, os estatísticos começam a dar consultoria sem treinamento formal. No curso de Estatística, o aluno interage pouco com profissionais de outras áreas. O enfoque é a teoria, embora a maioria dos estatísticos trabalhe em coleta e análise de dados. No caso dos profissionais das áreas da saúde, o problema é o fato de eles assistirem aulas de Bioestatística no início do curso, em salas superlotadas. O professor então ensina a usar um programa de computador – porque isso traz o interesse dos alunos – e não ensina Estatística.


    De qualquer forma, muitos anos de atividade convencem os consultores de estatística de que é raro reunir, numa única entrevista, um problema interessante, um pesquisador inteligente e disposto a estudar e uma situação favorável de trabalho. No entanto, quando essas três condições estão ausentes, fica difícil lidar com a situação. Alguns percalços são, porém, bastante comuns.


    Existem pesquisadores que esperam demais do consultor de estatística: eles querem que o consultor se entusiasme pelo trabalho deles, repita explicações várias vezes porque eles “não são bons na matemática”, tenha tempo para eles sempre que precisarem. Por outro lado, existem consultores que fazem de menos: apenas recebem os dados já digitados em planilha e depois apresentam as estatísticas com a informação de que interpretações correm por conta do interessado. Essa atitude é hostil, mas pode ter sido deflagrada pelo fato de o estatístico ter convivido com a apropriação indevida de seu trabalho.


    É comum o uso do trabalho de profissional de Estatística sem referenciar o nome do profissional. Basta olhar algumas revistas especializadas e procurar pelos artigos que expõem análises estatísticas sofisticadas. Grande parte desses artigos não dá o nome de quem fez a análise, o nome do programa de computador utilizado ou o título de um livro didático que exponha a técnica utilizada. Quando perguntados sobre o autor das análises estatísticas, os autores alegam que o serviço de estatística foi pago – e esquecem que eles também são pagos para trabalhar. É preciso, portanto, delimitar o que é serviço de consultor e o que é serviço de autor. Todo estatístico, no entanto, sabe que, vez por outra, ocorrem apropriações indevidas de seu trabalho. Isso sempre traz frustração, mas a reação hostil não ajuda.


Dadas essas considerações, parece claro que a relação de trabalho deva ser negociada desde o início. Entretanto, não é claro quando o estatístico deva ser coautor do trabalho. Há exageros dos dois lados. Alguns estatísticos exigem coautoria de trabalhos em que somente sugeriram gráficos. Isso é inaceitável porque, em tais casos, o trabalho do estatístico é de professor – não de coautor do trabalho. Outras vezes, o nome do estatístico não é sequer citado em trabalhos que exibem, por exemplo, o ajuste de uma função logística passo a passo para dados de resposta quântica, com testes e intervalos de confiança para as estimativas dos parâmetros.

    A sugestão, aqui, é de que estatísticas mais comuns, no nível de compreensão e até de execução dos pesquisadores, dispensem a coautoria de estatístico. Isso não dispensa, contudo, os pesquisadores de esclarecer, em nota de rodapé, que houve consultoria. Por outro lado, pesquisadores e editores devem saber que análises estatísticas mais técnicas – como, por exemplo, uma análise de variância de ensaio conduzido em parcelas subdivididas – exige referência ao nome do profissional que fez a análise, o nome do programa de computador utilizado e uma referência de onde se encontram informações sobre esse tipo de análise. Trabalhos com estatísticas mais especializadas, seja no planejamento ou na análise e interpretação dos resultados, exigem estatístico como coautor.


    Por razões políticas e institucionais, o estatístico pode não se sentir à vontade para recusar consultoria a um trabalho, mesmo que tenha restrições à qualidade da pesquisa. A defesa do estatístico, aqui, é a mesma do médico que tem um cliente que, por exemplo, já passou da meia idade, é gordo, hipertenso, fuma, bebe, come demais e diz não ter tempo para fazer exercícios. Recorrer à tática do amedrontamento não ajuda, porque isso só irá gerar tensão e, consequentemente, mais comida, mais fumo, mais bebida. A única opção do médico é assistir o paciente.


    A sugestão, aqui, é a de se o estatístico for consultado sobre pesquisas menores, não recuse ajuda. Aliás, a pesquisa será feita de qualquer forma. O estatístico, todavia, deve agir com coerência, isto é, não deve usar técnicas sofisticadas de análise que serviriam apenas para dar aparência de mérito. É razoável optar por análise descritiva e alguns gráficos, que em geral estão no nível de compreensão do interessado e de seu público.


    Um estatístico pode entrar em conflitos sérios com administradores que estejam mais preocupados com trabalhos que mostrem resultados positivos, tragam ganho imediato e sejam publicados do que com trabalhos que tragam benefício para o público. Portanto, o estatístico que está resolvido a trabalhar dentro de parâmetros éticos arrisca-se a ser impopular. Mais ainda, pode ficar em situação extremamente vulnerável porque não existe organização formal que proteja o profissional de estatística. Também não se pode contar com a ajuda de colegas, quando se tem problemas de trabalho devido o próprio trabalho.


    Mas como o estatístico deve proceder diante do pesquisador que tem seu ponto de vista firmado, argumentação racional, mas seus dados apontam para outra direção? Seria razoável “ajudar” a análise estatística? A verdade do pesquisador não seria mais importante do que dados que não são conclusivos? Do meu ponto de vista não é razoável “ajudar” a análise. O certo é buscar o teste indicado – não o teste que dê significância. É preciso que haja transparência, ou seja, explicação para a escolha das técnicas utilizadas.


    Atualmente, um médico pode pedir uma série de exames radiológicos e laboratoriais em lugar de ouvir o paciente e pensar. O consultor de estatística também pode “jogar” os dados no computador, em lugar de ouvir o pesquisador e pensar. Dadas às distorções existentes, é preciso buscar a Ética para discutir os muitos problemas que, em parte, decorrem da tecnologia e da pressa em se sobrepujar.


    No que se refere aos consultores de estatística, parece razoável considerar três pontos discutidos aqui: primeiro, a coautoria de estatístico em trabalhos que tenham estatística não-usual na área do pesquisador é necessária; segundo, o consultor deve colaborar com trabalhos menores e, sempre que se sentir capaz, incentivar e ajudar para a melhoria da qualidade do trabalho; terceiro, um consultor nunca pode manipular resultados em função dos desejos do pesquisador, mas deve mostrar a ele como apresentar a verdade que os dados contêm.

Thursday, August 05, 2021

Graus de Liberdade no Resíduo de uma Análise de Variância (ANOVA)

 

    Imagine que você dispõe, para conduzir um experimento, de uma área com gradiente de fertilidade. O terreno é em declive e, portanto, mais fértil na baixada do que no topo. Você quer comparar quatro tratamentos, que indicaremos por A, B, C e D e resolve delinear cinco blocos. Cada bloco comporta quatro tratamentos. O delineamento poderia ser o que está na figura abaixo.


          Delineamento de um experimento em blocos

 


     Este delineamento é apropriado porque foi minimizada a variação dentro de cada bloco e maximizada a variação entre blocos. Mas o que se pode dizer do número de graus de liberdade do resíduo? A tabela de análise de variância (ANOVA table) para esse experimento está apresentada em seguida.


           Tabela de análise de variância (ANOVA table)


    A crítica mais repetida, para um trabalho experimental, é a de que a amostra é pequena. Algumas vezes também se argumenta que o número de graus de liberdade do resíduo deveria ser maior do que 10, ou 12. Mas por quê?

 

    Lembre-se de que você quer comparar quatro tratamentos. Então, o número de graus de liberdade para tratamentos é obrigatoriamente 3. Se você aumentar a amostra, em quanto aumenta o número de graus de liberdade do resíduo? Veja a tabela dada em seguida, que evidencia o aumento do número de graus de liberdade do resíduo quando se aumenta a amostra ou, mais especificamente no caso do exemplo, o número de blocos.

 

            Tabela: Graus de liberdade do resíduo em função

                              do número de blocos (4 tratamentos)                                 


    Observe a tabela de distribuição F dada em seguida. Olhe, especialmente, a coluna para 3 graus de liberdade do numerador (porque você quer comparar quatro tratamentos). Note que os valores críticos de F com 3 graus de liberdade no numerador tendem a se estabilizar depois de 12 graus de liberdade no denominador (resíduo da análise de variância).Veja em seguida a tabela de valores críticos de F em função do número de graus de liberdade do denominador (número de graus de liberdade do numerador = 3).

 

                          Tabela de distribuição F

 


Valores críticos a 5% de F em função do número de graus de liberdade do denominador (número de graus de liberdade do numerador = 3)

 


     Isso fica mais claro observando a figura dada em seguida. Como é o valor de F que determina a significância, sua possibilidade de detectar diferenças entre as médias dos quatro tratamentos melhora se você organizar cinco blocos ao invés de quatro (F crítico diminui de 3,86 para 3,49). No entanto, não melhora muito se, em lugar de cinco blocos, você usar seis (F crítico diminui de 3,49 para 3,29).

 

Valores críticos a 5% de F em função do número de graus de liberdade do denominador (número de graus de liberdade do numerador = 3)

 

 

     Vem daí a regra prática: pelo menos 12 graus de liberdade no resíduo da análise de variância.