Monday, June 15, 2020

Rastreando a COVID-19



Conta uma lenda antiga, muito conhecida, que o inventor do jogo de xadrez levou seu invento ao rei, como presente. O rei gostou tanto do jogo que prometeu recompensar o inventor com o que ele quisesse. E o pedido pareceu simples: grãos de arroz.  Quantos grãos? O rei deveria mandar colocar um grão de arroz na primeira casa do tabuleiro, dois na segunda, quatro na terceira e assim sucessivamente, sempre duplicando em cada casa a quantidade de grãos colocada na casa anterior, até completar a última casa (o tabuleiro de xadrez tem 64 casas). É difícil de acreditar, mas faça as contas para ver: na 64ª casa o número de grãos de arroz excedia a produção mundial. Este é um exemplo clássico para mostrar que o crescimento exponencial é vertiginoso.

As epidemias crescem, pelo menos no princípio, exponencialmente porque o número de casos novos em determinado dia é proporcional ao número de casos existentes no dia anterior. A ideia de que podemos simplesmente deixar que uma epidemia avance até que se esgotem os susceptíveis é tão equivocada quanto à do rei da velha lenda, que não entendia que estava assumindo uma dívida impagável.  Mas como desacelerar a taxa de crescimento do COVID-19? Há várias tentativas para desenvolver uma vacina, mas isso leva muito tempo e não deve acontecer neste ano. Há ensaios clínicos em vários países colocando em teste diversos tratamentos, mas nenhum deles chegou sequer à fase III. Então, para diminuir a velocidade de crescimento da curva exponencial, a solução é o isolamento social.

Mas é amedrontador – quando estamos na fase exponencial da curva epidemiológica, que é o caso do Brasil – não saber até onde essa exponencial vai crescer. Vamos ter 10 vezes mais casos do que temos hoje? 100 vezes mais? 1000 vezes mais? Sabemos que a tendência exponencial não durará para sempre, mas até quando ela irá perdurar? Como estaremos nós, como país, daqui a 30 dias?

O físico e matemático Henry Reich e o engenheiro Aatish Bhatia propuseram, em um estudo com base em dados mundiais fornecidos pela Universidade Johns Hopkins, um gráfico em vídeo com animação, que tenta responder a pergunta: em quanto tempo a COVID-19 atingirá o pico?

A resposta a essa pergunta angustiante não foi obtida. No entanto, o gráfico mostra que, embora a exponencial cresça em diferentes países com diferentes taxas, todos seguem a mesma trajetória até a taxa cair, em algum ponto. Logo, se um país tem alguns poucos casos da doença, não aposte que está imune à epidemia. A epidemia seguirá seu curso, até o país encontrar a saída.

Mas veja o gráfico, que se fundamenta em três ideias. A primeira é usar escala logarítmica nos dois eixos; então, os números crescem em múltiplos de 10. Isso facilita colocar, no mesmo gráfico, números muito diferentes de casos. Mas cabe aqui uma advertência a quem lê o gráfico: cuidado, porque na escala logarítmica 10.000 ficam tão perto de 1.000 quanto 100 ficam perto de 10. Então, não subestime o crescimento vertiginoso. A segunda ideia, que não se vê em grande parte dos gráficos, é não colocar o tempo no eixo X. O tempo é usado como animação. E a terceira ideia é plotar o logaritmo do número de casos novos contra o logaritmo do número de casos existentes.

Colocando as variáveis transformadas no gráfico, isto é, o logaritmo do número de casos novos contra o logaritmo do número de casos existentes, observa-se, para todos os países, a mesma trajetória de crescimento em reta. As taxas de crescimento são constantes e muito similares, até que o crescimento do número de casos no tempo (nos gráficos usuais, mais conhecidos) deixa de ser exponencial. O uso de escalas logarítmicas não ajuda a intuição, mas é fácil concordar que à medida que o número de casos cresce, a taxa de incidência de novos casos aumenta mais ou menos na mesma proporção, em todos os países. E é importante observar os países em que a reta praticamente “desaba” – porque isso só pode ser explicado por políticas de saúde eficazes, ou seja, isolamento social ou confinamento e testes em massa.

Mas a maior limitação do gráfico são os próprios dados, obtidos de relatos provenientes de diferentes sistemas de saúde, todos sobrecarregados. A qualidade das informações é variável, porque países diferentes têm diferenças dramáticas na capacidade de testar a população para a doença e atestar óbitos. No Brasil, foram feitos poucos testes. Logo, o número de casos existentes de COVID-19 está subestimado, isto é, o número de casos existentes é muito maior do que o valor declarado, que se desconhece. O número de óbitos também está subestimado

Mas veja os gráficos, que não podem ser expostos aqui porque precisam da animação.

                        https://aatishb.com/covidtrends/  


Wednesday, March 25, 2020

Medidas repetidas: teste de esfericidade


    “Medidas repetidas” é o termo usado para indicar que as mesmas unidades são submetidas a todas as intervenções que estão em teste no ensaio. Em outras palavras, um ensaio com medidas repetidas é aquele em que a mesma unidade é medida tantas vezes quantas sejam as intervenções em teste. Seria o caso, por exemplo, de um estudo para saber o efeito de uma droga como analgésico em quatro participantes. Podem ser feitas três medidas de alívio de dor, uma no início do ensaio (linha de base, às 15 horas) e as outras duas horas depois, isto às 17 e às 20 horas. Veja a figura abaixo.                                      

    Tais intervenções também podem ser tratamentos como, por exemplo, colocar 5 degustadores (1, 2, 3, 4, 5) para testar, cada um, 4 tipos diferentes de café (os tratamentos). Esse delineamento é de medidas repetidas porque cada degustador deu uma classificação para cada tipo de café. A variável independente é o degustador e a variável dependente é a classificação do café. Veja a figura.


  É claro que, quando dizemos unidades, não estamos nos referindo apenas a pessoas. Experimentos com medidas repetidas podem ser feitos com plantas, animais, empresas, objetos. Mas vamos nos referir aqui apenas a uma variável independente. Assim, no primeiro exemplo, a variável independente seria alívio da dor e no segundo exemplo, a classificação do café.


Pressuposições para a análise com medidas repetidas
1.   Variável independente deve ser contínua.
2.   Cada unidade foi medida repetidas vezes.
3.   Não deve haver valores discrepantes.
4.   A variável dependente deve ter distribuição aproximadamente normal.

5.   Deve haver esfericidade. O que é esfericidade?
   Sabemos que, para fazer uma análise de variância, é preciso haver homogeneidade de variâncias entre grupos. Você encontra, neste blog, explicação sobre o teste de Levene, que testa a homogeneidade de variâncias entre grupos independentes. Mas quando fazemos análise de medidas repetidas, temos a tendência de achar que o problema simplesmente “desaparece”. Mas é preciso testar a esfericidade, porque a não esfericidade faz aumentar o erro tipo I, ou seja, aumenta a probabilidade de detectar erradamente significância do resultado.


Esfericidade é a condição em que as variâncias das diferenças entre todas as combinações de grupos são iguais.
                                                    Exemplo
  Para ilustrar o que significa esfericidade, vamos utilizar os dados fictícios apresentados na tabela dada em seguida. São seis sujeitos medidos em três tempos. Também são dados, na tabela, as diferenças entre cada combinação de grupos (os tempos)nas três últimas colunas da tabela. No rodapé da tabela estão as variâncias das diferenças entre combinações de grupos.
                                     Tabela com medidas repetidas 



   Calculamos as diferenças entre cada combinação de grupo (ponto do tempo) (as últimas três colunas na tabela acima). Como são três pontos no tempo, temos três combinações diferentes. É claro que o número de combinações possíveis será tanto maior quanto mais pontos (ou condições, ou grupos, ou tratamentos) tivermos.
  Calculamos as variâncias para as diferenças apresentadas na tabela acima. Olhando os resultados, temos a sensação de as variâncias das diferenças não são iguais (13,9 vs. 17,4 vs. 3,1). Parece que nossos dados violam a suposição de esfericidade. Vamos então proceder ao teste de esfericidade de Mauchly.

                              Teste de esfericidade de Mauchly.

   O teste de esfericidade de Mauchly é uma maneira formal de testar a hipótese de esfericidade. Mas esse teste nem sempre detecta desvios da esfericidade em amostras muito pequenas, nem em grandes amostras. Mesmo assim, é o teste mais comumente usado. Vamos então ver como utilizá-lo, usando o programa SPSS.


  Se o teste for estatisticamente significante, devemos rejeitar a hipótese de esfericidade, ou seja, rejeitamos a hipótese de que as variâncias das diferenças entre grupos são iguais. Para o exemplo, os resultados do teste de esfericidade de Mauchly são dados abaixo.
             
   Os resultados do teste mostram que a esfericidade não foi violada (p = 0,188) Podemos, portanto, escrever:

O Teste de Esfericidade de Mauchly indicou que a hipótese de esfericidade não foi violada, c2(2) = 3,343, p = 0,188.


   Você deve ter notado a discrepância entre o resultado do teste de esfericidade de Mauchly, que indica que a esfericidade não foi violada e as grandes diferenças nas variâncias apresentadas na tabela acima (13,9 vs. 17,4 versus 3,1), sugerindo que a hipótese de nulidade deveria ser rejeitada. Mas este é um dos problemas do teste de Mauchly que tende a não rejeitar a hipótese da nulidade quando a amostra é pequena, como mencionado anteriormente.

  Se seus dados não violam a hipótese de esfericidade, que é uma pressuposição para proceder à ANOVA, a estatística F calculada será válida. (Se você estiver usando o programa SPSS, procure os resultados na(s) linha(s) de "esfericidade assumida").

  Quando a hipótese de esfericidade for violada, o que não é incomum, a estatística F tem viés e aumenta a probabilidade de erro tipo I. Para superar esse problema, foram propostas algumas correções.

Veja:
Field, A. Descobrindo a Estatística usando o SPSS.2 ed.Porto Alegre: Artmed,2009.
Sphericity. Disponível em: https://statistics.laerd.com/statistical-guides/sphericity-statistical-guide.php.Acesso em 24 de março de 2020.
Frost, J. Repeated measures designs: benefits and an ANOVA Example. Disponível em: https://statisticsbyjim.com/anova/repeated-measures-designs-benefits-anova-example/ Acesso em 23 de março de 2020.