Tuesday, October 13, 2020

COVID-19-: número efetivo de reprodução

 

Covid-19: Número efetivo de reprodução

covid-19:-número-efetivo-de-reprodução

número básico de reprodução, erradamente referido como taxa básica de contágio, que se indica por R(lê-se R-zero), é o número médio de pessoas infectadas por um único indivíduo infectado introduzido em uma população completamente suscetível. O cálculo de Ré feito por meio de modelos matemáticos.

A primeira estimativa do número básico de reprodução Rpara a Covid-19 foi feita com os dados de 425 casos ocorridos no início do surto na cidade de Wuhan, China, em janeiro de 2020.1 Os cálculos indicaram que um indivíduo infectado introduzido em uma população completamente suscetível é capaz de infectar, em média, 2,2 pessoas (IC 95%: 1,4-3,7). Já um relatório do Imperial College de Londres, publicado em 25 de janeiro de 2020,2 mostrou dados da China para informar que R0 é, em média, 2,6, com uma amplitude de incerteza entre 1,5 a 3,5. Por sua vez, um trabalho publicado pelos Centros de Controle e Prevenção de Doenças (CDC) dos Estados Unidos da América,3 com dados de 140 casos confirmados de Covid-19 ocorridos em janeiro de 2020 na China, quase todos fora da província de Hubei onde se localiza a cidade de Wuhan, em que se iniciou o surto, trouxe uma estimativa de 5,7 (IC: 3,8-8,9) para a mediana de R0.

De qualquer forma, a leitura exaustiva de muitos trabalhos indica ser razoável considerar, por ora, que para a Covid-19, Rvaria entre 2 e 3, ou seja, estima-se que um indivíduo infectado introduzido em uma população completamente suscetível, mesmo que assintomático, é capaz de contagiar de 2 a 3 pessoas. Mas é importante entender que Ré apenas um indicador da capacidade de transmissão de uma doença – não mede a severidade nem a velocidade com que o patógeno se espalha. No entanto, o valor de Ré muito útil porque permite avaliação rápida da situação:

 

  • Se R0< 1: cada infecção existente causa menos do que uma nova infecção. A doença diminuirá e eventualmente desaparecerá
  • Se R0= 1: cada infecção existente causa uma nova infecção. A doença permanecerá viva e estável, mas não haverá um surto ou uma epidemia
  • Se R0> 1: cada infecção existente causa mais de uma nova infecção. A doença será transmitida entre as pessoas e pode haver um surto ou epidemia. 

 

Embora o número básico de reprodução seja referência no início de uma epidemia – e os dados obtidos na China em janeiro de 2020 já apontassem para uma epidemia –, é necessário substituí-lo por outro indicador que avalie o potencial de transmissão da doença ao longo do tempo. Afinal, uma pessoa que tenha a doença e se recupere deve adquirir alguma imunidade; logo, a população deixa de ser composta apenas por suscetíveis. Deve-se então estimar o número efetivo de reprodução.

Por definição, número efetivo de reprodução, erradamente referido como taxa de contágio, que se indica por ou R(lê-se R-t), é o número médio de pessoas infectadas em determinado momento por um indivíduo infectado introduzido em uma população parcialmente imune.

É claro que R0 e Rt estão relacionados. Fazendo s indicar a proporção da população suscetível de contrair a doença no instante t, tem-se que:

Veja um exemplo. Vamos tomar R0 = 2. Se em certo instante t, a proporção de suscetíveis for 70%, então = 0,7. Nesse instante t

 

  A interpretação do valor calculado de Rt é fácil:

  • R> 1: o número de casos da doença está aumentando. Epidemia 
  • Rt  = 1: cada infectado causa uma nova infecção. Endemia
  • R< 1: de um caso. A doença diminuirá e eventualmente acabará.

 

Em relação à Covid-19, qual é o Rt para o Brasil? Fatores biológicos, sociocomportamentais e ambientais, ou seja, tanto o tempo quanto o espaço afetam a disseminação do SARS-CoV-2, o que explica, em parte, a grande variação das estimativas de Rt. No entanto, a variação entre as estimativas também se explica pelos diferentes modelos matemáticos utilizados e pelas pressuposições feitas, as quais, até certo ponto, são subjetivas – e dependem da exatidão dos dados. Ainda sobre o Brasil, as causas de divergência entre os dados referentes à Covid-19 se devem à baixa testagem da população, à subnotificação, à dificuldade de obter informação de sistemas de saúde sobrecarregados, às divergências de critérios e à dubiedade das políticas de saúde.

Mesmo assim, no início de maio de 2020, o Imperial College de Londres, que levanta estatísticas da disseminação da Covid-19 para muitos países, considerou o Brasil epicentro da Covid-19 no mundo.4 Estimou o número efetivo de reprodução da doença para os estados do Brasil e encontrou valores abaixo das estimativas iniciais, isto é, menores do que 2, mas maiores do que 1, indicando que o número de casos da doença continuaria aumentando. No entanto, estimativas de Rt para os diferentes estados do Brasil feitas a 25 de julho5 indicam maior variação: há valores muito altos (1,95) para alguns estados, por exemplo Goiás, mas menores (0,73) em outros, como no Amapá. De qualquer modo, o interesse de empresas farmacêuticas em fazer testes de vacinas no Brasil evidencia o feeling dos pesquisadores de que nosso país, tal como África do Sul, Índia e Estados Unidos da América, tem grande incidência da Covid-19.

De fato, o Brasil enfrenta uma epidemia que continua a se espalhar e a crescer. Há uma busca intensa de tratamentos, mas nada ainda se revelou realmente eficiente. Diversas vacinas já estão em fase III de teste, mas dificilmente estarão disponíveis para a vacinação em massa da população antes de meados de 2021. A contenção da comunidade está sendo feita de forma muito hesitante, o que explica a baixa adesão da população – principalmente a mais pobre, que precisa trabalhar para “ganhar o pão de cada dia” e não tem a percepção do risco da doença. Ninguém sabe o que acontecerá no futuro, mas há uma certeza: tudo isso será debatido por anos. 

 

Referências

  1. Qun, Li et alii. Early transmission dynamics in Wuhan, China, of novel coronavirus-infected pneumonia. New Eng. J. Med. 382:1199-1207. 2020. doi: 10.1056.

  2. Imai, N. et alii.  Report 3: Transmissibility of 2019-nCoV. Imperial College London.COVID-19 Response Team.5th January 2020 DOI: https://doi.org/10.25561/77148

  3. Sanche, S. et alii. High contagiousness and rapid spread of severe acute respiratory syndrome coronavirus 2. Emerg Infect Dis. 26: 7.July 2020 https://doi.org/10.3201/eid2607.200282

  4. Mellan, T. et alii.  Report 21: Estimating COVID-19 cases and reproduction number in Brazil Imperial College COVID-19 Response Team. 8thMay 2020 DOI: https://doi.org/10.25561/78872.

  5. Perone, C.S. COVID-19: Time varying reproduction numbers estimation for Brazil. 25/July. https://perone.github.io/covid19analysis/brazil_r0.html

COVID-19 e imunidade de rebanho

 

COVID-19 e imunidade de rebanho

COVID-19 e imunidade de rebanho

Denomina-se imunidade de rebanho quando a proporção de pessoas imunes a determinada doença infecciosa se torna grande o suficiente para fazer com que sua disseminação diminua na comunidade. Quanto maior for o número de pessoas imunes ou imunizadas, menor será a probabilidade de uma pessoa suscetível se infectar. Nesse caso, embora a doença continue na comunidade, sua propagação será cada vez mais lenta porque a cadeia de infecção foi, de certa maneira, quebrada.

 

Convém lembrar que o Dicionário de Epidemiologia, Saúde Pública e Zoonoses da USP1 registra o termo “imunidade de grupo”, em vez de “imunidade de rebanho”. Outros autores preferem as expressões “imunidade comunitária”, “imunidade da comunidade” ou “imunidade coletiva”. No entanto, “imunidade de rebanho” é a tradução literal da expressão inglesa herd immunity, amplamente utilizada em todo o mundo.

 

Para se chegar a essa imunidade de rebanho, quantas pessoas precisam estar imunes em uma comunidade? O número básico de reprodução, que se indica por R(lê-se R-zero), é o número médio de pessoas infectadas por um único indivíduo infectado introduzido em uma população completamente suscetível, ou seja, na qual ninguém é imune ou já foi infectado.

 

Por exemplo, quando R0 = 2 em uma comunidade totalmente suscetível, um indivíduo infecta em média 2 pessoas, e essas 2 infectam 4, que infectam 8 e assim por diante, em progressão geométrica (Figura 1).

 

Figura 1 Progressão do número de infectados quando R0 = 2. Em verde, pessoas suscetíveis; em vermelho, pessoas infectadas.

 

número efetivo de reprodução, que se indica por ou Rt (lê-se R-t), é o número médio de pessoas infectadas no momento por um indivíduo infectado introduzido em uma população parcialmente imune. 

R0 estão, evidentemente, relacionados. Indicando a proporção de indivíduos imunes na população pela variável s, tem-se que:

 R = s R0  

 

Por exemplo, se R0 = 2 e um indivíduo infectado for introduzido em uma comunidade na qual metade da população seja imune (Figura 2), o valor de poderá ser assim obtido:

R = s R0 = 0,5 × 2 = 1

 

É importante notar o seguinte:

  • Quando > 1, o número de novos casos da doença está aumentando (epidemia)
  • Quando = 1, cada infectado causa uma nova infecção (endemia)
  • Quando < 1, o número de novos casos da doença está diminuindo e eventualmente chegará a zero.

 

Figura 2 Progressão do número de infectados quando R0 = 2 e 50% da população é imune. Em verde, pessoas suscetíveis; em vermelho, pessoas infectadas; em azul, pessoas imunes.

 

A disseminação de uma doença infecciosa diminui quando R assume valores abaixo de 1, ou seja, a imunidade de rebanho ocorre quando < 1. Como R = s R0, a imunidade de rebanho acontece quando s R0 < 1. Reorganizando

Dado que a proporção de pessoas suscetíveis na população é s, a proporção de não suscetíveis, ou seja, a proporção de imunes é (1 – s). Então, para que ocorra a imunidade de rebanho, é preciso que:

 

A primeira estimativa de R0 para a COVID-19 foi feita com os dados de 425 casos ocorridos no início do surto, em janeiro de 2020, na cidade de Wuhan, na China.2 Os cálculos indicaram que um indivíduo infectado introduzido em uma população completamente suscetível é capaz de infectar em média 2,2 pessoas (intervalo de confiança [IC] 95%: 1,4 a 3,7). Com base nessas estimativas iniciais, é razoável considerar, por precaução, R0 = 3. Então, a imunidade de rebanho será alcançada quando:

 

ou seja, quando cerca de 70% da população estiver imune. No entanto, considerando R0 = 2, valor que está dentro do IC para a média citada, a imunidade de rebanho seria alcançada quando 50% da população estivesse imune. 

 

A porcentagem de pessoas que precisam ter imunidade para desacelerar ou interromper com segurança uma doença infecciosa é chamada de limiar de imunidade de rebanho, em geral indicada pela sigla HIT (do inglês, herd immunity threshold). As estimativas de HIT são, por ora, muito fluidas. De qualquer modo, para os dois exemplos mencionados, em que R0 = 3 e R0 = 2, os valores de HIT são, respectivamente, 67% (ou cerca de 70%) e 50%.

 

A situação é grave. Não há tratamento específico para a COVID-19, doença que pode levar a óbito ou deixar sequelas ainda não identificadas. Também não há vacina. É verdade que os cientistas estão trabalhando com afinco para desenvolver uma vacina segura e eficaz para o SARS-CoV-2, mas isso leva tempo. É preciso concluir os testes com humanos e analisar os resultados. Se tudo der certo, ainda é preciso obter a aprovação dos órgãos governamentais competentes. Só depois disso se pode dar início a um processo de produção em massa, capaz de cobrir com segurança a população, e nesse momento a distribuição da vacina será o novo desafio. Até lá, o que se pode fazer?

 

Na melhor das hipóteses, enquanto a vacina não está disponível, haveria um esforço conjunto de toda a população, que tomaria cuidados redobrados com a higiene, fazendo uso correto de máscaras faciais e mantendo distanciamento físico contínuo por um período prolongado. Nesse caso, os níveis atuais de infecção poderiam ser mantidos ou, eventualmente, reduzidos. Porém, precisaríamos de liderança com moral suficiente para não minimizar o que está por vir.3 

 

Ironicamente, o confinamento, o distanciamento físico4 e o lockdown significam que boa parte da população não está ganhando imunidade, porque muitos não foram infectados; é por isso que o número de casos da doença aumenta quando o bloqueio é liberado. Uma alternativa seria implementar bloqueios intermitentes para manter os sucessivos picos da epidemia abaixo da capacidade crítica dos sistemas de saúde.

 

E o que se pode pensar como a pior hipótese? Sem a mão firme do governo federal em políticas públicas para retardar a disseminação do SARS-CoV-2 e, por conseguinte, sem a adesão da população a essas políticas, o vírus continuará infectando pessoas, porque a maioria da população ainda não foi infectada. Enquanto a vacina (há mais de 100 em desenvolvimento!) não chegar, só podemos esperar pela imunidade de rebanho – o que pode significar milhões de infectados e milhares de mortos. E não dá para duvidar dessa possibilidade.

 

Referências bibliográficas

  1. Dicionário de Epidemiologia, Saúde Pública e Zoonoses da USP. Disponível em: https://edisciplinas.usp.br/mod/glossary/view.php?id=895978.
  2. Zhao S, Lin Q, Ran J et al. Preliminary estimation of the basic reproduction number of novel coronavirus (2019-nCoV) in China, from 2019 to 2020: a data-driven analysis in the early phase of the outbreak. Int J Infect Dis. 2020; 92:214-217.
  3. Regalado A. What is herd immunity and can it stop the coronavirus? Disponível em: www.technologyreview.com/2020/03/17/905244/what-is-herd-immunity-and-can-it-stop-the-coronavirus.
  4. Osterholm M. [Entrevista] COVID-19: straight answers from top epidemiologists who predicted the pandemic. Disponível em: www.bluezones.com/2020/06/covid-19-straight-answers-from-top-epidemiologist-who-predicted-the-pandemic.

 

COVID-19.Número básico de reprodução

 

Número básico de reprodução R0: Entendendo um modelo epidemiológico

Número básico de reprodução R0: Entendendo um modelo epidemiológico

Número básico de reprodução R0 

 

Nos últimos meses, o número de reprodução da COVID-19 dominou a mídia com persistência. Esse conceito é utilizado por cientistas e tomadores de decisão para explicar e justificar políticas públicas de controle para a pandemia da COVID-19. Mas, para entender o número de reprodução de uma infecção específica, é preciso entender o modelo epidêmico que fundamentou seu cálculo.

 

Há vários tipos de modelos, mas o SIR é bastante utilizado porque é simples – embora um tanto artificial. Para aplicar o modelo, imagine uma população de tamanho N composta por três categorias de indivíduos: os suscetíveis, ou seja, os não infectados, livres da doença, indicados por S; os infectados e infecciosos, indicados por I ; e os removidos, ou seja, recuperados ou mortos, indicados por R. Então:

 

Nessa população, a proporção de suscetíveis em dado instante t será s = S / N; de infectados i = I / N; de removidos r = R / N. Logo:

 

Há varios parâmetros a serem considerados no modelo SIR: primeiro, é preciso conhecer a transmissibilidade da doença, que indicaremos pela letra grega  (lê-se tau). Depois, é preciso conhecer o número médio de contatos entre infectados e susceptíveis, que indicaremos por    . Podemos então definir a taxa de transmissão da doença:

 

duração esperada do período infeccioso é indicada pela letra d. A taxa de remoção, que indicaremos por γ (lê-se gama), é o inverso da duração da doença (quanto mais prolongado o período infeccioso, mais demorada é a remoção de Infectados para Removidos).

Agora, fica fácil entender que à medida que o tempo passa, o número de susceptíveis diminui e o número de infectados aumenta, mas a velocidade de mudança de categoria depende da transmissibilidade da doença. O número de infectados diminui ao longo do tempo com a mudança deles para a categoria dos removidos e a variação dos removidos no tempo depende tanto da taxa de remoção como do número de infectados. O modelo SIR é, então, definido por:                              

 

 

Uma epidemia ocorre se o número de infectados aumenta, isto é, se  ou seja:

 

No início de uma epidemia, isto é, no instante zero, todos são suscetíveis à doença, com exceção do caso-zero, o indivíduo que trouxe a doença à população. Então s (a proporção de suscetíveis) é praticamente 1. Fazendo s = 1, tem-se que

 

Lembrando que   , tem-se o valor do número básico de reprodução R0 (que se lê R-zero):

 

Por definição, o número básico de reprodução, R0, é o número médio de pessoas que será contagiado quando um indivíduo infectado é introduzido em uma população completamente suscetível, ou seja, onde ninguém é imune ou já foi infectado. R0 é um número e não uma taxa, porque toda taxa tem, necessariamente, uma referência de tempo no denominador.

Podemos entender Rolhando o esquema dado em seguida

 

 

O modelo SIR é artificial porque exige algumas pressuposições não realistas. Assim, o tamanho da população precisa ser constante, sem variações nas taxas demográficas. Obviamente, para grandes cidades, pequenas variações são aceitáveis. As taxas (como, por exemplo, as taxas de transmissão e de remoção) devem ser constantes. Ainda, a população deve ser homogênea, isto é, um indivíduo infectado tem a mesma probabilidade de entrar em contato com qualquer outro indivíduo suscetível e tem a mesma probabilidade de infectá-lo.

 

De qualquer forma, o número básico de reprodução para COVID-19 varia enormemente porque depende do país, da cultura, do modelo epidêmico usado para o cálculo, do estágio do surto. Saber o valor exato de R0 é importante, mas desafiador, devido aos dados limitados e aos relatórios incompletos. Mas esse número (referido impropriamente como taxa) – apesar da falta de clareza – ganhou espaço na mídia porque é uma métrica muito útil. 

 

Tuesday, August 04, 2020

Médias móveis: cálculo

Imagine uma série temporal como, por exemplo, o número de óbitos por dia devido à COVID-19. Sejam yt os valores da variável em análise. A média móvel simples de k termos é obtida somando k termos consecutivos da série e dividindo o resultado por k. Então, dada a série de valores yt  onde t = 1, 2, ..., n, as médias móveis simples de k termos ou, como também se diz, as médias móveis simples de ordem k  dessa série são dadas por:

Exemplo

Você quer calcular médias móveis de 3 termos da série 24, 25, 28, 29, 30. Então, calcule a média dos três primeiros termos (24, 25, 28), que será a primeira média móvel (25,67). Depois, descarte o primeiro termo usado para calcular essa primeira média móvel e calcule a média dos três seguintes (25, 28, 29), que será a segunda média móvel (27,33). Descarte o primeiro termo usado para calcular essa segunda média móvel e calcule a média dos três seguintes (28, 29,30), que será a última da série (29,00).

Você agora resolveu calcular médias móveis de 4 termos. O procedimento é o mesmo, lembrando apenas que cada média é calculada com quatro termos.

 

As médias móveis podem ser alocadas junto ao último número dos k números com que foi calculada. No exemplo, você calculou médias móveis de ordem k = 3. Então você escreveu a primeira média móvel (25,67) junto ao terceiro número (28) dos k = 3 números com que foi calculada. A segunda média móvel (27,33) você escreveu junto ao quarto valor da série, ou seja, junto ao terceiro número dos k = 3 números com que foi calculada (29) e assim fez com a terceira média móvel.

No entanto, as médias móveis são, em geral, centralizadas, isto é, são colocadas no centro do intervalo de valores usados para seu cálculo. Para apresentar médias móveis centralizadas, é importante saber se o número k de termos da média móvel é par ou ímpar.

Se a média móvel simples for de ordem ímpar, isto é, se cada média móvel for calculada com k = 2m + 1 termos, em que m é um número positivo, fica fácil centralizar as médias móveis. Por exemplo, para k = 3, a primeira média móvel, calculada com os três primeiros termos da série, é colocada junto ao segundo valor da série, porque o centro de 1º, 2º e 3º fica no segundo termo. A segunda média móvel é colocada junto ao terceiro valor da série, porque o centro de 2º, 3º e 4º fica no terceiro termo e assim por diante.

                                               Exemplo

São dados os primeiros termos de uma série temporal: 24, 25, 28, 29, 30. Ache as médias móveis simples de 3 termos e as centralize. Como você já calculou as médias móveis de 3 termos no exemplo anterior, vamos apenas escrever as médias móveis centralizadas.

Note que não podem ser obtidos os valores da média móvel para o primeiro e o último período. Os valores que faltam são indicados por asterisco (*).

São bastante comuns médias móveis com número ímpar de termos como 3, 5, 7, etc. porque, nesses casos, os valores de média móvel ocupam posições centrais no tempo. Há observações de ambos os lados de cada média móvel, que fica no meio.  Há simetria. 

Não veremos nesta postagem o cálculo de médias móveis com número par de termos, isto é, com k = 2m termos, em que m é um número positivo. Isso será assunto de outra postagem. Mas vamos ver aqui por meio de um exemplo o fato de que, quanto maior for o valor de k, mais suavizada será a curva.

É dado o número de carros vendidos por mês em cidade. Ache as médias móveis de ordem 3, de ordem 5, de ordem 7. Veja que, com as médias móveis de ordem 7, a curva é mais suave.





Friday, July 24, 2020

MÉDIA MÓVEL

Denomina-se série temporal ao conjunto de observações de uma variável ao longo do tempo. São exemplos de série temporal: dados meteorológicos de uma cidade coletados diariamente, vendas mensais de um produto em determinado hipermercado ao longo de anos, gráficos de controle diários de um processo produtivo em uma empresa no mês, dados demográficos de um país em vários censos. 

A suposição básica no estudo das séries temporais é a de que o tempo é um fator que modifica os valores da variável de interesse. Para observar o efeito do tempo em uma série temporal, desenha-se um gráfico de linhas, também chamado gráfico de rie temporal. Os dados observados referem-se à varvel dependente, variável resposta ou desfecho e o tempo é a varvel independente, variável explanatória ou fator. 

Veja os dados apresentados na Tabela 1 e na Figura 1. No gráfico, os pontos consecutivos ligados por linhas ajudam a visualizar as mudanças da varvel no período em estudo. Assim, a Figura 1 mostra, nitidamente, o crescimento da população brasileira entre 1940 e 2010. Nesse período, a população mais do que quadruplicou.

Tabela 1 - População residente no Brasil, segundo o ano do Censo Demográfico


Figura 1 - População residente no Brasil, segundo o ano do Censo Demográfico

Nem sempre, porém, se observam gráficos de séries temporais com um padrão tão facilmente visível de tendência, como o visto acima. É clássico buscar quatro padrões de variação nas séries temporais:


·      Tendência, que é o comportamento de longo prazo da série, como é o caso de crescimento demográfico, mostrado na Figura 1.

·      Variação cíclica, ou seja, flutuação nos valores da variável que ocorre com certa periodicidade, mas em períodos longos, acima de um ano; é o caso das mudanças no estado médio da atmosfera (como as causadas por variações na atividade solar).

·      Variação sazonal, que é a flutuação nos valores da variável com duração menor do que um ano, mas se repetem geralmente em função das estações do ano.

·      Variação irregular, causada por  fatos fortuitos e inesperados como, por exemplo, catástrofes naturais.


Os componentes citados não estão sempre presentes em uma série temporal. Veja alguns exemplos.

·         A série da Figura 1 apresenta apenas tendência, isto é, comportamento crescente no longo prazo (sete décadas).

·         A série da Figura 2 apresenta apenas variações irregulares, mas de processo sob controle, isto é, pontos dentro dos limites de controle (LSC e LIC.).

Figura 2 - Gráfico de controle típico

Fonte: Vieira, S. Estatística para a Qualidade. 3 ed. Rio de Janeiro: Elsevier, 20114

·         A série da Figura 3 apresenta tendência, variação sazonal e variações irregulares: o comportamento de longo prazo da série é pouco crescente, há variação sazonal (meses chuvosos e meses de seca), mas há flutuações irregulares dentro dos períodos de um ano, em todos os anos.

Figura 3 - Alturas pluviométricas anuais, em mm

 

Fonte: Gasparetto, S. C. Comparação entre métodos de imputação de dados em diferentes intensidades amostrais na série homogênea de precipitação pluvial da ESALQ. https://teses.usp.br/teses/disponiveis/11/11134/tde-23082019-150302/publico/

·         A série da Figura 4 apresenta flutuações sazonais e variações irregulares; pequena tendência de queda.

Figura 4 – Preços, em reais, da saca de 60kg de milho no Estado de São Paulo, 2012-2014

Fonte: Souza, C.C et alii. Análise do padrão sazonal e da variação dos preços do milho aos produtores do estado de São Paulo, Brasil. Rev. de Ciências Agrárias vol.40 no.2  Lisboa jun. 2017. http://dx.doi.org/10.19084/RCA16110 


A análise de séries temporais deve identificar padrões de variação da variável de interesse. A observação do comportamento passado ajuda previsões para o futuro, facilitando a tomada de decisões. Uma das maneiras de estudar a tendência de uma série temporal é por meio de médias móveis, que reduzem o impacto de picos e quedas acentuados. Elas servem para "suavizar" dados cronológicos ou, em outras palavras, promovem o “alisamento” para que a curva de tendência fique mais visível.


Médias móveis

Vamos ver aqui como se calculam médias móveis. Imagine uma série temporal como, por exemplo, o número de óbitos por dia devido à COVID-19. Sejam yt os valores da variável. A média móvel simples de k termos é obtida somando k termos consecutivos da série e dividindo o resultado por k. Então, dada a série de valores yt  em que t = 1, 2, ..., n, as médias móveis dessa série são dados por:


Como exemplo para aprender a calcular uma média móvel simples, veja os seguintes dados, que se referem aos dias de uma semana:

 11; 12; 13; 14; 15; 16; 17. 


Vamos calcular médias móveis de cinco termos (k =5). A primeira média móvel abrange os primeiros cinco dias. A segunda média móvel descarta o primeiro dia (11) e adiciona um novo dado da sequência (16). A terceira média móvel continua descartando o primeiro dado da média móvel anterior (12) e adicionando o novo dado (17).


No exemplo acima, os dados aumentam gradualmente de 11 para 17 em um total de sete dias. As médias móveis simples aumentam de 13 para 15. 

As médias móveis simples serão indicadas por MMi.  Para indicar que calculamos uma média móvel de ordem k, escrevemos k-MM.

Veja outro exemplo. Com os dados da série temporal apresentada em seguida, calcule as médias móveis simples de três termos. Faça o gráfico.

25, 85, 65, 45, 95, 75, 15, 35

Cálculo de 3-MM

MM3 = (25+85+65)/3 = 58,33

MM4 = (85+65+45)/3 = 65,00

MM5 = (65+45+95)/3 = 68,33

MM6 = (45+95+75)/3 = 71,67

MM7 = (95+75+15)/3 = 61,67

MM8 = (75 +15+35)/3 = 41,67

 Gráfico 3-MM