Tuesday, March 25, 2014

Tamanho da amostra (variável dicotômica)

 

      A inferência só vale para a população de onde foram obtidos os participantes incluídos no trabalho. Por exemplo, para estudar pessoas sadias usam-se, em geral, voluntários sadios recrutados entre estudantes universitários, empregados de empresas, jovens que estão prestando serviço militar, enfermeiros e técnicos de laboratório, em vez de a população em geral. A rigor, os achados de tais estudos só podem ser aplicados à população da qual a amostra foi retirada.

     Mas quantas unidades são necessárias para formar um grupo, ou seja, que tamanho deve ter a amostra? Essa é, possivelmente, a pergunta que mais ouvem os estatísticos. Mas já esta firmando a ideia de que o pesquisador deve considerar o critério estatístico para o cálculo do tamanho da amostra. Basicamente, a amostra deve ser:

 

·       tanto maior quanto maior é a variabilidade;

·       tanto maior quanto menor é a diferença que se quer detectar como significante.

 

         Se um pesquisador quiser estudar o efeito de exercícios físicos sobre a velocidade de corrida, deve comparar resultados obtidos no grupo de participantes submetidos a exercícios físicos periodicamente (grupo tratado, em medicina conhecido como braço ativo) com o grupo de participantes não submetidos a exercícios físicos (grupo controle, em medicina conhecido como braço de não intervenção). Se os participantes dos dois grupos variarem muito em relação às variáveis que afetam a velocidade de corrida (como sexo, idade, sobrepeso), a comparação exigirá grupos muito grandes. Os grupos serão menores se o pesquisador recrutar apenas jovens saudáveis do gênero masculino, com idade entre 18 e 20 anos, com peso normal. Por quê? Porque neste segundo grupo a velocidade de corrida deve variar menos (variância menor).

      A variabilidade é medida pela variância, uma estatística calculada diretamente dos dados. E onde o pesquisador acha os dados? Só existem dois caminhos: o pesquisador pode buscar informações na literatura ou fazer uma amostra piloto. Se o pesquisador tiver uma estimativa da variância que obteve da literatura, precisa ficar atento porque a variabilidade do seu material pode ser maior do que a variabilidade do material usado por outros pesquisadores. Então é mais seguro determinar o tamanho da amostra usando uma amostra piloto. Para isso, o pesquisador toma uma pequena amostra da população que pretende estudar – por exemplo, 20 pessoas – trata da maneira convencional e faz as medidas que pretende fazer na pesquisa em planejamento. Com base nesses dados, é possível ter uma estimativa da variância para calcular o tamanho da amostra. Existem fórmulas para isso.

      Vamos entender agora que a amostra aumenta em função da grandeza da diferença que se quer perceber. Por exemplo, em um estudo sobre a redução da mortalidade de bebês por determinada causa, se o efeito da intervenção for dramático – por exemplo, reduzir a taxa de mortalidade, que era de 80% para 20% – uma amostra relativamente pequena é suficiente. No entanto, se o efeito da intervenção for muito discreto – por exemplo, reduzir a taxa de mortalidade , que era de 80% para 75% – é preciso uma amostra muito maior.[1]

    Desta última afirmativa que é, até certo ponto, intuitiva, é fácil entender que, para comparar o grupo tratado, que recebe uma nova droga, com o grupo controle, que recebe apenas placebo, é razoável usar amostra menor do que a que seria usada se a proposta fosse  comparar um grupo tratado, que recebe uma nova droga, com o controle positivo, que recebe uma droga conhecida. Isso porque se espera maior diferença do grupo que recebeu a droga com o grupo que recebeu placebo, do que com o grupo que recebeu uma droga conhecida (controle positivo). 

    Quando se calcula o tamanho da amostra, é comum adotar – embora não haja qualquer justificativa teórica para isso – nível de significância de 5% e poder de teste de 80%. Isto significa que se admite até 5% de probabilidade de errar ao dizer que os grupos são diferentes e 20% de probabilidade de não detectar uma diferença que realmente existe. Portanto, se o cálculo da amostra foi feito levando em conta um poder de teste de 80%, a conclusão de que não há diferença entre as intervenções provavelmente estará errada em um de cada cinco ensaios.

    Softwares calculam o tamanho da amostra, mas, para fazer o cálculo, o pesquisador precisa fornecer alguns valores, sejam eles da literatura ou de amostras piloto. Além dos softwares, estão disponíveis na internet calculadoras. Existem, também, tabelas, hoje em desuso devido à facilidade de acesso aos softwares. Veja aqui a fórmula de cálculo. 

 
 EXEMPLO

Um pesquisador quer verificar se uma nova intervenção reduz a taxa de mortalidade por determinada causa, que era de 90%, para 25%, conforme indicam pesquisas pré-clínicas. Então a “taxa de sucesso” era de 10% (os que não morriam) e, com a nova intervenção, passa a ser 75%. Para alfa= 5%, Z = 1,96 e para beta = 80%, Z= 0,84. Podemos escrever:

 
São necessários 6 pacientes em cada grupo, para detectar que a nova intervenção reduz a mortalidade (alfa= 5%, beta = 80%).

 

Faça o cálculo em:

https://select-statistics.co.uk/calculators/sample-size-calculator-two-proportions/

      Amostras pequenas têm pouco poder de teste – a menos que o efeito da nova intervenção seja dramático, como no exemplo dado. É, pois, quase certo que alguns tratamentos tenham sido descartados prematuramente pelo fato de terem sido testados em ensaios que, em razão do tamanho reduzido, não poderiam, mesmo, dar respostas conclusivas.[3] Mas hoje os pesquisadores têm cuidado para aumentar o poder do teste. As amostras aumentaram de tamanho, há um uso maior de resultados compostos (composite outcomes) e de resultados substitutos (surrogate outcomes).

 

    Para aumentar os tamanhos das amostras, em alguns países já se faz recrutamento de pacientes por meio da Internet. O NIH (National Institutes of Health), órgão do governo americano, oferece informações sobre ensaios clínicos que estão recrutando participantes, já não estão recrutando participantes ou suspenderam, temporariamente, o recrutamento em todos os Estados Unidos da América (www.clinicaltrials.gov). Outra fonte de ensaios clínicos na Web: www.Center Watch.com.


     O pesquisador também pode conseguir participantes para um ensaio clínico fazendo recrutamento público por meio de cartazes fixados em lugares de bastante trânsito, anúncios em jornais ou em rádios.[4] Esse sistema, não usado no Brasil, é comum em outros países.

                                                                                                VEJA:

[1] Existem fórmulas para determinar o tamanho da amostra. Veja: Cochran, W. G., Sampling techniques; Nova York: Wiley, 1977.

[2] Cochran, W. G. e Cox, GM. Experimental design. Nova York, Wiley, 2ª ed. 1957.

[3] Falando em uma reunião do FDA, o Dr. Robert Temple, diretor do Office of Drug Evaluation, isto é, Departamento de Avaliação de Drogas, órgão subordinado ao FDA, considerou “ridículo” um experimento com sete pacientes por grupo.

[4] A Resolução 251/97 do Conselho Nacional de Saúde, Ministério da Saúde, estabelece, no item V. d, que avisos em meios de comunicação para recrutar participantes de pesquisa precisam ser autorizados pelo Comitê de Ética em Pesquisa.


Saturday, March 15, 2014

GRÁFICO DE CONTROLE: PROPORÇÃO DE NÃO-CONFORMES

    A qualidade das soldas inoxidáveis é avaliada por meio de exames radiográficos. Durante um ano, registrou-se mensalmente o número de tomadas radiográficas realizadas e o número de soldas reprovadas. Os dados registrados e as proporções de soldas reprovadas estão apresentados na tabela apresentada em seguida.

Número de radiografias e de reprovações em soldas inoxidáveis, por mês

    Deve ser feito um gráfico de controle para a proporção de não-conformes, conhecido como gráfico de controle p, para amostras de tamanhos variados. Esse tipo de gráfico permite avaliar se a proporção de itens não-conformes em um conjunto de itens se mantém consistente ao longo do tempo. A figura dada em seguida apresenta o gráfico de controle com limites de controle para cada amostra.

Gráfico de controle p para a proporção de soldas inoxidáveis reprovadas segundo o mês

 

    O gráfico de controle indica que o processo está fora de controle em alguns pontos:

·      A proporção de reprovações radiográficas está fora dos limites de controle em fevereiro (mês 2).

·      Está muito próxima do LSC (Limite Superior de Controle) em abril (mês 4).

·      Está muito próxima do LIC (Limite Inferior de Controle) em agosto (mês 8).

    Além disso, observa-se um deslocamento significativo de abril a agosto. O gráfico sugere uma redução substancial na proporção de reprovações entre junho e dezembro. Essa mudança pode indicar a presença de uma causa especial, como uma intervenção que resultou na melhoria da qualidade do processo.

Com base nisso, foi elaborado um novo gráfico de controle p para o período de junho a dezembro. Conforme apresentado no gráfico abaixo, o processo está "sob controle" durante esse intervalo. 

Gráfico de controle para a proporção de soldas inoxidáveis reprovadas segundo o mês, de junho a dezembro

    A média, considerando todos os pontos, foi ajustada para p = 0,0167 no período de junho a dezembro. Recomenda-se manter o processo sob controle utilizando os limites de controle apresentados na segunda figura.







Saturday, March 08, 2014

Máxima verossimilhança

Os pesquisadores usam dados de amostras para estimar os parâmetros das populações de onde essas amostras foram retiradas. Há vários métodos que produzem bons estimadores, mas vamos abordar aqui um deles: o método de máxima verossimilhança (method of maximum likelihood).

Imagine uma urna com grande quantidade de bolas verdes e amarelas1. Você não sabe qual das cores ocorre com maior frequência, mas sabe que a proporção entre elas só pode ser:

         1. Três bolas verdes para cada bola amarela e, nesse caso, a probabilidade p de alguém tirar uma bola verde dessa urna é ¾.

            2.  Uma bola verde para cada três bolas amarelas e, então, a probabilidade p de alguém tirar uma bola verde dessa urna é ¼. 

Se forem retiradas n bolas da urna sempre com reposição, o número x de bolas verdes que podem ocorrer segue a distribuição binomial. Neste caso, x pode assumir os valores x = 0, 1, 2, …, n com p =¼ ou p = ¾. A função de distribuição da binomial é    

                                         
 
 Você retira n = 3 bolas da urna, com reposição. Podem ocorrer, quando se retiram três bolas dessa urna, zero, 1, 2 ou 3 bolas verdes. Estimar o valor de p fica fácil porque você precisa escolher entre apenas dois valores: p = ¼ ou p = ¾. Como você faz essa escolha?

Veja a Tabela 1, que apresenta as probabilidades associadas à ocorrência de x = 0, 1, 2, ou 3 bolas verdes para n = 3 retiradas, em função dos dois valores possíveis de p.


Tabela 1: Probabilidades associadas à ocorrência de x bolas verdes para n = 3 retiradas, considerando dois valores possíveis de p

 

Valor de p

Nº de bolas verdes na amostra

0

1

2

3

p =¾

1/64

9/64

27/64

27/64

p = ¼

27/64

27/64

9/64

1/64

 

Se não sair bola verde (x = 0), a estimativa p = ¼ seria preferível. Por quê? É mais provável ocorrer x = 0 (nenhuma bola verde) se p = ¼ do que se p = ¾.  Veja a Tabela 1: se p = ¼, a probabilidade de ocorrer x = 0 é 27/64, mas se p=¾, a probabilidade de ocorrer x = 0 é 1/64. Então, você diria:


·  Se sair uma ou nenhuma bola verde (x = 0 ou 1), então p = ¼;

·  Se saírem duas ou três bolas verdes (x = 2 ou 3), então p =¾.


Você estimou p usando o estimador de máxima verossimilhança, isto é, aquele que torna máxima a probabilidade de ocorrer o valor obtido. Mas o exemplo utilizado era propositalmente fácil: p só podia assumir um de dois valores possíveis.

Na distribuição binomial, a estimação por máxima verossimilhança pode ser, às vezes, difícil de aplicar2, embora seja conceitualmente simples. De maneira geral, a estimativa do parâmetro p é obtida pela maior proporção do valor mais registrado. 

Considere, agora, outra situação: um experimento no qual os resultados possíveis são apenas sucessos (S) ou falhas (F). Não é possível observar toda a população, o que significa que o parâmetro nunca será conhecido. Mas você pode observar amostras. Uma amostra poderia resultar em S, S, F, F, S, F.

 Uma abordagem intuitiva para estimar o parâmetro p, que representa a probabilidade de sucesso em um ensaio com apenas dois resultados possíveis, é calcular a proporção de sucessos observados em várias tentativas. No exemplo apresentado (em que o número de observações é propositalmente pequeno para facilitar a exposição), o cálculo seria:

Esta é a estimativa de máxima verossimilhança, porque para n = 6 e x = 3, o valor mais provável para a proporção de sucessos nessa distribuição seja 3/6. Consulte a Tabela 2 para as probabilidades associadas à ocorrência de x sucessos em amostras de tamanho 6.
Tabela 2: Probabilidades associadas à ocorrência de x sucessos em amostras de tamanho n =6

O estimador de máxima verossimilhança para p (pode ser demonstrado matematicamente) é a proporção de sucessos observados em n tentativas.

Referências


1.Mood A. M. e Graybill, F. A. Introduction to the theory of statistics. McGraw. 1963. P178-180.

2.MstatArrayProgrammingLanguage  www.mcardle.wisc.edu/mstat/help/.../Notes-03.html