Sunday, March 27, 2016

Soma de desvios padrões????



Uma doutoranda da Unicamp que não conheço me apontou gentilmente, por e-mail, o que ela considerou um “pequeno erro de cálculo” em meu livro, Análise de variância: o resultado do coeficiente de variação (CV), que consta na página 47, estaria errado. Claro, busquei rapidamente o texto e me pus na frente do computador.

 

Mas vamos ao que está no livro: é dado um exemplo fictício de experimento com dois tratamentos, A e B, e cinco repetições por tratamento. Os dados são poucos porque têm a finalidade única de mostrar como se fazem os cálculos. Veja a tabela de dados e a tabela de análise de variância.


Dados obtidos em um experimento


Tratamento

A

B

10

25

11

26

15

28

13

24

16

27

Tabela de análise de variância


Em qualidade, não é usual proceder a uma análise de variância. Calculam-se médias, desvios padrões, gráficos de controle. Então a doutoranda, que é da área de qualidade, calculou, como sempre fez, as médias e os desvios padrões do exemplo dado. Obteve:

 

Médias e desvios padrões segundo os tratamentos



Está tudo bem até aqui. Mas depois, estudando no meu livro Análise de variância, a doutoranda leu: Pode existir interesse em relacionar o desvio padrão com a média, para se ter ideia da grandeza da dispersão em relação à grandeza da média. Por definição, coeficiente de variação, que se indica por CV, é a razão entre o desvio padrão e a média dos dados, isto é

Havia, também, esta informação: na análise de variância, o desvio padrão é dado pela raiz quadrada do quadrado médio do resíduo. Reconheço que o que está escrito no livro não é suficiente para esclarecer um aluno. De qualquer forma, ali está apresentado o valor correto para do coeficiente de variação para o exemplo dado acima:

 

Mas vamos aos fatos. A análise de variância não é técnica comum entre pesquisadores da área de qualidade. Então a doutoranda NÃO tinha o cálculo do quadrado médio do resíduo (QMR). O coeficiente de variação foi calculado fazendo a média das médias e a média dos desvios padrões, com base nos resultados apresentados na tabela de médias e desvios padrões. Está errado:



 Para explicar isso, resolvi recorrer ao Dr. Math (Doctor Schwa, The Math Forum http://mathforum.org/dr.math/) e apresentar um pouco de matemática.

 

 

       Vamos voltar ao coeficiente de variação. Na tabela apresentada anteriormente, de médias e desvios padrões, deveriam ter sido apresentadas as variâncias de cada grupo, além de médias e os desvios padrões.


Médias, variâncias e desvios padrões segundo os tratamentos



 

Demorei muito para entender que a fórmula, como está na definição dada em meu livro, Análise de variância, e é a comumente apresentada nos livros didáticos de estatística, pode levar a erro. No livro está escrito:

 

Por definição, coeficiente de variação, que se indica por CV, é a razão entre o desvio padrão e a média dos dados, isto é

A fórmula está correta desde que em análise haja uma única variável em um só grupo. Nos experimentos ou ensaios completamente randômicos, uma variável é observada em k grupos. Se for calculada a média e o desvio padrão de cada grupo, o coeficiente de variação (geral) será dado pela divisão da raiz quadrada do quadrado médio do resíduo da análise de variância pela média geral. O quadrado médio do resíduo (QMR), desde que todos os grupos tenham r repetições, é

em que SQR é a soma de quadrados do resíduo, dada por

 

Verifique que

 

 é a variância do i-ésimo tratamento e o QMR é a média das variâncias de cada grupo.

 


     Procure o livro em http://www.saraiva.com.br/

                 analise-de-variancia-anova-1100479.html


Thursday, March 24, 2016

What is research methodology?


Broadly speaking, research can be done according to two methods identified as:

     a) Qualitative research

     b) Quantitative research

 

Qualitative research aims a better understanding of people´s behavior, their attitudes, their beliefs and their fears. Its goal is to gather information the way people understand the world in which we live and to the meaning they attribute to their own experiences. Data are collected by means of interviews, focus groups, observations, analysis of documents and speeches.

 

By the other hand, typical objective of quantitative research is to count, organize and measure in order to describe, explain and predict. Quantitative research gathers data in numerical form for estimating averages, standard errors, confidence levels and margins of errors, test hypothesis, find patterns of relations between variables.

 

Qualitative research can be done involving only a few people in order, for instance, to collect words or expressions that were used to describe feelings experienced in a given situation – such as a huge fire. Following this, a quantitative research should be done by organizing a questionnaire with the words or expressions collected during the qualitative research. These would then be applied to a large number of respondents to compare the statistical distribution of the feelings expressed by different groups, considering age, sex, social class.

 

As another example, the researcher who wants to study the subjective experience of a mental illness would have to interview several patients and make a detailed analysis of the facts. But to describe the frequency and distribution of the illness in the population, the quantitative researcher must collect data of a representative sample of the population, which means participants selected at random. It follows that the two research methods are neither opposed nor opponents; on the contrary, they are complementary.

 

In some fields, researchers get involved in actual battles in order to determine the “best” research method; but the right thing to do would be to study the strategies in parallel. Qualitative research, as the less structured method, is required when facing lesser known realities, but in fields where knowledge is deeper, quantitative research is indicated. Therefore, qualitative research should precede quantitative research.

 

But researchers are right when they say that there is no point in arguing over which of the two is the most adequate research method. A researcher chooses the method according to the question he/she intends to answer and completes every job always bearing in mind that a quantitative study may raise questions that need to be dealt with by the qualitative method, and vice-versa. Competence of the researcher and a well designed study count most.

 

Historically, qualitative researches are rejected in health fields of study because extremely small samples sizes; they are not repeatable neither reproducible, so there is a risk of bias. For this reason they are considered by some as soft science. Anyway, neither quantitative nor qualitative research method can provide the truth about everything.

 

Let us give some examples where both methods qualitative and quantitative, can be used. Usually, research on voter´s intentions is done using the quantitative method. The researcher asks a large number of people the following question, “If the election was today, who would you vote for?”The percentage of votes for each candidate is then calculated, with margins of error at a level of significance. Then the research can declare quite confidently, “If the election was today, X would probably win.

 

On the occasion of election previews, the importance of qualitative research is much commented upon. In this kind of research, the interviewer would ask people, for example, “What qualities should a President of the Republic have?” or “What are the country´s main problems?” and afterwards he or she would analyse the answers.

 

As another example: in order to find the answer to the query “Taking into account sex and age groups, what proportion of smokers has already attempted to stop smoking?” quantitative research would be needed. The researcher invites people to reply to a questionnaire. Then he/she calculates the percentages per sex and age group and makes generalizations within a certain margin of error. This is quantitative research.

 

But to find out what prevents people from giving up smoking, qualitative research is required. The researcher would first ask the question “Why don´t you stop smoking?” Then, he/she would have a long conversation with each member of a small group trying to bring up reasons and opinions. Further analysis of data is fundamental.

 

As a final example, to find out what people understand by the legalization of drugs, the researcher would engage in qualitative research, interviewing a few individuals (about 20).To discover the percentage of individuals who are favorable to the legalization of drugs, and the distribution of this percentage by sex, age group, education level, social and economic levels, and region, the researcher would engage in quantitative research, interviewing many people (around 2000)

 




Wednesday, March 23, 2016

Tamanho da amostra para comparar duas proporções

Uma mestranda de odontologia que não conheço pediu por e-mail que eu lhe desse uma “pequena ajuda” em seu trabalho: responder à famosa questão “qual deve ser o tamanho da amostra?” Lembrei a ela de que não seria difícil calcular esse tamanho, se me fossem dadas algumas informações que começariam, evidentemente, com o propósito do trabalho. Depois de algumas idas e vindas, chegamos ao texto abaixo, editado por mim, que sou professora de estatística (e desconheço o jargão da área de odontologia).

 

Para comparar a efetividade de dois métodos indicados para clareamento dental, será feito um ensaio clínico usando dois grupos de pacientes: um grupo será submetido a um novo método, mas já testado, que chamaremos de N. O outro grupo será submetido a um método convencional, que chamaremos de C. Supõe-se que esses métodos possam ter efetividade diferente. O desfecho será uma variável dicotômica, isto é, sim ou não para cada participante da pesquisa, indicando se houve ou não clareamento nos dentes. A avaliação será feita por profissional, fazendo uma observação no início e outra após o clareamento. Serão submetidos a essa avaliação n pacientes que passarem pelos critérios de elegibilidade e que serão designados para o método A ou para o método B por processo aleatório.

 

Informei à mestranda que existe uma fórmula para calcular o tamanho de uma amostra para comparar dois métodos quando a variável é dicotômica. E expliquei mais claramente:

 

Para comparar duas proporções, o tamanho da amostra para cada grupo (n) é dado por:

 


em que

n é o tamanho de cada grupo, sendo os grupos de igual tamanho

Z = valor de Z correspondente ao nível de confiança desejado (por exemplo, 1,96 para 95% de confiança)

p1 = proporção estimada para o novo método (N)

p1 = proporção estimada para o método convencional (C)

 = diferença mínima detectável entre proporções

 

A resposta chegou em tom irritado: “eu não quero fórmulas de livros, quero a resposta para o meu problema”. Então perguntei: “qual seria a porcentagem de pessoas em que você espera “ver” clareamento quando usar o método C? E no método N?” E a resposta foi aquela que já ouvi muitas vezes, em se tratando de calcular tamanho de amostras: “se eu soubesse, não faria a pesquisa”. Pois é, e a literatura da área?

 

Mas nessa situação, ou se improvisa ou não se responde. Então, improvisei: considerei o nível de confiança mais comum nos trabalhos publicados: 95%. E os valores de p1 e p2? Como nenhuma estimativa específica estava disponível, considerei que as duas proporções deveriam ser maiores que 0,5. Um palpite, pouco otimista para um dentista clínico como a mestranda, mas que mesmo assim sugeri: p1 = 0,7 e p2 = 0,6 e, portanto, d = p1 p2 = 0,1 seria a diferença esperada entre as proporções Fazendo os cálculos:

 

p1=0,7 (novo tratamento)

p2=0,6 (convencional)

• d=0,1

Z=1,96



De acordo com os cálculos feitos, são necessários cerca de 173 participantes por grupo para detectar uma diferença de 10% com 95% de confiança, quando se pressupõe proporções como 0,7 e 0,6. Obviamente, esta proposta foi rejeitada. Não se faz um enaio clínico, para uma tese de mestrado, com cerca de 350 participantes. E a orientadora achou que as pressuposições feitas, p1 = 0,7 e p2 = 0,6, estavam absurdamente abaixo das expectativas ou mesmo realidade.

 

Procurei então alguma informação para a taxa de sucesso de clareamento dentário. Achei, em um site americano1 a seguinte frase: “Generally, tooth whitening is successful in at least 90 percent of patients.” Não é irrealista supor que o tratamento convencional tenha uma taxa de sucesso de 0,9, especialmente se for um tratamento bem estabelecido e eficaz. Aliás, ensaios clínicos são projetados para melhorar tratamentos que já têm altas taxas de sucesso. No entanto, quando a taxa de sucesso da linha de base é muito alta, detectar melhorias requer tamanhos de amostra maiores porque a margem para melhoria é muito pequena. Mas veja os cálculos para p1 = 0,95 e p2 = 0,90.

p1 =0,95 (novo tratamento)
p2=0,90 (convencional)
d=0,05
Z=1,96

 

 

De acordo com os cálculos feitos, são necessários cerca de 212 participantes por grupo para detectar uma diferença de 5% com 95% de confiança, quando se pressupõe proporções como 0,95 e 0,90.

 

Mas a mestranda me informou que sua orientadora dispensou minhas considerações. Como o desperdício sempre me aborrece, não vou jogar no lixo o que fiz. Talvez alguém aproveite. De qualquer forma, não há como caber no orçamento de mestrado a coleta de uma amostra para detectar diferenças muito pequenas entre dois tratamentos com altas taxas de sucesso.


Importante: não foi estipulado aqui o valor do poder do teste. 


Referência

                              1.     The risks of teeth whitening - Delta Dental

                          https://www.deltadentalins.com/.../bleaching_risks.ht...

                      Veja algumas calculadoras para tamanho de amostras:

 

        

 

 

 

 

 

 

 

 

 

 

 

 

Sunday, March 20, 2016

NNH número necessário para causar dano


A ANVISA pede que, na descrição dos resultados de um ensaio clínico, seja dada uma estimativa do NNH, com o respectivo intervalo de confiança, para cada intervenção.

 

NNH, isto é, número necessário para causar dano (number needed to harm) é o número de pacientes com determinada patologia e em determinadas condições, tratados até que um deles tenha um desfecho ruim como, por exemplo, complicações terapêuticas1.

 

Se uma droga indicada para determinada patologia tem NNH = 100, significa que, em média, 100 pacientes devem ser tratados (nenhum no grupo controle) para que um deles tenha complicações.

 

Para calcular o NNH, existe uma fórmula2. Seja rt a proporção de danos ocorridos no grupo tratado e rc a proporção de danos ocorridos no grupo controle. A fórmula para calcular o número necessário para causar dano é

EXEMPLO

Imagine que, para verificar se uma nova intervenção aumenta o risco de óbito após o diagnóstico de câncer no pulmão estágio III, foi feito um ensaio clínico randomizado com 450 pacientes: 250 foram designados para o controle e 200 para a nova intervenção. No período de tempo estudado, morreram 120 pacientes do grupo controle e 120 pacientes do grupo submetido à nova intervenção como mostrado na tabela abaixo.

Sobrevida, óbitos e proporções de mortes nos dois grupos

Grupo

Desfecho

Total

Proporção (morte)

Sobrevida

Morte

Controle

130

120

250

rc = 0,48

Tratado

80

120

200

rt = 0,60

 

NNH = 8,3 significa que, em média, 8,3 pacientes teriam que receber a nova intervenção (em lugar de ser do grupo controle) para que se pudesse registrar, no período de tempo estipulado, o óbito de mais um paciente.

A comparação do valor do NNT com o valor do NNH dá ideia do risco-benefício de uma intervenção:

·   Quanto menor for o NNTmaior será o número de pacientes que terão o benefício. 

·   Quanto maior for o NNHmenor será o número de pacientes que terão efeitos adversos.

Tanto o NNT como o NNH são estimativas por ponto e, como todas as estimativas, têm incerteza. Em estatística, é usual dar ideia do tamanho dessa incerteza por meio de intervalo de confiança. Um intervalo de 95% de confiança para o número necessário para causar dano significa que, se o estudo for repetido 20 vezes, espera-se que o verdadeiro valor desse número caia 19 vezes dentro do intervalo calculado. Os intervalos de confiança se tornam mais estreitos à medida que o número de dados aumenta. Então, quanto maior for o ensaio, menor será o intervalo de confiança das estimativas. Para os cálculos3, use software estatístico.

 


Referências

1.    Evidence-Based Medicine 1997 (2):103-4.

2. Number Needed to Treat (NNT) Calculator - ClinCalc clincalc.com/Stats/NNT.aspx

3. Smart Health Choices: Making Sense of Health Advice. http://www.ncbi.nlm.nih.gov/books/NBK63647/

 


Tuesday, March 15, 2016

NNT - Número para Necessário Tratar e RRA-Redução do Risco Absoluto


A ANVISA pede que, na descrição dos resultados de um ensaio clínico, seja dada uma estimativa do valor de NNT com os respectivos intervalos de confiança, para cada intervenção. Mas o que é NNT? NNT ou Número Necessário Tratar (number needed to treat) é uma medida de quão eficiente é um tratamento.

 

Antes de definir NNT, convém lembrar que:

 

·     É mostrado aqui como calcular o NNT, desde que o ensaio compare apenas dois grupos, como controle e tratado e os desfechos sejam variáveis binárias, como sucesso ou fracasso.

·     Todas as circunstâncias que envolvem o ensaio, como duração, dosagens, idade dos participantes, gravidade da patologia precisam ser mencionadas.

 

                                              Definição de NNT

 

NNT é o número médio de pacientes que precisam receber uma intervenção específica (grupo tratado) para que o desfecho desejado ocorra em um paciente a mais do que o número que ocorre no controle, mantidas as mesmas condições.

 

Informalmente, NNT é o número de pacientes que precisam ser tratados para evitar um desfecho adicional ruim (morte, infarto, AVC etc.).

 

Para calcular o NNT, existe uma fórmula. Seja pt a proporção de sucessos no grupo tratado e pc  a proporção de sucessos no grupo controle, como mostrado na tabela. Então 1- pé o risco de fracasso no grupo tratado e 1- pc é o risco de fracasso no grupo controle. 

 

Proporções de sobrevida e óbito

nos dois grupos

     Exemplo 1


Imagine que, para verificar se uma nova intervenção aumenta a probabilidade de sobrevida, decorridos cinco anos após o diagnóstico de câncer no pulmão estágio III, foi feito um ensaio clínico randomizado com 400 pacientes: 200 foram designados para o controle e 200 para a nova intervenção. Após cinco anos de diagnosticados, haviam morrido 160 pacientes do grupo controle e 140 do grupo submetido à nova intervenção, como mostrado na tabela.

 

Proporção de sobreviventes e mortos, segundo o grupo

(tamanho de cada grupo = 200) 

    

Grupo

Desfecho

Total

Proporção

Sobrevivente

Morto

Controle

40

160

200

pc = 0,20

Tratado

60

140

200

pt = 0,30


                                        


Mas o que significa NNT = 10? Para mais bem entender o significado desse resultado, volte à tabela e veja: todos os números apresentados são divisíveis por 20. Vamos, então, dividir os números por 20 (o que mantém as proporções).

 

Proporção de sobreviventes e mortos, segundo o grupo

(tamanho de cada grupo = 10) 

 

Grupo

Desfecho

Total

Proporção

Sobrevivente

Morto

Controle

2

8

10

pc = 0,20

Tratado

3

7

10

pt = 0,30


NNT = 10para grupos de 10 pacientes (10 no tratado e 10 no controle), espera-se que sobrevivam 2 no  controle e 3 no tratado (1 sobrevivente a mais no grupo tratado)Veja o desenho. 

 


Significado de NNT = 10


Em média, 10 pacientes devem receber a nova intervenção (em lugar de ser controle) para que seja evitado um óbito a mais (que teria ocorrido no grupo controle).

Exemplo 2


Pesquisadores testaram uma nova droga para diminuir a probabilidade de acidente vascular cerebral (AVC) em homens que sofrem fibrilação atrial. O estudo incluiu 1.000 homens que tomaram a nova droga por cinco anos e 1.000 que receberam a terapia padrão pelo mesmo tempo. No final do estudo, havia tido acidente vascular cerebral 6% dos homens do grupo da terapia padrão e apenas 2% do grupo que recebeu a nova droga, como mostrado na tabela.

 

Proporção de pacientes que não tiveram e que tiveram AVC, segundo o grupo

                                  

Terapia

Desfecho

Total

Proporção

Sem AVC

AVC

Padrão

940

60

1.000

pc  = 0,94

Nova

980

20

1.000

pt  = 0,98

 

Aplicando a fórmula:

 

O que significa NNT = 25? É o número de pacientes que precisam ser tratados para que seja beneficiado um paciente a mais do que é esperado no grupo controle.


Exemplo 3


Imagine uma doença (1) que depois de instalada tem, dentro de um ano, risco de morte de 75%. Um tratamento é proposto. É então conduzido um ensaio clínico com 200 pacientes, divididos igualmente em dois grupos:  controle e  tratado. No grupo controle, 75% dos pacientes vieram a óbito dentro de um ano. No grupo tratado, 25% vieram a óbito dentro de um ano. Veja a figura.


Número necessário para tratar


Então, 25% dos pacientes não morreram mesmo sem tratamento e 25% morreram mesmo tratados. É, portanto, razoável concluir que o tratamento fez sobreviverem 50% a mais do que sobreviveriam se estivessem no grupo controle. Logo, o tratamento evita uma morte para cada dois pacientes. Então NNT = 2, porque se espera que, em média, de cada 2 pacientes tratados, um se beneficie.

 

Ajuda colocar os dados em tabela ajuda. Veja:


                            Proporção de sobreviventes e mortos, segundo o grupo

                                   (tamanho de cada grupo = 100) 

  
           Aplicando a fórmula:                 


Significado de valores de NNT

 

NNT = 100 significa que 100 pacientes precisam ser tratados para que mais um deles tenha o efeito desejado.

 

NNT = 10 significa que 10 pacientes precisam ser tratados para que mais um deles tenha o efeito desejado.

 

NNT = 1 significa que um paciente precisa ser tratado para que tenha o efeito desejado.

 

Quanto menor é o NNT, maior é o benefício da terapia. 

NNT = 1 é o ideal, porque significa que todo paciente tratado é beneficiado.

 

Redução de risco absoluto (RRA)

(absolute risk reduction)

 

Redução de risco absoluto (RRA) (absolute risk reduction- ARR) é uma medida do efeito da intervenção.

 

Para obter o RRA, calcula-se a diferença entre a probabilidade de determinado desfecho no grupo controle com a probabilidade desse mesmo desfecho no grupo submetido à nova intervenção.

O resultado pode ser (ou não) expresso em porcentagem. Em porcentagem:


     

Exemplo 4


Imagine que dentro de um ano, o risco de morte das pessoas com determinado diagnóstico é 0,12. Uma nova droga reduziu o risco de morte para 0,08 Como se calcula a redução de risco absoluto (RRA)? 


Neste exemplo, o RRA é 4%. Isso significa que, se 100 pessoas forem tratadas, espera-se que, dentro de um ano, não morrerão 4. Em outras palavras, a redução do risco de morte foi de 4%.

 

Como se calcula o número necessário tratar (NNT)?

 

O que significa NNT = 25? Precisam ser tratados 25 pacientes para que seja beneficiado um paciente a mais do que é esperado no grupo controle.

 

É importante saber que a redução de risco absoluto (RRA) (absolute risk reduction) é o inverso do NNT (número necessário tratar).

                                        

Então a maneira mais fácil de calcular o NNT é obter RRA, mas não em termos percentuais, e depois inverter. No exemplo:

 

redução de risco absoluto (RRA) - também chamada de diferença de risco (risk difference-RD) - é a maneira mais útil de apresentar o resultado da pesquisa, principalmente se o leitor for um tomador de decisão.



Veja:

   1.   Number needed to treat: 3 simple questions to askhttps://www.students4bestevidence.net/number-needed-treat
2. Number Needed to Treat (NNT) Calculator - ClinCalc clincalc.com/Stats/NNT.aspx
 3. What is an NNT? - Medical Sciences Division, Oxford.  
www.medicine.ox.ac.uk/bandolier /painres/.../nnt.pdf

4. Smart Health Choices: Making Sense of Health.Advice

http://www.ncbi.nlm.nih.gov/books/NBK63647/