Monday, December 03, 2012
Interpretando gráficos: onset e offset
Friday, September 14, 2012
O que é p-valor?
A grande maioria das pesquisas é
feita com base em amostras, mas os pesquisadores querem generalizar seus
achados para a população de onde as amostras foram retiradas. Isto pode ser
feito, desde que a generalização esteja fundamentada em teste de hipóteses.
Para fazer o
teste, é preciso transformar a pergunta que motivou a pesquisa em duas
hipóteses que se contradizem. A ideia fica bem entendida com um exemplo
clássico na literatura de estatística. Imagine que um réu está sendo chamado a
juízo para responder por ação cível ou por crime. Quais são as hipóteses
possíveis?
·
O
réu é inocente.
·
O
réu é culpado.
A primeira
hipótese é referida na literatura de Estatística com hipótese da nulidade e a
segunda como hipótese alternativa.
Para tomar
decisão por uma das hipóteses, é preciso fazer uma análise dos dados
disponíveis que são apenas parte dos fatos, ou seja, uma amostra. No caso do
exemplo, quais são as decisões possíveis?
·
Considerar
o réu culpado.
·
Considerar
o réu inocente.
A decisão
tomada - qualquer que seja - pode estar errada porque quem julga conhece apenas
parte dos fatos. Quais são os erros possíveis?
·
Dizer
que o réu é culpado, quando é inocente.
·
Dizer
que o réu é inocente, quando é culpado.
É importante
ter em mente que toda inferência está sujeita a erro. A conclusão se
baseia em apenas uma amostra do universo e – por puro azar – podem ter sido
observada uma amostra pouco representativa desse universo. Definem-se, para a
Inferência Estatística, dois tipos de erro.
·
Erro
tipo I: rejeitar a hipótese da nulidade quando essa hipótese é verdadeira
·
Erro
tipo II: não rejeitar a hipótese da nulidade quando essa hipótese é falsa.
No caso do
exemplo, considera-se mais grave o erro de punir um inocente do que deixar
impune um culpado. Na pesquisa científica também se considera mais grave o erro
de rejeitar a hipótese da nulidade quando ela é verdadeira. Por quê? Porque
isso significa mudar padrões e comportamentos sem necessidade (só porque um
centro de pesquisas, apressadamente, apontou como verdadeira uma diferença que
não existe). Veja alguns exemplos de erro tipo I, que podem ocorrer na pesquisa
científica:
·
Dizer
que uma nova droga é melhor que a tradicional, quando isso não for verdade.
·
Dizer
que uma dieta aumenta a longevidade, quando isso não for verdade.
·
Dizer
que um produto é cancerígeno, quando isso não for verdade.
·
Dizer
que uma vitamina faz atletas, quando isso não for verdade.
O teste de
hipóteses não elimina a probabilidade de erro, mas fornece o p-valor
(valor de probabilidade) que permite decidir se existe evidência suficiente
para rejeitar a hipótese da nulidade. O p-valor diz quão provável seria
obter uma amostra tal qual a que foi obtida, quando a hipótese da nulidade é
verdadeira.
Os
pesquisadores se sentem seguros para rejeitar a hipótese da nulidade (assumir
que existe a diferença procurada) quando o p-valor é pequeno. Isto
porque seria muito pouco provável chegar ao resultado obtido, se a diferença
não existisse. Mas quem rejeita a hipótese da nulidade não tem certeza absoluta
(não tem 100% de confiança) de que a decisão tomada está correta – sabe, apenas,
que existe a probabilidade de erro.
Por
convenção, se o p-valor for menor do que 0,05 (p < 0,05), conclui-se
que a hipótese da nulidade deve ser rejeitada. É comum dizer, nos casos em que p
< 0,05, que os resultados são estatisticamente significantes. Calcular o p-valor
é extremamente difícil e isso só é feito, hoje em dia, usando programas de
computador.
Thursday, August 02, 2012
Pesquisas de opinião
Quando se fala em pesquisa, a maioria das pessoas pensa nas pesquisas feitas para aferir a intenção de votos, ou seja, nas prévias eleitorais exaustivamente anunciadas e discutidas nos períodos que antecedem qualquer eleição. Essas pesquisas sempre enfrentam questionamento.
Muitos acham que a
maioria dos eleitores não consegue ter opinião própria sobre os candidatos
devido ao constante bombardeio das estatísticas. Segundo alguns, o cidadão
comum vota no candidato com mais chance de vencer, ou seja, escolhe “votar certo”,
ou “votar para ganhar”. A literatura da área já deu até nome para essa
possibilidade: é o efeito bandwagon (que significa
carro-chefe).
Há também quem argumente
que alguns eleitores, francamente decepcionados com os políticos, votam no
candidato com menor chance de vencer – para não ter responsabilidade no que der
e vier. Seria o efeito underdog (que significa
“lanterninha”).
Outros levantam a teoria
do voto tático ou voto estratégico, conhecido no
Brasil como “voto útil”. Essas pessoas acham que se o eleitor perceber, pelos
resultados das pesquisas, que o candidato que rejeita deve vencer as eleições,
vota no segundo colocado, para diminuir a chance de o candidato que
rejeita.
Mas é bem provável que o
eleitor brasileiro coloque a satisfação de suas necessidades básicas em
primeiro lugar, na hora de escolher seu candidato1. Na expressão dos
americanos para a maneira de, eles próprios, escolherem seus governantes,
eleitores “votam com a mão no bolso”2 – e não com a cabeça ou o
coração.
De qualquer forma, prévias
eleitorais têm, hoje, confiabilidade e validade. É verdade que, no
Brasil, houve vários erros antes da década de 90. Por exemplo, em 1974 houve
eleições para senador da República. As prévias eleitorais mostravam muito mais
votos para os candidatos do governo do que eles realmente receberam. Dada à
ditadura militar da época, o erro possivelmente se explica pelo fato de as
pessoas entrevistadas terem tido medo de dizer que pretendiam votar contra o
governo.
Também ocorreram muitos
erros nas prévias feitas por ocasião das eleições para as prefeituras das
capitais, em 1985. Tais erros provavelmente se explicam pela grande quantidade
de indecisos que apareciam em todas as prévias – talvez porque os candidatos
não fossem muito conhecidos. Não tem sentido prever o resultado de uma eleição
pressupondo que os votos dos indecisos e dos não querem opinar se distribuirão,
pelos candidatos, da mesma forma como o daqueles que, por ocasião das prévias,
já se decidiram.
Hoje, porém, a média
de acerto dos quatro grandes institutos brasileiros de pesquisa (Datafolha, Ipec, Ipesp, Quaest) está em padrões internacionais: é superior a
90%3. Portanto, acredite nas pesquisas, mesmo sabendo que elas
podem, eventualmente, estar erradas...
Referências
Almeida, C.
A. A cabeça do eleitor. Rio de Janeiro: Record, 2008.
Tradução
livre da expressão “Americans vote with their wallets”.
Haag, C.
Meu reino por um ponto a mais. Pesquisa FAPESP. 127. Setembro de 2006.