Wednesday, September 03, 2025

O Princípio por Trás dos Dados: Entenda a Estimação por Máxima Verossimilhança com Exemplos Simples

 

Você já se perguntou como os estatísticos conseguem fazer afirmações sobre toda uma população estudando apenas uma pequena amostra? O segredo está em métodos como a Estimação por Máxima Verossimilhança - uma técnica poderosa que nos ajuda a fazer o "melhor palpite" sobre parâmetros desconhecidos.

O que é Inferência Estatística?

A inferência estatística significa obter informações de uma amostra e, com base nela, concluir características de toda a população de onde a amostra foi retirada. Entre vários métodos que produzem bons estimadores, hoje vamos focar no método de máxima verossimilhança.

Um Exemplo Intuitivo:

Imagine uma urna com muitas bolas azuis e laranja. Você não sabe qual cor é mais frequente, mas sabe que só há duas possibilidades:

1.    Três bolas azuis para cada bola laranja → probabilidade de azul (p) = ¾

2.    Uma bola azul para cada três bolas laranja → probabilidade de azul (p) = ¼

Agora, você retira 3 bolas com reposição e observa quantas são azuis. Como decidir qual é o verdadeiro valor de p? Veja a Tabela 1.

Tabela 1. As Probabilidades em Jogo

Nº de bolas azuis

p = ¾

p = ¼

0

1/64

27/64

1

9/64

27/64

2

27/64

9/64

3

27/64

 1/64


Figura 1. As Probabilidades em Jogo


A estratégia é simples: escolhemos o valor de p que torna nossa observação mais provável.

·      Se saírem 0 ou 1 bola azul → estimamos p = ¼

·      Se saírem 2 ou 3 bolas azuis → estimamos p = ¾

Você acabou de usar o estimador de máxima verossimilhança!

Do Caso Específico para o Geral 

No mundo real, raramente temos apenas duas opções. Em um experimento com resultados "sucesso" ou "fracasso", podemos ter uma amostra como: S, S, F, F, S, F (3 sucessos em 6 tentativas).

A abordagem intuitiva nos levaria a calcular:
p̂ = x / n = 3 / 6 = 1/2

Esta não é apenas uma escolha razoável - é a estimativa de máxima verossimilhança. Para n = 6 tentativas, o valor p = ½ torna a observação de x = 3 sucessos a mais provável de todas as possibilidades. Veja a Tabela 2.

Tabela 2: Probabilidades de x sucessos em amostras de tamanho n =6

 

Valor de p

 

Número de sucessos

 

0

1

2

3

4

5

6

p = 1/2

0,01563

0,09375

0,23438

0,3125

0,23438

0,09375

0,01563

 

Figura 2: Probabilidades associadas à ocorrência de x sucessos em amostras de tamanho n =6

 

 

  Por que isso importa?

 O estimador de máxima verossimilhança é:

·         Intuitivo: Escolhe o parâmetro que maximiza a chance de observarmos o que realmente observamos.

·   Poderoso: Pode ser aplicado a diversos modelos estatísticos muito mais complexos que o exemplo binomial simples.

·         Consistente: Com amostras grandes, tende a convergir para o valor verdadeiro do parâmetro populacional.

·      Versátil: Forma a base para uma grande quantidade de técnicas estatísticas modernas usadas em ciência de dados, aprendizado de máquina e pesquisa científica.

Exemplos da vida real

*1. Em uma fábrica de parafusos, o controle de qualidade é feito selecionando-se uma amostra de cada lote e verificando quantos são não conformes. Considere que em um lote de 500 parafusos, foram encontrados 38 não conformes. Qual é o estimador de máxima verossimilhança para a proporção de não conformes? Qual é a estimativa obtida por esse lote?

         Resposta:

·      O Estimador de Máxima Verossimilhança (MLE) para a proporção p em uma distribuição binomial é a própria proporção amostral de sucessos (onde "sucesso" é, neste contexto, encontrar um parafuso não conforme).

·      A fórmula do estimador é: p̂ = x / n

·      A estimativa para este lote específico é calculada plugando os valores da amostra na fórmula do estimador:


                        p̂ = 38 / 500 = 0,076 ou 7,6%

Resposta Final para o Exemplo 1:

O estimador de máxima verossimilhança para a proporção de não conformes é p̂ = x/n. Com base na amostra deste lote (38 não conformes em 500 parafusos), a estimativa pontual para a proporção de não conformes no lote é de 7,6%.

*2. Foram entrevistados 500 eleitores e obtidos os seguintes resultados: 220 votos seriam para o candidato A, 180 votos seriam para o candidato B e os demais eleitores (100 pessoas) estavam indecisos.
a) Qual é a estimativa de máxima verossimilhança para a proporção de eleitores indecisos na população?
b) Qual é a estimativa de máxima verossimilhança para a proporção de votos do candidato A?
Resposta
a) O estimador é 
p̂ = x/n. A estimativa para a proporção de indecisos é p̂(indecisos) = 100 / 500 = 0,20 ou 20%.
b) Da mesma forma, a estimativa para a proporção do candidato A é 
(A) = 220 / 500 = 0,44 ou 44%.

VEJA:


1.  Mood A. M. e Graybill, F. A. Introduction to the theory of statistics. McGraw

No comments: