Friday, March 12, 2021

Distribuição hipergeométrica: conceitos, cálculos e gráficos

                                                           

                                                                Definição 

Distribuição hipergeométrica é uma distribuição discreta que descreve o número de sucessos (X1) em uma amostra de tamanho fixo (n), retirada sem reposição de uma população finita de tamanho conhecido (N). Cada item na amostra tem dois resultados possíveis: sucesso ou fracasso. São conhecidos os números de sucessos (N1) e de fracassos (N2) na população.

A distribuição hipergeométrica é definida pelos seguintes parâmetros:

·      N: Tamanho total da população

·     N1: Número de sucessos na população

·     n: Tamanho da amostra retirada

Um gráfico de barras mostra como a probabilidade varia para diferentes valores de X1​.

Interpretação e Aplicações 

Este exemplo ilustra como a distribuição hipergeométrica é utilizada para analisar situações em que amostras são retiradas sem reposição de uma população finita. Portanto, essa distribuição é apropriada para calcular a probabilidade de obter determinado número de sucessos em uma amostra, sabendo a quantidade total de sucessos e fracassos na população.

                                                  Observações Importantes 

1. A distribuição hipergeométrica é utilizada quando o tamanho da população total é conhecido e deseja-se calcular a probabilidade de retirar um número específico de itens com uma determinada característica. Por exemplo, você quer saber a probabilidade de retirar sequencialmente, quatro cartas de ouros em uma sequência de 4 retiradas. 

2.  A probabilidade de selecionar determinado item muda a cada retirada, pois não há reposição. No exemplo das cartas de baralho, a probabilidade de sair uma carta de ouros na primeira retirada é 13/52​. Se uma carta de ouros foi retirada, a probabilidade de sair uma carta de ouros na segunda retirada é 12/51​.

   Função de probabilidade da distribuição hipergeométrica

A função de probabilidade da distribuição hipergeométrica é dada por:    

                                       
                                                          Exemplo 1

Imagine uma caixa com 20 bolas vermelhas e 20 bolas azuis. Quatro bolas são retiradas da caixa ao acaso, sem reposição. Seja X1 o número de bolas vermelhas retiradas. Então, X1 ​ é uma variável aleatória que pode assumir os valores: 0, 1, 2, 3 ou 4. Vamos analisar a distribuição de X1​, isto é, calcular a probabilidade de X1​ assumir cada um dos valores possíveis na amostra.

                                         Definições e Parâmetros

·      N = 40:   Total de bolas na caixa

·      N1 = 20: Número de bolas vermelhas na caixa (sucessos)

·     N2 = 20: Número de bolas azuis na caixa (fracassos)

·      n = 4:     Tamanho da amostra retirada

·      X1 = 0,1,2,3,4: Possíveis valores para a variável aleatória



                                Cálculo das probabilidades

Para calcular as probabilidades associadas a cada valor de X1​, utilizamos a distribuição hipergeométrica:

                                                     

Vamos organizar os resultados em uma tabela, mostrando os valores de X1​ e suas respectivas probabilidades. Em seguida, apresentaremos esses resultados em um gráfico de barras para visualizar a distribuição.

                                                                    Tabela 1

                                        Valores de X1​ e suas respectivas probabilidades

 

É trabalhoso calcular todas essas probabilidades manualmente. No entanto, é possível utilizar uma calculadora online. Uma opção é:

                                   Hypergeometric Distribution Probability Calculator

                                                                  Gráfico 1

                                  Valores de X1​ e suas respectivas probabilidades


                                                            Exemplo 2

Imagine agora uma caixa com 20 bolas vermelhas e 4 bolas azuis. Quatro bolas são retiradas ao acaso, sem reposição. Seja X1​ o número de bolas vermelhas retiradas.

                                                      Definições e Parâmetros

·      N = 24:  Total de bolas na caixa

·      N1 = 20: Número de bolas vermelhas (sucessos)

·      N2 = 4:  Número de bolas azuis (fracassos)

·       n = 4:   Tamanho da amostra retirada

·      X1 = 0,1,2,3,4 

                                                                Tabela 2

                              Valores de X1​ e suas respectivas probabilidades

                                                  
                                               

                                                         Gráfico 2

                                         Valores de X1​ e suas respectivas probabilidades

                      

O gráfico mostra as probabilidades associadas aos diferentes valores de X1​.

                                  Comparação entre as Distribuições

           Gráfico 1: A distribuição é simétrica, pois o número de sucessos e fracassos na população é igual.

     Gráfico 2: A distribuição é assimétrica, pois há um número significativamente maior de sucessos (vermelhas) do que fracassos (azuis).

Média e Variância na Distribuição Hipergeométrica

Para a distribuição hipergeométrica, a média e a variância são dadas por:   

                                         

       
          O último multiplicador é o fator de correção para amostra finita

  Definições e Parâmetros
                             

·      N:    Tamanho total da população

·     N1​: Número de sucessos na população

·      n:    Tamanho da amostra retirada

       


                                                        Exemplo 3

Considere uma população com N = 50 unidades, das quais N1 = 20 possuem a característica de interesse. Retiramos uma amostra de n = 10 unidades e analisamos as probabilidades para diferentes quantidades de unidades de interesse na amostra. Calcule as probabilidades e faça um gráfico. Depois, calcule a média e a variância da distribuição.

 Dica: use algum recurso computacional para fazer cálculos e gráfico. 

                                                                  Gráfico 3

  Cálculo da Média

                                                           Cálculo da Variância

                                                             Resultados

A média e a variância da distribuição hipergeométrica para N = 50, N1 = 20 e n = 10 são:

 Média (μ) = 4

 Variância (σ²) ≈ 1,958

Considerações Finais

A distribuição hipergeométrica é particularmente útil em situações onde não há reposição na retirada de amostras de uma população finita. Os exemplos apresentados mostram como utilizar essa distribuição para calcular probabilidades e como interpretar a simetria ou assimetria dos gráficos, dependendo da relação entre sucessos e fracassos na população.



2 comments:

Marcelle said...

Bom dia professora. Estava fazendo um exercício sobre o teste de Scheffé do livro e estou com uma dúvida: no livro, o contraste de médias é:
L= 21 + 8 +10 + 29 + 13 - 5 * 2 = 91
o resultado desse cálculo não seria 71?

Sonia Vieira said...

Sem dúvida, Marcelle, o resultado dessa soma é 71. Mas como você não cita o contexto, não sei dizer se é na soma ou se seria em algum outro ponto, na definição do contraste, que a soma deu errado. Mas que você apontou um erro, não tenho dúvida. Obrigada.