Saturday, November 15, 2014

Variância de uma soma de variáveis aleatórias independentes: exemplo

         
No processo de extração do ouro, o minério é separado em duas partes: concentrado e rejeito. Portanto, de certa quantidade M de minério são obtidas uma quantidade C de concentrado e uma quantidade R de rejeito. Podemos escrever:

M = C + R

São feitas determinações do teor de ouro, tanto no minério como no concentrado. É possível, a partir das variâncias das determinações do teor de ouro no minério e no concentrado, obter a variância do teor de ouro no rejeito? Para responder à questão: seja m o teor de ouro no minério, c o teor de ouro no concentrado e r o teor de ouro no rejeito. Então a quantidade Mm de ouro no minério é dividida em duas partes, isto é,

Mm = C c + R r

Segue-se daí que 

   Como R = M – C, tem-se que 

É razoável considerar que os erros de medida das quantidades M e C são desprezíveis em relação aos erros de medida dos teores de ouro. Desprezando as variâncias de M e C e pressupondo que m e c são variáveis independentes, podemos obter a variância do teor de ouro no rejeito



Veja mais em

Vieira, S. Estatística para a Qualidade. Rio de Janeiro, 3 ed. Elsevier. 2014.

Monday, November 03, 2014

Riscos e estatísticos

Estatística é a ciência que fornece os princípios e a metodologia para coleta, organização e análise de dados. Por conta disso, os pesquisadores das mais diferentes áreas buscam, uma vez ou outra, um consultor (a) de estatística. Mas o consultor de estatística deve ter, além de conhecimento na área, habilidade para estabelecer bom relacionamento com os profissionais que o procuram. é um risco, de parte a parte.

          Muitos anos de atividade como consultora de estatística me convenceram de que é raro reunir, numa única entrevista, um problema interessante para o consultor, um pesquisador inteligente e disposto a estudar e uma situação favorável de trabalho. Mas quando essas três condições estão ausentes, fica difícil lidar com a situação. Um constante alerta para as questões de ética talvez seja a melhor defesa contra os reveses que podem ocorrer. E são muitos os meandros da consultoria estatística que trazem, em seu bojo, a possibilidade de frustração e sensação de derrota.

          Alguns percalços, porém, têm alto risco. Existem pesquisadores que esperam demais do consultor de estatística: querem que o consultor se entusiasme pelo trabalho deles, repita explicações várias vezes porque eles “não são bons na matemática”, tenha tempo sempre que eles precisarem e redija os resultados, além de se responsabilizar pelas conclusões. 

         Também é comum que um pesquisador apresente o trabalho feito pelo estatístico como sendo seu, sem sequer referenciar o nome do profissional que consultou. É fácil medir o risco: basta olhar algumas revistas especializadas e procurar pelos artigos que expõem análises estatísticas sofisticadas. Grande parte desses artigos não dá o nome de quem fez a análise, o nome do programa de computador utilizado ou o título de um livro didático que exponha a técnica utilizada. Quando perguntados sobre o autor das análises estatísticas, os autores alegam que o serviço de estatística foi pago – e esquecem que eles também são pagos para trabalhar.

         Não é claro, porém, quando o estatístico deva ser co-autor do trabalho. Há exageros dos dois lados. Alguns estatísticos exigem co-autoria de trabalhos em que somente calcularam médias e desvios padrões e desenharam gráficos. Isso é inaceitável porque, em tais casos, o trabalho do estatístico é de consultor. Outras vezes, o nome do estatístico não é sequer citado em trabalhos que exibem, por exemplo, o ajuste de uma função logística passo a passo para dados de resposta quântica, com testes e intervalos de confiança.

          Entretanto, a melhoria do status profissional do estatístico nas áreas da saúde depende tanto de o estatístico aprender a dar consultoria como de o pesquisador aprender metodologia científica. Os estatísticos começam a dar consultoria sem qualquer tipo de treinamento. No curso de Estatística, o aluno não aprende metodologia científica nem discute consultoria. Interage pouco com profissionais de outras áreas. O enfoque é a teoria. Já os profissionais das áreas da saúde tiveram aulas de Bioestatística, mas no início do curso, em salas superlotadas. O professor, que sente o desinteresse dos alunos, muitas vezes ensina apenas a usar um programa de computador e não ensina que a Estatística dá suporte à pesquisa científica.

 

         De qualquer modo, a quantidade de atenção dada pelo consultor de estatística ao pesquisador depende de diversos fatores, tais como competência profissional do consultor, propostas alternativas de trabalho, conhecimento do pesquisador sobre estatística, status profissional do pesquisador, política do ambiente de trabalho, simpatia e sentimentos pessoais. A ideia de que a interação pessoal não ocorre em ciência e que o consultor é um indivíduo calmo e reservado não confere com a realidade. A consultoria estatística é um caos: trabalha-se sob a pressão de tempo, da falta de verba, da política do ambiente de trabalho e da discriminação profissional. Da discriminação profissional sim – porque há pesquisadores que ainda pensam que o estatístico é mero acessório de computador.

 

 



Sunday, October 26, 2014

Teorema da multiplicação de probabilidades ou a regra do e

Para bem entender o teorema da multiplicação de probabilidades, ajuda pensar o teorema dividido em duas regras: a regra nº 1, para a multiplicação de eventos independentes e a regra nº 2, para a multiplicação de eventos dependentes. Vamos começar pela “regra número 1”.

Eventos independentes

Dois eventos, A e B, são independentes se a ocorrência de um deles (A ou B) não tem efeito sobre a ocorrência do outro (B ou A).

Exemplo

Quando se lançam dois dados, o resultado em um dos dados não tem qualquer efeito sobre o resultado que ocorre no outro dado. Dizemos então que os eventos são independentes.


Na vida real encontramos muitos exemplos de eventos independentes. Por exemplo, “chover hoje” e “ser feriado amanhã” são eventos independentes porque o fato de “chover hoje” não muda a possibilidade de “ser feriado amanhã”, nem o fato de “ser feriado amanhã” muda a possibilidade de “chover hoje”. Na área de saúde, existem vários exemplos de eventos independentes: o fato de uma pessoa ser míope não afeta a probabilidade de ter cárie dentária; a profissão não afeta a probabilidade de uma pessoa ter cálculos renais; o estado civil do cidadão não modifica a probabilidade de ser calvo.

Regra 1 da multiplicação (para eventos independentes)


Se A e B são eventos independentes, a probabilidade de ocorrer A e B é dada pela probabilidade de ocorrer A, multiplicada pela probabilidade de ocorrer B. Escreve-se: 
Exemplo

Você lança dois dados ao mesmo tempo: um é vermelho e o outro é amarelo. Qual é a probabilidade de ocorrer a face 3 no dado amarelo e a face 5 no dado vermelho? Usando a regra 1 da multiplicação, você calcula a probabilidade de ocorrer face 3 no dado amarelo e face 5 no dado vermelho. Depois, multiplica essas probabilidades.
Eventos dependentes

Se a ocorrência do evento A modifica a probabilidade de ocorrência do evento B, dizemos que esses dois eventos, A e B, são dependentes.

Exemplo


Há seis meias em uma gaveta: três vermelhas e três azuis. Você quer um par de meias vermelhas. Sem olhar, você retira uma meia da gaveta. É vermelha. Sem recolocar essa meia de volta na gaveta, você retira uma segunda meia. Nesta segunda retirada, a probabilidade de a segunda meia ser vermelha é menor. Por quê?


      Na 1ª retirada você tinha três meias vermelhas em seis, ou seja, metade das meias era vermelha. Na 2ª retirada você tinha duas meias  vermelhas em cinco, ou seja, menos da metade das meias eram vermelhas. A probabilidade de sair meia vermelha na primeira retirada modifica a probabilidade de sair meia vermelha na segunda retirada. Dizemos então que esses eventos são dependentes.

Na vida real é comum nos depararmos com exemplos de eventos dependentes, ou seja, de eventos que modificam a probabilidade de outros eventos acontecerem. Por exemplo, o hábito de fumar aumenta a probabilidade de a pessoa ter câncer de pulmão; o motorista alcoolizado tem maior probabilidade de provocar acidente de trânsito; a criança imunizada para determinada doença tem menor probabilidade de ter essa doença.

Probabilidade condicional

Probabilidade condicional de B dado A é a probabilidade de ocorrer o evento B sob a condição de o evento A ter ocorrido. Indica-se por P(B|A), que se lê “probabilidade de B dado A”.

Exemplo

Há seis meias na gaveta: três vermelhas e três azuis. Você quer um par de meias vermelhas. Sem olhar, retira uma meia da gaveta e, sem recolocar essa meia na gaveta, retira outra. Qual é a probabilidade de ambas serem vermelhas?
Você tem aí uma probabilidade condicional: probabilidade de sair uma segunda meia vermelha dado que a primeira era vermelha. Em outras palavras, foi calculada a probabilidade de sair uma segunda meia vermelha sob a condição de a primeira meia retirada ser vermelha.

Toda vez que calcularmos a probabilidade condicional de B dado A, devemos lembrar que o espaço amostral fica reduzido – a condição de o evento A ter ocorrido diminui o espaço amostral para a ocorrência do evento B .

Exemplo

Um dado foi lançado. 1) Qual é a probabilidade de ocorrer número 5? 2) Qual é a probabilidade de ocorrer número 5, sabendo que saiu um número ímpar? 

Para responder a primeira questão, você tem seis eventos no espaço amostral e apenas um deles é de interesse. Para responder a segunda questão, você tem três eventos no espaço amostral e, também, apenas um deles é de interesse. Então



                         
                             Regra 2 da multiplicação (para eventos dependentes)

Se A e B são eventos dependentes, a probabilidade de ocorrer A e B é dada pela probabilidade de ocorrer A multiplicada pela probabilidade de ocorrer B dado que A ocorreu (esta probabilidade é condicional). Escreve-se: 

Exemplo

Cinco bolas que se distinguem apenas pela cor são colocadas dentro de um chapéu e perfeitamente misturadas. Três dessas bolas são azuis e duas são vermelhas. Retiram-se duas bolas ao acaso do chapéu, sem olhar, uma em seguida da outra e sem que a primeira tenha sido recolocada. Qual é a probabilidade de que as duas sejam vermelhas?



O chapéu contém cinco bolas: duas são vermelhas. Então a probabilidade de a primeira bola retirada ser vermelha é

Como a bola retirada não foi recolocada, restam quatro bolas no chapéu.  Se a primeira bola retirada era vermelha, das quatro bolas que ficaram no chapéu apenas uma é vermelha. A probabilidade (condicional) de a segunda bola retirada ser vermelha é:

A probabilidade de as duas bolas retiradas serem vermelhas é dada pelo produto:



                       Condição de independência

Dois eventos são independentes se a probabilidade de que ocorram juntos é igual ao produto das probabilidades de que ocorram em separado, uma vez que a ocorrência de um deles em nada ajuda a ocorrência do outro.
Exemplo
A questão da independência é bem ilustrada pelo jogo de uma moeda duas vezes: o resultado do primeiro lançamento não influi no resultado do segundo lançamento. Os dois eventos são independentes.


Veja probabilidade em:

          Vieira, S. Introdução à Bioestatística. Rio de Janeiro. Elsevier.
          Vieira, S. Estatística para a Qualidade. Rio de Janeiro. Elsevier.




Thursday, October 09, 2014

Teorema da soma de probabilidades ou a regra do ou

Para bem entender a soma de probabilidades, ajuda dividir a questão em duas regras: a regra nº 1, para a soma de eventos mutuamente exclusivos e a regra nº 2, para a soma de eventos não mutuamente exclusivos.

                              Eventos mutuamente exclusivos

Se dois eventos não podem ocorrer ao mesmo tempo, dizemos que são mutuamente exclusivos. A ocorrência de um desses eventos exclui (impede) a ocorrência do outro.
                                                Exemplo
Quando você joga um dado, só pode ocorrer uma das faces. Então se a ocorreu a face “cinco”, ficou excluída a possibilidade de ter ocorrido qualquer outra face.


Regra 1 da soma (para eventos mutuamente exclusivos)

Se A e B são eventos mutuamente exclusivos, a probabilidade de ocorrer A ou B é igual à soma das probabilidades de ocorrer cada um deles. Escreve-se:



 Exemplo

Quando você joga um dado, só pode ocorrer uma das faces. Qual é a probabilidade de, em um lançamento, ocorrer 1 ou 6? Usando a regra 1 da soma, você calcula a probabilidade de ocorrer 1 e a probabilidade de ocorrer 6. Depois, soma essas probabilidades.

Exemplo

Imagine um pote de vidro com 11 bolinhas de diferentes cores: 3 azuis, 4 brancas, 2 vermelhas, 1 amarela, 1 verde. Qual é a probabilidade de, em uma só retirada, ocorrer bola verde ou bola amarela? Usando a regra 1 da soma, você calcula a probabilidade de ocorrer bola verde e a probabilidade de ocorrer bola amarela. Depois, soma essas probabilidades.

  Eventos não mutuamente exclusivos

Dois eventos A e B são não mutuamente exclusivos se eles têm pelo menos um resultado em comum.

Exemplo

Quando você joga um dado, só pode ocorrer uma das faces. Mas pense nos eventos: ocorrer “número ímpar” ou ocorrer “número maior do que quatro”. Esses dois eventos têm um resultado em comum: é o número cinco, que tanto pertence ao evento “número ímpar” como ao evento “número maior do que quatro”.
Veja a figura: “números ímpares” estão circundados por uma elipse azul e “números maiores do que quatro” por um retângulo vermelho. Se você contar o número de resultados que correspondem ao evento “número ímpar” e o número de resultados que correspondem ao evento “número maior do que quatro”, terá contado 5 duas vezes.  
                   
Regra 2 da soma (para eventos não mutuamente exclusivos)

Se A e B são dois eventos não mutuamente exclusivos, há uma sobreposição, isto é, existe pelo menos um resultado de A que também é resultado de B. Então a probabilidade de ocorrer A ou B é dada pela probabilidade de A, mais a probabilidade de B, menos a probabilidade de A e B (contada duas vezes). Escreve-se:



Exemplo

Quando você joga um dado, só pode ocorrer uma das faces. Qual é a probabilidade de, em um lançamento, ocorrer “número ímpar” ou ocorrer “número maior do que quatro”? Usando a regra 2 da soma, você calcula a probabilidade de ocorrer “número ímpar”, a probabilidade de ocorrer “número maior do que quatro” e probabilidade de ocorrer “número ímpar maior do que quatro”. Depois, aplica a regra 2:
Exemplo

Uma carta será retirada ao acaso de um baralho. Qual é a probabilidade de sair um rei ou uma carta de copas?
Como um baralho tem 52 cartas, das quais quatro são reis e 13 são de copas, alguém poderia pensar que a probabilidade de sair um rei ou uma carta de copas é dada pela soma
                           
 Mas esta resposta está errada porque o rei de copas é tanto rei como copas. Então o rei de copas teria sido contado duas vezes – como rei e como copas. 
Para obter a probabilidade de sair uma sair um rei ou uma carta de copas, some as probabilidades de sair rei e sair carta de copas e subtraia a probabilidade de sair o rei de copas, contado duas vezes:  
Exercícios

1. É dado o conjunto de dados: A={1; 2; 3; 4; 5; 6; 7; 8; 9; 10}.
      a)    Qual é a probabilidade de, ao se tomar um número ao acaso desse conjunto A de dados, o número ser um ímpar menor do que 4 ou um ímpar maior do que 8?
    b)
    Qual é a probabilidade de, ao se tomar um número ao acaso desse conjunto A de dados, o número ser um ímpar ou múltiplo de 3?

     2. Qual é a probabilidade de, ao lançar um dado, sair número ímpar ou múltiplo de 3? 


3. Jogam-se um dado e uma moeda. O jogador ganha se sair “cara” na moeda ou “2” no dado. Qual é a probabilidade de o jogador ganhar arremessando juntos o dado e a moeda?
Respostas:
            1.  a) 3/10.
            1.  b) 3/5.
            2.  2/3
            3. 7/12

Como se chegar a essas respostas?

1.a) São 10 eventos possíveis.São eventos de interesse:ímpares menores do que 4, isto é, 1 e 3 e maiores do que 8, ou seja, só o 9. Veja os eventos de interesse em vermelho:
                     1; 2; 3; 4; 5; 6; 7; 8; 9; 10. 
Daí, a resposta 3/10.
1.b) São 10 eventos possíveis.São eventos de interesse:ímpares ou múltiplos de 3. São ímpares: 1; 3; 5; 7; 9. São múltiplos de 3: 3; 6; 9. Veja que os números 3 e 9 foram contados duas vezes, porque são tanto números ímpares como múltiplos de 3. Usando a regra 2 da soma:
Veja as respostas de interesse marcadas em vermelho (ímpares) e circundadas por quadrado (múltiplos de 3):



2. São 6 eventos possíveis, dos quais 3 são números ímpares e 2 são múltiplos de 3, mas 3 é tanto ímpar como múltiplo de 3. Então, aplicando a regra 2 da soma:
                  
Veja as respostas de interesse marcadas em vermelho, múltiplos de 3 e em azul, os ímpares.


3. Veja: tanto faz sair “cara” na moeda ou “2” no dado, o jogador ganha nos dois casos. A probabilidade de sair “cara” na moeda é
  A probabilidade de sair “2” no dado é 
 No entanto, pode “sair cara” na moeda e “2” no dado em uma única jogada. A probabilidade desse evento é

 Logo, para calcular a probabilidade de o jogador ganhar, use a regra 2 da soma. A probabilidade pedida é
Veja também a tabela e conte: são 12 eventos possíveis; 7 são de interesse. Logo, a probabilidade pedida é 7/12.