terça-feira, 20 de março de 2012

Distribuição hipergeométrica


                                                  Distribuição hipergeométrica
A Teoria da probabilidade é baseada na noção de "processo de Bernoulli" - um evento que resulta em um "sucesso" ou "Fracasso". Ao jogar uma moeda, por exemplo, você pode considerar "caras" um sucesso e "coroa" um fracasso, cada qual com uma probabilidade de 1/2. Ao tentar calcular a probabilidade de uma seqüência de moedas - digamos, a chance de duas caras seguidas - você só precisa multiplicar a probabilidade de cada evento individual. A probabilidade de ocorrer duas caras em sequência resulta em 1/2 x 1/2 Esse tipo de distribuição onde ocorrem apenas duas condições é denominada de "distribuição binomial."
Exitem muitas condições onde essa situação não se aplica. Isso ocorre quando um determinado evento depende da ocorrência de um evento anterior, isso é quando os eventos são interdependentes e nesse caso o método binomial não se aplica. No caso das moedas cada vez que jogamos as moedas , cada lance não afeta o resultado do a próxima. . No entanto, no jogo da MegaSena, a seleção de bolas sucessivas não é independente porque as bolas não são recolocadas de volta na máquina. Para a loto, a probabilidade de a primeira bola ter o número um 1 a probabilidade é 1 em 60. Se um 1 é selecionado, a probabilidade de um 1 na segunda bola é 0. Se não for selecionado na primeira bola o número 1, a probabilidade de seleciona - lo na segunda bola cai para 1 em 59, porque há uma menor quantidade de bolas na máquina. Essa condição é denominada de "amostragem sem reposição."
Suponha que temos F objetos para escolher. (ex: 60 bolas numeradas da MegaSena. Destes F objetos(bolas) , M são sucessos (números que correspondem aos que estão no seu cartão, ou 6 no caso da MegaSena) e F-M são falhas (para a Mega, as 54 bolas na máquina que não correspondem aos números do seu cartão. Em seguida, se realizarmos n ensaios de Bernoulli: no caso da Mega retiramos bolas n= 6 (6 eventos retirar) para Mega da máquina. O que precisamos saber é a probabilidade de obter p sucessos e n-p fracassos nessas n tentativas. Para ganharmos na Mega temos que o, calcular a probabilidade de 5 sucessos e 0 fracassos em 5 retiradas (ensaios). A fórmula geral para a probabilidade é abaixo:

C(M , p) = número de maneiras de obter p sucessos em M possibilidades de sucessos
C(F-M , n-p) = número de maneira de obter falhas (n-p) nas F-M possibilidades de falhar
C(F , n) = (número total de maneiras de selecionar n objetos do conjunto de F objetos)

P(M= sucessos em n =eventos com F= elementos) = C(M , p) * C(F-M , n-p)     (1)
                                                                                                   C(F , n)


Cada um destes termos será analisado abaixo . Para calcular o denominador, devemos perceber que existem F maneiras de selecionar o primeiro objeto, F-1, modos de selecionar o segundo objeto, e F-n formas de selecionar o objeto nth (último evento). O número total de maneiras de fazer esta seleção, por conseguinte, é F (F-1) (F-2) ... (F-n). No entanto, no nosso caso, a ordem de seleção não importa - (1,2,3,4,5) é o mesmo que (5,4,3,2,1). A ordem de retirada das bolas não importa o que corresponde a combinação dos números das respectivas bolas.

Para entender isso, imagine um sub-conjunto de duas bolas de um conjunto de três. Existem 3 formas de pegar a primeira bola e duas maneiras de escolher a segunda, para um total de 6 resultados: (1,2), (1,3), (2,1), (2,3), (3 , 1), e (3,2). No entanto, apenas três destes subconjuntos são distintos: (1,2), (1,3), e (2,3) - os outros são meras reordenações. Em geral, se está escolhendo n objetos, haverá (n) (n-1) (n-2) ... formas de organização de cada combinação, por isso precisamos dividir o nosso primeiro cálculo por este termo. Há uma nomenclatura para tal operação matemática denominada "coeficiente binomial." Usando um coeficiente binomial, o número total de formas de seleção n objetos a partir de um conjunto de F é:
C(F , n) =  _____F!_____                                                                           
                        n(F-n)!
onde F! é uma abreviação para (F) x (F-1) x (F-2) ... x3x2x1.

   
Usando a mesma lógica, você verá que o número de maneiras de obter p sucessos no total de M possibilidades de sucesso é C(M , p):

exemplo da condição acima: Qual a probabilidade de se obter apenas 2 sucessos quando podemos ter 5 possibilidades de sucesso: C(5 , 2)

Calcular o número de condições onde temos n eventos com p possibilidades de acertos, o que gera , n-p, possibilidades de falhas, isso é, n= total de eventos menos p= total de sucessos no num total de F-M elementos falhos sendo F= conjunto total de elementos e M = o conjunto de elementos bons, o subconjunto onde existem elementos falhos é igual a F-M:

C(F-M , n-p),

Substituindo estes termos na equação 1, a nossa fórmula geral para a probabilidade de sucessos p em n tentativas é a fórmula (1)


Exemplo: Em problemas de controle de qualidade, lotes com N itens são examinados. O número de itens com defeito (atributo A), r, é desconhecido, colhemos uma amostra de n itens e determinamos k. Somente para ilustrar, suponha que num lote de N=100 peças, r=10 sejam defeituosas.
Escolhendo n=5 peças sem reposição, a probabilidade de não se obter peças defeituosas é:

 

Isto é denominado como uma distribuição hipergeométrica. Ela pode ser facilmente calculada usando a função DIST.HIPERGEOM no Microsoft Excel.



Para uma estudo mais rigoroso desta fórmula, recomendamos Uma Introdução à Teoria das Probabilidades e suas Aplicações, Volume 1 por William Feller (New York: John Wiley & Sons, Inc. 1968)

 
Matemática - Probabilidade
Um lote contem N sensores, dos quais se sabe serem R defeituosos. Se a ordem da inspeção dos sensores se fizer aleatoriamente, determine a probabilidade de que o sensor inspecionado em k-ésimo lugar (k>=R) seja o ultimo sensor defeituoso contido no lote.

resposta:
 
Este problema tem que ser resolvido pela interseção de dois eventos. Primeiro devemos utilizar a distribuição hipergeometrica para encontrar a probabilidade de encontrar todas as peças defeituosas = R num lote de N numa amostra de k= peças.
C(n,p) = Combinação de n elementos distintos em conjuntos de p elementos
Assim temos:

                                     P(X=R) = C(R,R)*C(N-R)/C(N,K)



Desse modo achamos a probabilidade de termos todas as peças defeituosos nas K peças retiradas. Depois temos que encontrar a probabilidade de retirarmos a última peça defeituosa na késima retirada e ainda temos que ter todas as peças defeituosas já retiradas.Como temos que ter apenas uma peça defeituosa na késima retirada temos então que sobraram no lote: N-k+1 peças e só temos uma defeituosa, portanto a probabilidade é 1/(N-k+1). Devemos então usar a regra da interseção de conjuntos ou o E lógico, isso é multiplicar C(R,R)*C(N-R)/C(N,K) por 1/(N-k+1) e, assim obtemos a resposta desejada.



Nenhum comentário:

Postar um comentário