超幾何分布を利用してのビンゴの確率

前回saikeisai.hatenablog.comの続きです。

ビンゴの確率をちゃんと計算することを考えてみる。
まずは、 n \times nのビンゴのマスとする。
最大の数を m(75であることが多い)、呼ばれた番号の数を kとする。
かんたんのために、まずはフリーマスなしで考える。
例えば、 5 \times 5の場合は12本の線があるが、そのうちの一本でビンゴが起こる確率を p_{1}とすると、
 p_{1}=\frac{\dbinom{n}{n} \times \dbinom{m-n}{k-n}}{\dbinom{m}{k}}=\frac{\dbinom{m-n}{k-n}}{\dbinom{m}{k}}
となる。これは超幾何分布の確率っぽくなっている。
どれか一本の線でビンゴが起こればいいので、ビンゴが起こる確率を pとすると、
 p = 1-(1-p_{1})^{2 n + 2}
となる。
リーマスがある場合には、
 p_{2}=\frac{\dbinom{m-n+1}{k+1-n}}{\dbinom{m}{k}}
を用いて、
 p = 1-(1-p_{1})^{2 n - 2}(1-p_{2})^4
となる。

この式を用いて、計算された確率を赤線、シミュレーションを5万回やったときの図を添付する。
条件は、 5 \times 5のフリーマスありで最大75である。
f:id:saikeisai:20170131013213p:plain

まあ同じ・・かな?

以下、前回も載せたところもかぶるけどシミュレーションコード

players<-50000
numrows <- numcols <- 5
maxNum <- 75
isfree <- TRUE # free : center

all_bingo<-list()
numBingoMatrix <- matrix(0,nrow=maxNum,ncol=players)

countBingo <- function(bingo,numrows){
  #bingo bingo matrix
  count <- 0
  for(i in 1:numrows){
    if(sum(bingo[,i])==0){
      count <- count + 1
    }
  }
  for(j in 1:numrows){
    if(sum(bingo[j,])==0){
      count <- count + 1
    }
  }
  
  #antidiagonal
  if(sum(diag(apply(bingo,2,rev)))==0){
    count <- count + 1
  }
  if(sum(diag(bingo))==0){
    count <- count + 1
  }
  return(count)
}

for(i in 1:players){
  bingo<-matrix( (sample(1:maxNum,size = numrows*numcols,replace=FALSE)),ncol=numcols,nrow=numrows)
  if(isfree){
    bingo[(numcols+1)/2,(numrows+1)/2]<-0
  }
  all_bingo<-c(all_bingo,list(bingo))
}

skeleton <- all_bingo
calls <- sample(1:maxNum,size = maxNum,replace=FALSE)
bingoNum <- numeric(players)

for(j in 1:maxNum){
  unlisted <- unlist(all_bingo)
  unlisted[unlisted==calls[j]]<-0
  all_bingo<-relist(flesh=unlisted,skeleton = skeleton)
  
  for(k in 1:players){
    bingoNum[k] <- countBingo(all_bingo[[k]],numrows)
  }
  numBingoMatrix[j,]<-bingoNum
}

temp <- numBingoMatrix>0
numberOfHit<-apply(temp,1,sum)


bingoProbability <- function(calls,maxNum,numrows,isfree){
  p1 <- choose(maxNum-numrows,calls-numrows)/choose(maxNum,calls)
  p2 <- p1
  if(isfree){
    p2 <- choose(maxNum-numrows+1,calls+1-numrows)/choose(maxNum,calls)
  }
  p <- 1-((1-p1)^(numrows*2-2))*((1-p2)^4)
  return(p)
}


plot(numberOfHit/players,xlab="calls",ylab="cumulative probability")
lines(bingoProbability(calls=1:75,maxNum = 75,numrows=5,isfree=isfree),col=2)