戻る

統計学入門 第6章の問題 6.3 負の二項分布

はじめに

この記事は統計学入門1のを読んだことをまとめた振り返り記事です。

問題

負の二項分布を導出せよ。

解答

ベルヌーイ試行を考え、成功(SS)と失敗(FF)をそれぞれ確率ppq=1pq = 1 - pで表すとします。 成功がちょうどkk回起こるときの分布を求めましょう。失敗の数はxx回です。

したがって、条件として

  • 最後の試行はSSである
  • k+x1k + x - 1回の試行にはSSk1k - 1回、FFxx回ある

と言えます。

確率変数XXFFの数とすると、その分布は

f(x)=(k+x1k1)pkqx f(x) = \binom{k + x - 1}{k - 1} p^k q^x

が得られます。これが確率分布であるためにはx=0f(x)=1\sum_{x = 0}^{\infty} f(x) = 1を満たす必要があります。


ところでこの分布は二項分布ににています。二項分布は

f(x)=(nx)pxqnx f(x) = \binom{n}{x} p^x q^{n - x}

であり、試行回数nnを固定して、確率変数XXを成功SSの数として与えています。これが確率分布であることは二項定理から分かり、

x=0n(nx)pxqnx=(p+q)n=1 \sum_{x = 0}^{n} \binom{n}{x} p^x q^{n - x} = (p + q)^n = 1

です。

上記の二項定理はn,xNn, x \in \mathbb{N}を満たすものですが、負の二項分布はこれを拡張し、nRn \in \mathbb{R}まで許容するようにします。まず、組み合わせの数を次のように拡張します:

(αx)=α(α1)(αx+1)x!whereαR \binom{\alpha}{x} = \frac{ \alpha(\alpha - 1) \cdots (\alpha - x + 1) }{ x! } \quad\text{where}\quad \alpha \in \mathbb{R}

α=k\alpha = -kとすると、

(kx)=(k)(k1)(kx+1)x!=(1)xk(k+1)(k+x1)x!=(1)x(k+x1x)\begin{align*} \binom{-k}{x} &= \frac{ (-k)(-k - 1) \cdots (-k - x + 1) }{ x! }\\ &= (-1)^x \frac{ k(k + 1) \cdots (k + x - 1) }{ x! } \\ &= (-1)^x \binom{k + x - 1}{x} \end{align*}

です。よって(1+z)k(1 + z)^{-k}の展開は

(1z)k=x=0(kx)(z)x=x=0(1)x(k+x1x)(1)xzx=x=0(k+x1x)zx\begin{align*} (1 - z)^{-k} &= \sum_{x = 0}^{\infty} \binom{-k}{x} (-z)^x \\ &= \sum_{x = 0}^{\infty} (-1)^x \binom{k + x - 1}{x} (-1)^x z^x \\ &= \sum_{x = 0}^{\infty} \binom{k + x - 1}{x} z^x \tag{1} \end{align*}

となります。負に拡張しているので下限がなく、そのため無限和になります。

※もし正のままなら

nCx=n(n1)(nx+1)x! {}_n C_{x} = \frac{ n(n - 1) \cdots (n - x + 1) }{ x! }

で、n=x1n = x - 1のときに分子が00になります。有限和になりますが、いまnnが負になるので、(n1)(n2)(n-1)(n - 2)\cdotsをいくら伸ばしても、分子に00が現れることはありません。


さて、上記の負まで拡張した(1)(1)z=q=1pz = q = 1 - pを代入すると、

(1q)k=x=0(k+x1x)qxpk=x=0(k+x1x)qx1=x=0(k+x1x)pkqx\begin{align*} (1 - q)^{-k} &= \sum_{x = 0}^\infty \binom{k + x - 1}{x} q^x \\ \Leftrightarrow\quad p^{-k} &= \sum_{x = 0}^\infty \binom{k + x - 1}{x} q^x \\ \Leftrightarrow\quad 1 &= \sum_{x = 0}^\infty \binom{k + x - 1}{x} p^k q^x \\ \end{align*}

となります。よって、確かに確率分布の性質を満たすことがわかりました。

ついでに期待値・分散も

ゴリ押しで計算する方法

期待値を求めます。定義より

E[X]=x=0x(k+x1x)pkqx\begin{align*} E[X] &= \sum_{x = 0}^\infty x \cdot \binom{k + x - 1}{x} p^k q^x \\ \end{align*}

を計算します。二項分布とどうようにすればいいです。そこで組み合わせの恒等式を思い出します:

n(nm)=m(n1m1)\begin{align*} n \cdot \binom{n}{m} &= m \cdot\binom{n - 1}{m - 1} \end{align*}

これをx(k+x1x)x \cdot \binom{k + x - 1}{x}に適用すると

x(k+x1x)=(k+x1)(k+x2x1)\begin{align*} x \cdot \binom{k + x - 1}{x} &= (k + x - 1) \cdot \binom{k + x - 2}{x - 1} \end{align*}

となります。さらに自明な式

(mn)=mmn(m1n)\begin{align*} \binom{m}{n} = \frac{m}{m - n} \binom{m - 1}{n} \tag{2} \end{align*}

を適用すると

x(k+x1x)=(k+x1)(k+x2x1)=k(k+x1x1)\begin{align*} x \cdot \binom{k + x - 1}{x} &= (k + x - 1) \cdot \binom{k + x - 2}{x - 1} \\ &= k \cdot \binom{k + x - 1}{x - 1} \end{align*}

となります((2)(2)m=k+x1,n=x1m = k + x - 1, n = x - 1と対応させてください)。よって期待値は

E[X]=x=1x(k+x1x)pkqx=x=1k(k+x1x1)pkqx=kpkqy=0(k+yy)qy=kpkq1(1q)k+1=kqp\begin{align*} E[X] &= \sum_{x = 1}^\infty x \cdot \binom{k + x - 1}{x} p^k q^x \\ &= \sum_{x = 1}^\infty k \cdot \binom{k + x - 1}{x - 1} p^k q^x \\ &= k p^k q \sum_{y = 0}^\infty \binom{k + y}{y} q^y \\ &= k p^k q \cdot \frac{1}{(1 - q)^{k + 1}} \\ &= k \frac{q}{p} \end{align*}

となります。

分散も同様に計算します。まず2次のモーメントは

E[X2]=x=1x2(k+x1x)pkqx\begin{align*} E[X^2] &= \sum_{x = 1}^\infty x^2 \cdot \binom{k + x - 1}{x} p^k q^x \\ \end{align*}

です。ここで係数について

x(x1)(k+x1x)=(k+x1)!(x2)!(k1)!=k(k+1)(k+x1)!(x2)!(k+1)!=k(k+1)(k+x1x2)\begin{align*} x(x - 1) \binom{k + x - 1}{x} &= \frac{(k + x - 1)!}{(x - 2)!(k - 1)!} \\ &= k(k + 1) \frac{(k + x - 1)!}{(x - 2)!(k + 1)!} \\ &= k(k + 1) \binom{k + x - 1}{x - 2} \end{align*}

という恒等式が成り立つので、2次のモーメントの式に対して無理やりこの形を作ります。つまり

E[X2]=x=1x(x1)(k+x1x)pkqx+x=1x(k+x1x)pkqx \begin{align*} E[X^2] &= \sum_{x = 1}^\infty x(x - 1) \cdot \binom{k + x - 1}{x} p^k q^x + \sum_{x = 1}^\infty x \cdot \binom{k + x - 1}{x} p^k q^x \ \end{align*}

です。右辺第2項はE[X]E[X]なので右辺第1項を計算しましょう。

x=1x(x1)(k+x1x)pkqx=x=1k(k+1)(k+x1x2)pkqx=k(k+1)pkq2y=0(k+yy)qy=k(k+1)pkq21(1q)k+2=k(k+1)q2p2\begin{align*} \sum_{x = 1}^\infty x(x - 1) \cdot \binom{k + x - 1}{x} p^k q^x &= \sum_{x = 1}^\infty k(k + 1) \cdot \binom{k + x - 1}{x - 2} p^k q^x \\ &= k(k + 1) p^k q^2 \sum_{y = 0}^\infty \binom{k + y}{y} q^y \\ &= k(k + 1) p^k q^2 \cdot \frac{1}{(1 - q)^{k + 2}} \\ &= k(k + 1) \frac{q^2}{p^2} \end{align*}

と変形できます。よって、2次のモーメントがE[X2]=k(k+1)q2/p2+kq/pE[X^2] = k(k + 1)q^2/p^2 + kq/pと求まりました。分散の定義から

V[X]=E[X2](E[X])2=k(k+1)q2p2+kqp(kqp)2=k2q2p2+kq2p2+kqpk2q2p2=kq2+qpp2=kq(q+p)p2=kqp2\begin{align*} V[X] &= E[X^2] - (E[X])^2 \\ &= k(k + 1)\frac{q^2}{p^2} + k\frac{q}{p} - \left(\frac{kq}{p}\right)^2 \\ &= \cancel{k^2 \frac{q^2}{p^2}} + k \frac{q^2}{p^2} + k \frac{q}{p} - \cancel{k^2 \frac{q^2}{p^2}} \\ &= k \frac{q^2 + qp}{p^2} \\ &= k \frac{q(q + p)}{p^2} \\ &= k \frac{q}{p^2} \end{align*}

となります(p+q=1p + q = 1を用いています)。

モーメント母関数を用いて計算する方法

モーメント母関数とは5章ででてきたように

MX(t)=x=0etxf(x)\begin{align*} M_X(t) &= \sum_{x = 0}^\infty e^{tx} f(x) \\ \end{align*}

で与えられます(明らかにMX(0)=1M_X(0) = 1)。期待値・分散は

E[X]=MX(t)t=0V[X]=MX(t)t=0(MX(t)t=0)2\begin{align*} E[X] &= M_X^\prime(t) |_{t = 0} \\ V[X] &= M_X^{\prime\prime} (t) |_{t = 0} - (M_X^\prime(t) |_{t = 0})^2 \end{align*}

となりますが、対数を使うと計算が楽になります。具体的に計算すると

MX(t)=MX(t)ddtlogMX(t)\begin{align*} M_X^\prime (t) = M_X(t) \frac{\rm d}{\rm d t} \log M_X(t) \end{align*}

であることを使います。このとき分散は

V[X]=MX(t)t=0(MX(t)t=0)2=MX(t)t=02MX(t)(MX(t))2(MX(t))2=12ddt(MX(t)MX(t))=d2dt2(logMX(t))\begin{align} V[X] &= M_X^{\prime\prime} (t) |_{t = 0} - (M_X^\prime(t) |_{t = 0})^2 \notag \\ &= M_X (t)|_{t = 0}^2 \frac{ M_X^{\prime\prime} (t) - (M_X^\prime(t))^2 }{ (M_X(t))^2 } \notag \\ &= 1^2 \cdot \frac{\rm d}{\rm d t} \left( \frac{M_X^\prime(t)}{M_X(t)} \right) \notag \\ &= \frac{{\rm d}^2}{\rm d t^2} \left( \log M_X(t) \right) \end{align}

のようにモーメント母関数に対数をとって2階微分し、t=0t = 0を置いただけになります。あとは機械的に計算します。まずモーメント母関数の対数の微分は

logMX(t)=k(logplog(1qet))\begin{align*} \log M_X(t) &= k (\log p - \log (1 - q e^t)) \end{align*}

です。ttで微分して

ddtlogMX(t)=kqet1qet\begin{align} \frac{{\rm d}}{\rm d t} \log M_X(t) &= k \frac{q e^t}{1 - q e^t} \end{align}

なので、

E[X]=MX(0)kq1q=kqp E[X] = M_X(0) \cdot k \frac{q}{1 - q} = k \frac{q}{p}

と期待値が求まりました。

分散も同様に計算します:

d2dt2logMX(t)=kqet(1qet)+q2e2t(1qet)2=kqet(1qet)2\begin{align*} \frac{{\rm d}^2}{\rm d t^2} \log M_X(t) &= k \frac{q e^t (1 - q e^t) + q^2 e^{2t}}{(1 - q e^t)^2} \\ &= k \frac{q e^t}{(1 - q e^t)^2} \end{align*}

よって、

V[X]=kqet(1qet)2t=0=kqp2 V[X] = k \frac{q e^t}{(1 - q e^t)^2} \bigg|_{t = 0} = k \frac{q}{p^2}

と分散が求まりました。

Footnotes

  1. 統計学入門 東京大学教養学部統計学教室編 東京大学出版会

戻る