【確率統計基礎】ポアソン分布を二項分布から導出する

データサイエンス

2022.10.23 2022.10.20

スポンサーリンク

目次

1 はじめに
2 ポアソン分布について
3 二項分布からポアソン分布を導出する
4 まとめ

スポンサーリンク

目次

はじめに
ポアソン分布について
二項分布からポアソン分布を導出する
まとめ

はじめに

どーも、将棋と筋トレが好きな学生エンジニアのゆうき(@engieerblog_Yu)です。

今回はデータサイエンスに必要な統計、ポアソン分布編ということで前回の続きとなる内容です！

二項分布について怪しい方は合わせてどうぞ。

【確率統計の基礎】ベルヌーイ試行から二項分布を導く

初めにどーも、将棋と筋トレが好きな学生エンジニアのゆうき(@engieerblog_Yu)です。今回から、データサイエンスに必要な確率統計の記事を書いていきたいと思います。確率統計の基本から実践的な内容まで盛りだく...

ポアソン分布について

ポアソン分布の目的は、ある期間に事象がどれくらい発生するか？ということです。

例えば

1日にメールが何通届くか？

蛍は10秒間に何回光るか？

台風は1年に何回発生するか？

などのようなことです。

ポアソン分布は、平均値μとすると、以下のような式で表すことができます。

\(P_p(x)=\frac{μ^x}{x!}e^{-μ}\)

\(x=(0,1・・∞)\)

ポアソン分布は、前回まとめた二項分布と同じく離散的確率分布です。

グラフで表すと以下のようになります。

xは事象が発生する回数ですので、必ず正の整数です。

確率が高い部分ほど、たくさん出て確率が低い部分ほどあんまり出ないということになります。

例えば一日にメールが来る平均が４件で、ポアソン分布に従うとすると、1日に来るメールの件数は大体４件で、100件や0件である確率は比較的小さいということになります。

それではポアソン分布を、二項分布から導出していこうと思います。

二項分布からポアソン分布を導出する

二項分布でポアソン分布を導出してみます。

二項分布の確率分布は、以下の式で表されると前回まとめました。

\(P_b(x)={}_n C_x(p)^{x}(1-p)^{n-x}\)

二項分布の期待値はμ=npと表されましたが、μを一定に保ちながらn→∞、p→0にするとポアソン分布となります。

それでは上記の式と条件から式を変形していきます。

\({}_n C_x(p)^{x}(1-p)^{n-x}\)

\(=\frac{n!}{x!(n-x)!}(\frac{μ}{n})^x(1-\frac{μ}{n})^{n-x}\)

\(=\frac{n(n-1)(n-2)・・(n-x+1)}{x!}(\frac{μ^x}{n^x})(1-\frac{μ}{n})^{n}(1-\frac{μ}{n})^{-x}\)

\(=\frac{n^x(1-\frac{1}{n})(1-\frac{2}{n})・・(1-\frac{x}{n}+\frac{1}{n})}{x!}(\frac{μ^x}{n^x})(1-\frac{μ}{n})^{n}(1-\frac{μ}{n})^{-x}\)

\(=\frac{(1-\frac{1}{n})(1-\frac{2}{n})・・(1-\frac{x}{n}+\frac{1}{n})}{x!}(μ^x)(1-\frac{μ}{n})^{n}(1-\frac{μ}{n})^{-x}\)ー①

ここで

\(-\frac{μ}{n}=h\)とおくと

\((1-\frac{μ}{n})^{n}\)

\(=((1+h)^h)^{-μ})\)

となり、n→∞でh→0となるので

\(=e^{-μ}\)となります。

よって①をn→∞としたものは

\(=\frac{μ^x}{x!}e^{-μ}\)

となります。

これは先ほどのポアソン分布の確率分布の式と一致します。

またポアソン分布の期待値と分散は、ともにμとなります。

まとめ

ポアソン分布は、二項分布の期待値μを一定に保つという条件下でn→∞、p→0にすることで導出できる

ポアソン分布は離散型確率分布であり、以下の式で表される

\(P_p(x)=\frac{μ^x}{x!}e^{-μ}\)

\(x=(0,1・・∞)\)

今回はデータサイエンスに用いる統計二回目として、二項分布からポアソン分布を導出していきました。

次回は、分布の中で最も有名な正規分布について、まとめていきたいと思います。

統計で最も重要な正規分布を二項分布から導出する

はじめにどーも、将棋と筋トレが好きな学生エンジニアのゆうき(@engieerblog_Yu)です。今回はデータサイエンスに必要な統計編3回目にして、最も重要となる正規分布について解説していきたいと思います！過去の二...

ゆうき

ゆうき

最後まで読んでいただきありがとうございました。

ねこすけ

ねこすけ

他にもいろんな記事があるにゃ。

当ブログのデータサイエンスおすすめ記事を目的別にまとめました

どーも、学生エンジニアのゆうき(@engieerblog_Yu)です。今回は当ブログで、データサイエンスを勉強したい方に向けて、おすすめ記事をまとめました！あなたの目的に沿った記事が見つかれば幸いです。データサイエ...

データサイエンティストを本気で目指す大学生におすすめスクール3選

どーも、学生エンジニアのゆうき(@engineerblog_Yu)です。突然ですが、データサイエンティストになりたい、データサイエンスに興味がある大学生の方で、こう思っている方はいませんか？何から勉強していいかわからない...

【CIFAR-10】ニューラルネットワークで画像分類に取り組んでみる(PyTorch)

初めにどーも、将棋と筋トレが好きな学生エンジニアのゆうき(@engieerblog_Yu)です。今回は、PyTorchを使って、CIFAR-10の画像分類をやっていこうと思います。今回は、Google Colabo...

コメント

タイトルとURLをコピーしました