卜瓦松分布
機率質量函數 ![Plot of the Poisson PMF](//upload.wikimedia.org/wikipedia/commons/thumb/1/16/Poisson_pmf.svg/325px-Poisson_pmf.svg.png) 橫軸是索引k,發生次數。該函數只定義在k為整數的時候。連接線是只為了指導視覺。 |
累積分布函數 ![Plot of the Poisson CDF](//upload.wikimedia.org/wikipedia/commons/thumb/7/7c/Poisson_cdf.svg/325px-Poisson_cdf.svg.png) 橫軸是索引k,發生次數。CDF在整數k處不連續,且在其他任何地方都是水平的,因為服從卜瓦松分布的變量只針對整數值。 |
母數 |
λ > 0(實數) |
---|
值域 |
![{\displaystyle k\in \{0,1,2,3,\cdots \}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/77041f9a13eec19454afc554b18a3eda277217cf) |
---|
機率質量函數 |
![{\displaystyle {\frac {\lambda ^{k}}{k!}}e^{-\lambda }}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b81f4aab48b2869702242435d79ac5a6328d0aa7) |
---|
累積分布函數 |
,或 ,或
(對於 ,其中 是不完全Γ函數, 是高斯符號,Q是規則化Γ函數) |
---|
期望值 |
![{\displaystyle \lambda }](https://wikimedia.org/api/rest_v1/media/math/render/svg/b43d0ea3c9c025af1be9128e62a18fa74bedda2a) |
---|
中位數 |
![{\displaystyle \approx \lfloor \lambda +1/3-0.02/\lambda \rfloor }](https://wikimedia.org/api/rest_v1/media/math/render/svg/22b95cfadaa84099335d94c72adc9ec23bd62222) |
---|
眾數 |
![{\displaystyle \lceil \lambda \rceil -1,\lfloor \lambda \rfloor }](https://wikimedia.org/api/rest_v1/media/math/render/svg/6f43b2707041c373a53f00a3c51b5b2274b6fb84) |
---|
變異數 |
![{\displaystyle \lambda }](https://wikimedia.org/api/rest_v1/media/math/render/svg/b43d0ea3c9c025af1be9128e62a18fa74bedda2a) |
---|
偏度 |
![{\displaystyle \lambda ^{-1/2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/33cd186b688213575b20bf875991fadad5c8e5cb) |
---|
峰度 |
![{\displaystyle \lambda ^{-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4e339fe3b3bd9b9883154cd2d5363f3ecf4ef7e8) |
---|
熵 |
(假設 較大)
![{\displaystyle {\frac {1}{2}}\log(2\pi e\lambda )-{\frac {1}{12\lambda }}-{\frac {1}{24\lambda ^{2}}}-}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6a58789fda1663a8333f73ca627af71b1c27d46f)
![{\displaystyle \qquad {\frac {19}{360\lambda ^{3}}}+O\left({\frac {1}{\lambda ^{4}}}\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8aaa1fbebdbf32f877eba1d8d7f37822ce31a78d) |
---|
動差母函數 |
![{\displaystyle \exp(\lambda (e^{t}-1))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/89aa29f1044f37cb972bb329b3e2eec04028a540) |
---|
特徵函數 |
![{\displaystyle \exp(\lambda (e^{it}-1))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/57b58c6c531bc1b523760f6c5387bd030870192e) |
---|
機率母函數 |
![{\displaystyle \exp(\lambda (z-1))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b01567be4aba31c7b69fa418341eac5992810c61) |
---|
卜瓦松分布(法語:loi de Poisson;英語:Poisson distribution)又稱Poisson分布、泊松分布、布瓦松分布、布阿松分布、普阿松分布、波以松分布、卜氏分布、帕松小數法則(Poisson law of small numbers),是一種統計與機率學裡常見到的離散機率分布,由法國數學家西莫恩·德尼·卜瓦松在1838年時發表。
卜瓦松分布適合於描述單位時間內隨機事件發生的次數的機率分布。如某一服務設施在一定時間內受到的服務請求的次數,電話交換機接到呼叫的次數、汽車站台的候客人數、機器出現的故障數、自然災害發生的次數、DNA序列的變異數、放射性原子核的衰變數、雷射的光子數分布等等。(單位時間內發生的次數,可以看作事件發生的頻率,類似物理的頻率
)。
卜瓦松分布的機率質量函數為:
![{\displaystyle P(X=k)={\frac {e^{-\lambda }\lambda ^{k}}{k!}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2f4eb63a8e6d46d0f7c642426ca59531507c5a9e)
卜瓦松分布的母數
是隨機事件發生次數的數學期望值。
若
服從母數為
的卜瓦松分布,記為
,或記為
.
1、服從卜瓦松分布的隨機變數,其數學期望值與變異數相等,同為母數
:
2、兩個獨立且服從卜瓦松分布的隨機變數,其和仍然服從卜瓦松分布。更精確地說,若
且
,則
。反過來若兩個獨立隨機變數的和服從卜瓦松分布,則這兩個隨機變數經平移後皆服從卜瓦松分布(Raikov定理)。
3、其動差母函數為:
![{\displaystyle M_{X}(t)=E[e^{tX}]=\sum _{x=0}^{\infty }e^{tx}{\frac {e^{-\lambda }\lambda ^{x}}{x!}}=e^{-\lambda }\sum _{x=0}^{\infty }{\frac {({e^{t}}\lambda )^{x}}{x!}}=e^{{\lambda }(e^{t}-1)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/07027a2d97d52986d99b0a73c00430e95cdbdc8a)
期望值:(倒數第三至第二是使用泰勒展開式)
我們可以得到:
如同性質:
、![{\displaystyle \sigma _{X}={\sqrt {\lambda }}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a9121e61137899815e3f4d9ec8c57082239fed52)
相互獨立的卜瓦松分布隨機變數之和仍服從卜瓦松分布:
卜瓦松分布的來源(卜瓦松小數定律)[編輯]
在二項分布的伯努利試驗中,如果試驗次數
很大,二項分布的機率
很小,且乘積
比較適中,則事件出現的次數的機率可以用卜瓦松分布來逼近。事實上,二項分布可以看作卜瓦松分布在離散時間上的對應物。
證明如下。首先,回顧自然對數
的定義:
![{\displaystyle \lim _{n\to \infty }\left(1-{\lambda \over n}\right)^{n}=e^{-\lambda },}](https://wikimedia.org/api/rest_v1/media/math/render/svg/163448ac05b0672de07336945cf8c0e8fbcbf508)
二項分布的定義:
。
如果令
,
趨於無窮時
的極限:
![{\displaystyle {\begin{aligned}\lim _{n\to \infty }P(X=k)&=\lim _{n\to \infty }{n \choose k}p^{k}(1-p)^{n-k}\\&=\lim _{n\to \infty }{n! \over (n-k)!k!}\left({\lambda \over n}\right)^{k}\left(1-{\lambda \over n}\right)^{n-k}\\&=\lim _{n\to \infty }\underbrace {\left[{\frac {n!}{n^{k}\left(n-k\right)!}}\right]} _{F}\left({\frac {\lambda ^{k}}{k!}}\right)\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{n}} _{\to \exp \left(-\lambda \right)}\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{-k}} _{\to 1}\\&=\lim _{n\to \infty }\underbrace {\left[\left(1-{\frac {1}{n}}\right)\left(1-{\frac {2}{n}}\right)\ldots \left(1-{\frac {k-1}{n}}\right)\right]} _{\to 1}\left({\frac {\lambda ^{k}}{k!}}\right)\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{n}} _{\to \exp \left(-\lambda \right)}\underbrace {\left(1-{\frac {\lambda }{n}}\right)^{-k}} _{\to 1}\\&=\left({\frac {\lambda ^{k}}{k!}}\right)\exp \left(-\lambda \right)\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7f3305a795ed8b2ce32f86487f67b44ecd5f69cb)
最大概似估計(MLE)[編輯]
給定
個樣本值
,希望得到從中推測出母體的卜瓦松分布母數
的估計。為計算最大概似估計值,列出對數概似函數:
![{\displaystyle {\begin{aligned}L(\lambda )&=\ln \prod _{i=1}^{n}f(k_{i}\mid \lambda )\\&=\sum _{i=1}^{n}\ln \!\left({\frac {e^{-\lambda }\lambda ^{k_{i}}}{k_{i}!}}\right)\\&=-n\lambda +\left(\sum _{i=1}^{n}k_{i}\right)\ln(\lambda )-\sum _{i=1}^{n}\ln(k_{i}!).\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/406c6e512f74692ff5a86579af21d2f46c2cab1c)
![{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} \lambda }}L(\lambda )=0\iff -n+\left(\sum _{i=1}^{n}k_{i}\right){\frac {1}{\lambda }}=0.\!}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9ce01a85623abce292e5cdbabb4490ce7e13fb6a)
解得λ從而得到一個駐點(stationary point):
![{\displaystyle {\widehat {\lambda }}_{\mathrm {MLE} }={\frac {1}{n}}\sum _{i=1}^{n}k_{i}.\!}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4227bbed2a2ba86a54bc4fd5171e8cffa1f74dbd)
檢查函數
的二階導數,發現對所有的
與
大於零的情況二階導數都為負。因此求得的駐點是對數概似函數
的極大值點:
![{\displaystyle {\frac {\partial ^{2}L}{\partial \lambda ^{2}}}=\sum _{i=1}^{n}-\lambda ^{-2}k_{i}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2acec1e90044897cf4e27c9d411dde884d4ee6cc)
對某公共汽車站的客流做調查,統計了某天上午10:30到11:47來到候車的乘客情況。假定來到候車的乘客各批(每批可以是1人也可以是多人)是互相獨立發生的。觀察每20秒區間來到候車的乘客批次,共觀察77分鐘*3=231次,共得到230個觀察記錄。其中來到0批、1批、2批、3批、4批及4批以上的觀察記錄分別是100次、81次、34次、9次、6次。使用極大似真估計(MLE),得到
的估計為
。
生成卜瓦松分布的隨機變數[編輯]
一個用來生成隨機卜瓦松分布的數字(偽隨機數抽樣)的簡單算法,已經由高德納給出(見下文參考):
algorithm poisson random number (Knuth):
init:
Let L ← e−λ, k ← 0 and p ← 1.
do:
k ← k + 1.
Generate uniform random number u in [0,1] and let p ← p×u.
while p > L.
return k − 1.
儘管簡單,但複雜度是線性的,在返回的值
,平均是
。還有許多其他算法來克服這一點。有些人由Ahrens和Dieter給出,請參閱下面的參考資料。同樣,對於較大的
值,
可能導致數值穩定性問題。對於較大
值的一種解決方案是拒絕採樣,另一種是採用卜瓦松分布的高斯近似。
對於很小的
值,逆轉換取樣簡單而且高效,每個樣本只需要一個均勻隨機數u。直到有超過
的樣本,才需要檢查累積機率。
algorithm Poisson generator based upon the inversion by sequential search:[1]
init:
Let x ← 0, p ← e−λ, s ← p.
Generate uniform random number u in [0,1].
do:
x ← x + 1.
p ← p * λ / x.
s ← s + p.
while u > s.
return x.
參考文獻[編輯]
- Guerriero V. Power Law Distribution: Method of Multi-scale Inferential Statistics. Journal of Modern Mathematics Frontier (JMMF). 2012, 1: 21–28 [2017-10-30]. (原始內容存檔於2018-02-21).
- Joachim H. Ahrens, Ulrich Dieter. Computer Methods for Sampling from Gamma, Beta, Poisson and Binomial Distributions. Computing. 1974, 12 (3): 223–246. doi:10.1007/BF02293108.
- Joachim H. Ahrens, Ulrich Dieter. Computer Generation of Poisson Deviates. ACM Transactions on Mathematical Software. 1982, 8 (2): 163–179. doi:10.1145/355993.355997.
- Ronald J. Evans, J. Boersma, N. M. Blachman, A. A. Jagers. The Entropy of a Poisson Distribution: Problem 87-6. SIAM Review. 1988, 30 (2): 314–317. doi:10.1137/1030059.
- Donald E. Knuth. Seminumerical Algorithms. The Art of Computer Programming. Volume 2. Addison Wesley. 1969.