這篇文章主要講解了“Python怎么實現(xiàn)中心極限定律”,文中的講解內(nèi)容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“Python怎么實現(xiàn)中心極限定律”吧!
創(chuàng)新互聯(lián)專注于陜州企業(yè)網(wǎng)站建設,響應式網(wǎng)站建設,電子商務商城網(wǎng)站建設。陜州網(wǎng)站建設公司,為陜州等地區(qū)提供建站服務。全流程定制設計,專業(yè)設計,全程項目跟蹤,創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務在整個概率論中,核心的問題是隨機變量的分布。正如我們在 離散分布和 連續(xù)分布中看到的,分布有許多種類。更夸張的是,在滿足 概率公理的前提下,我們完全可以自行設計分布。想像一下,如果有一天數(shù)學書上印一個Vamei分布,這是多么美好的事情??!然而,這一愿望并不那么容易實現(xiàn)。那些“名流”分布,比如“泊松”,“高斯”,“伯努利”分布,往往在理論上很重要,所以得到了數(shù)學家的深入研究。“知名”分布的特性(比如它們的期望、方差、累計概率函數(shù))可以很容易在數(shù)學手冊中找到,這些研究成果也成為概率論“軍火庫”的重要部分。
另一方面,概率分布是否存在什么共性呢?我們的許多結論都是依賴于分布的具體類型。對于一個分布成立的結論,對于另一種分布可能并不成立。一個對任意分布都成立的結論可以大大簡化我們的研究。這在自然科學和社會科學的研究中異常重要。在這些學科的研究中有許多隨機變量。比如說,為了研究金礦,往往需要知道石頭中含金量X的概率分布。然而,這些隨機變量的分布類型不可能提前獲知 (甚至于永遠不能準確的知道)。這樣的話,整個研究就被停在了第一步。如果我們可以得出一個對任意分布都成立的結論,那么我們就可以沿著這個結論繼續(xù)進行下去。
自然有時候比我們想像的慷慨,它給出了一個概率論中相當核心的一組定律:中心極限定律(central limit theorem)。這組定律不但對于任意分布都成立,還特別提示我們:要特別注意正態(tài)分布。我們下面看看,中心極限定律是如何說的。
先來看中心極限定律的一個版本:
隨機變量X1,X2,...,XnX1,X2,...,Xn是相互獨立的隨機變量,并有相同的分布(IID, independent and identically distributed)。分布的期望為μμ,方差為σ2σ2,μ,σμ,σ都為有限值,且σ≠0σ≠0。這些隨機變量的均值為Xˉ=1n∑ni=1XiXˉ=1n∑i=1nXi。讓ζn=Xˉ?μσ/n√ζn=Xˉ?μσ/n,那么
limn→∞P(ζn≤z)=Φ(z)limn→∞P(ζn≤z)=Φ(z)
其中Φ(z)Φ(z)是標準正態(tài)分布的分布函數(shù)。
簡單來說,我們尋找n個IID隨機變量的均值XˉXˉ。當n趨進無窮時,這個均值(一個新的隨機變量)趨近一個正態(tài)分布。
(通過ζnζn的變換,可以從正態(tài)分布的XˉXˉ導出標準正態(tài)分布ζnζn。)
我們下面取n個IID隨機變量,讓它們都符合λ=1λ=1的指數(shù)分布,并觀察它們均值的分布狀況。為了觀察它們的分布,我們使用隨機數(shù)生成器,來進行10000次采樣。即進行100000次實驗,每次實驗獲得一組隨機變量的取值,得到一個均值??偣搏@得10000個均值。繪制均值分布的直方圖。
分三種情況,分別讓n等于1,20, 100:
在第一種情況下,Xˉ=X1/1=X1Xˉ=X1/1=X1,即XˉXˉ本身是指數(shù)分布。
在第二、三種情況下,均值的分布越來越偏離一個指數(shù)分布,分布的形狀不斷趨近于一個正態(tài)分布。
代碼如下:
# By Vamei # Central Limit Theory # X is exponential distribution with lambda = 1 import matplotlib.pyplot as pltimport numpy as npfrom scipy.stats import expon# Get one sample of (X1 + X2 + ... + XN)/N def sample_mean(N): # exponential distribution, with lambda = 1 one_sample = expon.rvs(scale = 1, size = N) return one_sample.mean()# Increase N: 1, 20 , 1000. # Demo of Central Limit Theory in histogramplt.figure(figsize=(12, 4))for N, subp in zip([1, 20, 1000], [131, 132, 133]): # generate samples all_means = np.array([sample_mean(N) for i in range(10000)]) # plot figure plt.subplot(subp) plt.hist(all_means,bins=100,color="blue") plt.title('Central Limit Theory n=%i' % N) plt.xlabel('sample means') plt.ylabel('Frequency') plt.tight_layout() plt.savefig('./central_limit.png', dpi=None, facecolor='w')
練習:這段代碼檢驗的是指數(shù)分布的均值??梢愿膶懗蓹z驗其它分布是否符合中心極限定律,比如均勻分布的均值。
我將使用矩生成函數(shù)來證明上面的定律。假設Xi?μXi?μ的矩生成函數(shù)為M(t)M(t)。因此,M′(t)=μ,M(2)(t)=σ2M′(t)=μ,M(2)(t)=σ2。
當n趨近無窮時,t/(σn??√)t/(σn)趨近0。M(t)可以展開為:
M(t)=1+12σ2t2+o(t2)M(t)=1+12σ2t2+o(t2)
o(t2)o(t2)表示比t2t2更高階的t的乘方。
根據(jù)矩生成函數(shù)的性質,ζnζn的矩生成函數(shù)寫為
Mζn=[M(tσn??√)]n=(1+t22n+o(t2/n))nMζn=[M(tσn)]n=(1+t22n+o(t2/n))n
o(t2/n)o(t2/n)表示,當n趨于無窮時,早于t2/nt2/n消失的項。
(根據(jù)微積分,證明從略):當n趨近于無窮時,上面的表達式趨近:
Mζn(t)→et2/2Mζn(t)→et2/2
這正是標準正態(tài)分布的矩生成函數(shù)。因此ZnZn的分布趨近于標準正態(tài)分布。
上面介紹的中心極限定律有一個先決條件,即產(chǎn)生均值的N個隨機變量為IID(獨立、同分布)隨機變量。在其它的版本的中心極限定律中,各個隨機變量可以不完全獨立。事實上,中心極限定律是一個還在積極研究中的領域。
中心極限定律的原型可以追溯到18世紀de Moivre的研究。他經(jīng)過實驗發(fā)現(xiàn),大量正面拋硬幣的話,結果(1:正面,0:反面)的均值是一個正態(tài)分布。這里,de Moivre研究的分布是多個伯努利分布的隨機變量的均值。
硬幣投擲:均值的分布
(想像一下,當時沒有計算機,更別說隨機數(shù)生成器了。為了檢驗結果,de Moivre真的投了幾千次硬幣…… 數(shù)學家是很神奇的動物)
為了更加直觀的理解中心極限定律的結果。我們來設想一下,如果一個大米缸中混裝了黑白兩種米,各占一半。從中隨便抓一把,這一把中有n個米粒。如果n比較小的話,那么很有可能出現(xiàn)一些極端值,比如n = 3,出現(xiàn)三個純白的米粒。但是,如果“一把”很大,比如1000顆米粒,那么出現(xiàn)1000個米都是白色的概率很小,而白米和黑米一半一半的概率很大,也就是一個類似于正態(tài)分布的分布方式。
我們可以將中心極限定律方便的用于許多統(tǒng)計問題。需要注意的是,中心極限定律要求n趨近無窮。在實際應用中,我們往往讓n等于一個“足夠”大的數(shù),比如上面的1000。這個數(shù)字是否足夠大呢?這取決于X是什么樣的分布。對于某些分布來說,均值分布趨近于正態(tài)分布的速度很慢,這要求我們采用更大的n值。
感謝各位的閱讀,以上就是“Python怎么實現(xiàn)中心極限定律”的內(nèi)容了,經(jīng)過本文的學習后,相信大家對Python怎么實現(xiàn)中心極限定律這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關知識點的文章,歡迎關注!
網(wǎng)頁標題:Python怎么實現(xiàn)中心極限定律-創(chuàng)新互聯(lián)
標題URL:http://aaarwkj.com/article30/jedpo.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供域名注冊、移動網(wǎng)站建設、服務器托管、做網(wǎng)站、網(wǎng)站維護、網(wǎng)站策劃
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)