【原】概率論22講：怎么提高自己的概率思維

宗子說 2021-04-28

展開全文

01.全局：從局部隨機性到整體確定性

把局部的隨機性轉(zhuǎn)變?yōu)檎w的確定性，是概率論解決問題的本質(zhì)
概率論不是用來預(yù)測未來，也不是對一次偶然的結(jié)果進行計算，它是更高層次的、確定性的認知
概率論的大廈像什么？我更愿意說：概率論不是一棟建筑，而是一個城市。我可以不知道城市里每一棟建筑的樣子，但我確定地知道這個城市的建筑模式。

01

“上帝”在擲骰子

02.隨機：隨機性不等于不確定性

隨機性不等于不確定性。概率論研究的是隨機性，而不是不確定性。隨機性是這個事件可能出現(xiàn)的結(jié)果我都知道，只是不知道下一次會出現(xiàn)哪個結(jié)果，而不確定性，是我連可能出現(xiàn)結(jié)果的選項都不知道
隨機分真?zhèn)?，絕對意義上的真隨機存在于量子層面，現(xiàn)實中很難遇到；偽隨機只是披著隨機的外衣，它本身是有規(guī)律的；而我們現(xiàn)實中遇到的大部分現(xiàn)象，都是效果隨機（感覺到它的效果是隨機的），這也是概率論這門學(xué)科研究的重點。
隨機是這個世界的決定性力量，了解隨機，你才會懂得隨機的力量，才會更好地利用隨機做出正確決策（如轉(zhuǎn)基因農(nóng)作物）

03.概率：對世界可能性的度量

任何你關(guān)心的事情，只要設(shè)定一個條件，從可能性的角度出發(fā)，對某一個發(fā)生結(jié)果進行陳述，就可以轉(zhuǎn)化成隨機事件，然后度量概率。

概率是隨機事件發(fā)生可能性大小的定量描述
概率是隨機事件在樣本空間的比率:隨機事件就是樣本空間的一個子集；反過來也成立，樣本空間里的每一個子集，也都是一個隨機事件?！半S機事件”和“樣本空間”就是子集和全集的關(guān)系。而子集和全集的比率，也就是隨機事件占樣本空間的比率，就是這個隨機事件發(fā)生的概率
樣本空間的完備性是一個幽靈。從某種角度來說，我們對世界的認識，就是對樣本空間完備性的認識。如果樣本空間不完備，我們計算的概率就會有偏差，決策就會出錯。

04.獨立性：隨機事件的相互關(guān)系

如果一個隨機事件發(fā)生的結(jié)果，不會影響另一個隨機事件的概率，那它們就是互相獨立的事件，反之就是非獨立事件
只有明白了隨機事件之間的關(guān)系，判斷它們是否具有獨立性，才能正確分析和度量它的概率
很多看似獨立的事件，其實都是互有聯(lián)系、互相影響的。評估隨機事件的概率時，對獨立事件的設(shè)定需要格外謹慎。

05.概率計算：定義問題比計算更重要

概率計算的三個法則:

“排列組合法則”:排列組合法則適用于結(jié)果有限，而且每種結(jié)果都是等可能性的情況——這個隨機事件出現(xiàn)的次數(shù)除以所有可能的結(jié)果的個數(shù)
“加法法則”:針對多個隨機事件，這些隨機事件發(fā)生的概率加和
“乘法法則”:針對多個隨機事件同時發(fā)生的概率

大部分人不會做概率題，不是因為不會計算，而是因為沒有看明白題目。概率計算之所以復(fù)雜，是因為很難將現(xiàn)實問題準確的抽象成“對”的概率問題。準確的翻譯現(xiàn)實問題，就是概率思維的核心，也是概率計算最復(fù)雜的地方

02

偷看“上帝”的安排

06.概率度量：建立整體確定性的三種方式

定義法：是一種等概率的設(shè)定，來源于自然界對稱性的假設(shè)，是一種宏觀尺度下的合理簡化【拋硬幣正面朝上和反面朝上的概率相等，都是50%；一個標準的子，拋出每個點數(shù)的概率也相等，都是 1/6。這些概率，都是我們直接定義的?！?/span>
頻率法：是通過隨機事件發(fā)生的頻率來估算概率，要求試驗或數(shù)據(jù)盡可能的多
迭代法：強調(diào)不斷迭代，可以在小規(guī)模數(shù)據(jù)下，針對事件的變化和個體的差異度量概率。先利用手頭少量的數(shù)據(jù)做推測，甚至是主觀猜測一件事兒的概率，然后再通過收集來的新數(shù)據(jù)，不斷調(diào)整對這件事概率的估算。最常用的方法就叫作“貝葉斯”

三種方法并不是涇渭分明，而是常常融合使用，一起更清晰和全面地認識這個世界。頻率法可以驗證定義法的正確性；迭代法也可以用定義法或者頻率法來獲得最初的判斷；頻率法和迭代法，又可以同時使用，相互驗證。打個比方來說，這三種方法，就好比工具箱里的三把尺子，共同對概率進行度量。這也是概率論和很多學(xué)科不一樣的地方。

07.頻率法：概率是對發(fā)生頻率的計算

頻率法認為，概率就是對發(fā)生頻率的計算，只要試驗數(shù)量或者觀測數(shù)據(jù)足夠多，隨機事件發(fā)生的頻率就會接近它的概率。比如歷史上的拋硬幣試驗

大數(shù)定律不是基于試驗的歸納，而是經(jīng)過了嚴格的數(shù)學(xué)證明，證明了用頻率度量概率是合理的。

現(xiàn)實中使用頻率法，往往無法獲得無限多的數(shù)據(jù)，所以需要增加一些限制條件（精度誤差和置信度），來降低需要是數(shù)據(jù)量，比如常用的是95%的置信度和2%的精度誤差。

08.大數(shù)定律：局部頻率不是整體概率

大數(shù)定律被稱為“黃金定理”，它讓我們真正能用整體的確定性來對抗局部的隨機性

但現(xiàn)實中遇到的問題都是局部頻率，局部頻率不是整體概率，和真實的整體概率之間會存在差值

這個差值不需要通過補償對局部產(chǎn)生作用（也就是說拋硬幣連續(xù)拋出10次正面下一次是反面的概率還是50%），大數(shù)定律不需要靠補償來實現(xiàn)，而是通過均值回歸，用大量的正常數(shù)據(jù)淡化，削弱不正常數(shù)據(jù)的影響

【可以這樣理解，整體概率就像大海，現(xiàn)實的情況就像一勺糖，放在水杯中你會覺得很甜，但倒進大海里，對大海的味道影響幾乎沒有，真實的情況和能跟整體的概率相差很遠，但概率還是沒有變化，而且真實情況也不會一直跟這個概率偏離，會有回歸均值的趨勢，可是我們永遠沒法知道是在什么時候回歸，但如果一直不回歸，我們也有理由認為這個真實情況里面可能有貓膩，比如硬幣一邊是否更重了】

09.數(shù)學(xué)期望：對隨機事件長期價值的衡量

數(shù)學(xué)期望是對隨機事件長期價值的數(shù)字化衡量，是判斷一件事情值不值得做的整體定量化指標

計算數(shù)學(xué)期望要把所有的隨機結(jié)果數(shù)值化，只有賦予每個結(jié)果一個具體的值，才能進行數(shù)學(xué)期望的計算

對于同一個結(jié)果，個體的數(shù)學(xué)期望也可能是不一樣的，具體計算結(jié)果需要加入自己對價值的主觀考量（比如人的生命）

10.方差：圍繞數(shù)學(xué)期望波動程度的度量

判斷兩個隨機事件是否相似，除了比較數(shù)學(xué)期望之外，還需要比較方差，兩者共同構(gòu)成了對隨機事件最基本的描述
方差是描述隨機結(jié)果圍繞期望波動范圍的指標，方差越大，波動越大，也意味著風險越大
現(xiàn)實生活中，我們可以通過減少方差對抗波動性【增大本金增大數(shù)據(jù)量】，也可以通過增大方差利用波動性【彩票頭獎的巨額獎金吸引】

03

收集“上帝”的骰子

11.概率分布：認識現(xiàn)實世界的數(shù)學(xué)模型

隨機變量所有的結(jié)果和每個結(jié)果出現(xiàn)的概率一一對應(yīng)，就構(gòu)成了概率分布，概率分布讓我們擁有上帝之眼，獲得對一個隨機事件的整體認知
概率分布模型是我們對現(xiàn)實規(guī)律的抽象，正態(tài)分布，冪律分布都是這樣的模型，分別代表一種概率分布的規(guī)律
如果概率分布是一個解決問題的工具箱，概率分布模型就是工具箱里的一個個工具，數(shù)學(xué)家不斷豐富工具箱的工具幫助我們逼近真理

【就像《模型思維》里的思想】

12.正態(tài)分布：最簡單卻最重要的概率分布

均值就是期望，所以正態(tài)分布的平均值才有意義
數(shù)據(jù)集中在均值附近，極端值很少，且對均值影響很小
標準差決定胖瘦，從曲線的彎曲程度能看出隨機變量的波動

【就像運動比賽的正態(tài)分布，專業(yè)選手的標準差很小，均值很大；業(yè)務(wù)選手標準差很大，均值小一點】

13.中心極限定理：正態(tài)分布是概率分布的神

合法性：中心極限定理通過嚴格的數(shù)學(xué)推導(dǎo)，證明了正態(tài)分布的正確性【中心極限定理就像青藏高原，正態(tài)分布就是喜馬拉雅山】
正統(tǒng)性：在所有的分布中，正態(tài)分布是統(tǒng)計學(xué)家的首選，它建立了一套穩(wěn)定的秩序，像參照系一樣對所有事情施加影響
主宰性：正態(tài)分布不僅在現(xiàn)實世界普遍存在，所有的分布不斷疊加最后也都會變成正態(tài)分布，換句話說，正態(tài)分布是世界的宿命【所有的分布，不是正態(tài)分布，就是在變成正態(tài)分布的路上】

14.冪律分布：給人帶來希望的魔鬼

冪律分布唯一的數(shù)學(xué)性質(zhì)就是三個字——無標度。任何尺度下截取任何一部分數(shù)據(jù)，都仍然呈現(xiàn)冪律分布的特征【就像風險投資一樣，前10%幾筆投資的收益占據(jù)90%，而前10%的前10%，又占據(jù)90%】
之所以說冪律分布是魔鬼，是因為它有三個特征：極不穩(wěn)定，平均值失去意義【如平均工資】；長尾明顯，各種極端事件經(jīng)常發(fā)生【黑天鵝】；無法預(yù)測，讓人完全束手無策
冪律分布是熵減的必經(jīng)狀態(tài)，是我們對抗熵增，對抗死寂，對抗死亡的希望之光。【比如在水變成冰，也就是從無序到有序的臨界狀態(tài)上，所有指標都呈現(xiàn)出冪律分布的現(xiàn)象】

15.泊松分布：打開統(tǒng)計推斷的大門

泊松分布是用來描述隨機事件發(fā)生次數(shù)和概率的一種分布【如50年一遇大雨】

泊松分布的參數(shù)λ是單位時間(或單位面積)內(nèi)隨機事件的平均發(fā)生次數(shù)。泊松分布適合于描述單位時間內(nèi)隨機事件發(fā)生的次數(shù)：

e：自然常數(shù)，已知
k：隨機事件的發(fā)生次數(shù)【如1次大暴雨，2次大暴雨】
λ：具體問題的整體概率【如50年一遇大雨，就是1/50=0.2】

具有兩個重要的特征：

基礎(chǔ)是正態(tài)分布【不斷計算50年一遇大雨和大暴雨不同發(fā)生次數(shù)，曲線越來越接近正態(tài)分布】
隨機事件的間隔是無記憶的【前面事件發(fā)生對后面事件的結(jié)果沒影響】

泊松分布和正態(tài)分布互相驗證的關(guān)系，不僅能幫助我們在數(shù)據(jù)有限的時間進行精確計算，更打開了推斷統(tǒng)計的大門，推動了統(tǒng)計學(xué)的發(fā)展。泊松分布之前，概率和統(tǒng)計是兩個不同的學(xué)科，概率研究未發(fā)生的隨機事件，統(tǒng)計描述已發(fā)生的現(xiàn)實。【對于它的其他應(yīng)用還是不是很理解?。俊?/span>

16.假設(shè)檢驗（上）：基于概率反證法的統(tǒng)計推斷

假設(shè)檢驗是一種基于概率的反證法。如果能證明一個假說發(fā)生的概率特別小，那就推翻這個假說，接受和它相反的那個假說。這就是假設(shè)檢驗的基本邏輯
概率分布是假設(shè)檢驗的基礎(chǔ)，是進行假設(shè)檢驗時必須要用到的工具。關(guān)于顯著性，一般學(xué)界是有標準的，用得最多的就是 5%。只要 P 值小于 5%，就推翻 H0（零假設(shè)），相信 H1（備擇假設(shè)）；如果P 值大于 5%，就沒辦法推翻 H0。當然，也有一些領(lǐng)域覺得 5%這個標準太寬泛了，就設(shè)置成了 1%。甚至像物理學(xué)在發(fā)現(xiàn)粒子等問題上，執(zhí)行的這個標準是百萬分之一，要嚴格得多?？傊?，顯著性水平要依領(lǐng)域而定，每個領(lǐng)域都有自己的共同體標
假設(shè)檢驗讓我們能依靠有限的數(shù)據(jù)發(fā)現(xiàn)很多靠譜的結(jié)論，所以一誕生就席卷各個領(lǐng)域，成為很多學(xué)科研究的底層方法之一

17.假設(shè)檢驗（下）：

假設(shè)檢驗要從個別推導(dǎo)全部，就一定會忽視極端的小概率情況，這是他從娘胎里就帶的基因，沒法改變【如連續(xù)中彩票】
由于P值的大小直接由樣品決定，所以假設(shè)檢驗很容易產(chǎn)生系統(tǒng)性偏差，讓人們愿意相信一些錯誤的結(jié)論【如發(fā)郵件預(yù)言股票漲停騙局，不同人收到的郵件的預(yù)言準確性不一樣】
使用假設(shè)檢驗時，還要注意顯著性水平的設(shè)置要和問題聯(lián)動（不同領(lǐng)域的顯著性水平標準不同，在該嚴格的領(lǐng)域就要提高標準），以及根據(jù)問題選擇正確的分布（正態(tài)分布或冪律分布）

04

猜測“上帝”的底牌

18.條件概率：貝葉斯公式的基礎(chǔ)

如果一個隨機事件的概率會因為某個條件的發(fā)生而改變，那么在這個條件發(fā)生的情況下，隨機事件發(fā)生的概率就是條件概率
很多條件概率是很隱蔽的?，F(xiàn)實中，所有的概率本質(zhì)上都是條件概率
條件概率量化了條件對隨時事件的影響，但它只表示統(tǒng)計意義上的相關(guān)性，并不代表因果關(guān)系。

P(A│B) = P(AB)/P(B)

19.貝葉斯推理：概率是對信心的度量

貝葉斯推理：根據(jù)新信息不斷調(diào)整對一個隨機事件發(fā)生概率的判斷【就像偵探破案的過程】
貝葉斯推理拓寬了概率這個概念的邊界，在貝葉斯推理中概率是對信心的度量，是我們對某個結(jié)果相信程度的定量化表達【正如一場球賽，隨著比賽的進行，勝負結(jié)果慢慢明朗起來】
貝葉斯推理有兩大優(yōu)勢：1）起點不重要，迭代很重要，最后一定無窮逼近真理；2）信息越充分，結(jié)果越可靠

20.貝葉斯計算：定量解決逆概率問題

逆概率問題，比如酒駕，知道出事故中酒駕的占比，要求你如果酒駕會出事故的概率。

P(A│B) =P(B│A)×P(A)/P(B)

貝葉斯公式：現(xiàn)象B出現(xiàn)的情況下事件A發(fā)生的概率，等于事件A發(fā)生時現(xiàn)象B出現(xiàn)的概率，乘以事件A發(fā)生的概率，再除以現(xiàn)象B出現(xiàn)的概率（是條件概率的變型）——

P(A)是先驗概率，可以任意設(shè)置，如交通事故的概率
P(B│A)和P(B)是調(diào)整因子，是客觀的，必須查詢真實的數(shù)據(jù)，如果找不到數(shù)據(jù)，就不能使用貝葉斯公式，否則很容易越算越錯

貝葉斯計算難度不在計算本身，而是尋找調(diào)整因子的客觀數(shù)據(jù)

21.主觀與客觀：不同的概率學(xué)派在爭什么

貝葉斯公式中的先驗概率可以隨意設(shè)置，看起來比較主觀，不像頻率法那么客觀，其實兩者都完全正確完全有效。

只不過是對信息是否全知的預(yù)設(shè)不同，他們解決的不是同一類問題。頻率法必須有明確的嚴格的前提約束，假設(shè)信息都是全知的，貝葉斯是動態(tài)反復(fù)的過程，每出現(xiàn)一個新信息都要重新進行計算，獲得一個新的概率。兩種方法本身都是客觀的，只不過是使用過程中都活或多或少產(chǎn)生主觀性

應(yīng)用數(shù)學(xué)現(xiàn)在不太討論兩者的主客觀問題，而是哪個好用用哪個，利用兩個方法更好地解決現(xiàn)實問題

22.原則：怎么提高自己的概率思維

三個黃金法則：

對抗直覺，能算就算：人腦天生是一個貝葉斯大腦，直覺就是我們最快捷的概率計算器，我們要做的是遏制直覺的沖動，去尋找數(shù)據(jù)，證據(jù)，用概率公式計算
尋求條件，增大概率：如創(chuàng)業(yè)的成功率雖然低，但如果你擁有關(guān)鍵技術(shù)等條件，就能增大成功的概率
相信系統(tǒng)，長期主義：所謂的堅持和努力，就是尋找一個大概率的方向，然后相信系統(tǒng)相信長期主義，得到長期的到來

參考閱讀：

《老喻人生算法》上：把自己打造成一輛賽車

《老喻人生算法》下：針對外部世界不確定性

贊賞

共11人贊賞

免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

【原】概率論22講：怎么提高自己的概率思維

《老喻人生算法》上：把自己打造成一輛賽車

《老喻人生算法》下：針對外部世界不確定性