免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

概率論22講:怎么提高自己的概率思維

 宗子說 2021-04-28

01.全局:從局部隨機性到整體確定性

  1. 把局部的隨機性轉(zhuǎn)變?yōu)檎w的確定性,是概率論解決問題的本質(zhì)

  2. 概率論不是用來預(yù)測未來,也不是對一次偶然的結(jié)果進行計算,它是更高層次的、確定性的認知

  3. 概率論的大廈像什么?我更愿意說:概率論不是一棟建筑,而是一個城市。我可以不知道城市里每一棟建筑的樣子,但我確定地知道這個城市的建筑模式。

01

“上帝”在擲骰子









02.隨機:隨機性不等于不確定性

  1. 隨機性不等于不確定性。概率論研究的是隨機性,而不是不確定性。隨機性是這個事件可能出現(xiàn)的結(jié)果我都知道,只是不知道下一次會出現(xiàn)哪個結(jié)果,而不確定性,是我連可能出現(xiàn)結(jié)果的選項都不知道

  2. 隨機分真?zhèn)?,絕對意義上的真隨機存在于量子層面,現(xiàn)實中很難遇到;偽隨機只是披著隨機的外衣,它本身是有規(guī)律的;而我們現(xiàn)實中遇到的大部分現(xiàn)象,都是效果隨機(感覺到它的效果是隨機的),這也是概率論這門學(xué)科研究的重點。

  3. 隨機是這個世界的決定性力量,了解隨機,你才會懂得隨機的力量,才會更好地利用隨機做出正確決策(如轉(zhuǎn)基因農(nóng)作物)

03.概率:對世界可能性的度量

任何你關(guān)心的事情,只要設(shè)定一個條件,從可能性的角度出發(fā),對某一個發(fā)生結(jié)果進行陳述,就可以轉(zhuǎn)化成隨機事件,然后度量概率。

  1. 概率是隨機事件發(fā)生可能性大小的定量描述

  2. 概率是隨機事件在樣本空間的比率:隨機事件就是樣本空間的一個子集;反過來也成立,樣本空間里的每一個子集,也都是一個隨機事件?!半S機事件”和“樣本空間”就是子集和全集的關(guān)系。而子集和全集的比率,也就是隨機事件占樣本空間的比率,就是這個隨機事件發(fā)生的概率

  3. 樣本空間的完備性是一個幽靈。從某種角度來說,我們對世界的認識,就是對樣本空間完備性的認識。如果樣本空間不完備,我們計算的概率就會有偏差,決策就會出錯。

04.獨立性:隨機事件的相互關(guān)系

  1. 如果一個隨機事件發(fā)生的結(jié)果,不會影響另一個隨機事件的概率,那它們就是互相獨立的事件,反之就是非獨立事件

  2. 只有明白了隨機事件之間的關(guān)系,判斷它們是否具有獨立性,才能正確分析和度量它的概率

  3. 很多看似獨立的事件,其實都是互有聯(lián)系、互相影響的。評估隨機事件的概率時,對獨立事件的設(shè)定需要格外謹慎。

05.概率計算:定義問題比計算更重要

概率計算的三個法則:

  1. 排列組合法則”:排列組合法則適用于結(jié)果有限,而且每種結(jié)果都是等可能性的情況——這個隨機事件出現(xiàn)的次數(shù)除以所有可能的結(jié)果的個數(shù)

  2. “加法法則”:針對多個隨機事件,這些隨機事件發(fā)生的概率加和

  3. “乘法法則”:針對多個隨機事件同時發(fā)生的概率

大部分人不會做概率題,不是因為不會計算,而是因為沒有看明白題目。概率計算之所以復(fù)雜,是因為很難將現(xiàn)實問題準確的抽象成“對”的概率問題。準確的翻譯現(xiàn)實問題,就是概率思維的核心,也是概率計算最復(fù)雜的地方

02

偷看“上帝”的安排









06.概率度量:建立整體確定性的三種方式

  1. 定義法:是一種等概率的設(shè)定,來源于自然界對稱性的假設(shè),是一種宏觀尺度下的合理簡化【拋硬幣正面朝上和反面朝上的概率相等,都是50%;一個標準的子,拋出每個點數(shù)的概率也相等,都是 1/6。這些概率,都是我們直接定義的?!?/span>

  2. 頻率法:是通過隨機事件發(fā)生的頻率來估算概率,要求試驗或數(shù)據(jù)盡可能的多

  3. 迭代法:強調(diào)不斷迭代,可以在小規(guī)模數(shù)據(jù)下,針對事件的變化和個體的差異度量概率。先利用手頭少量的數(shù)據(jù)做推測,甚至是主觀猜測一件事兒的概率,然后再通過收集來的新數(shù)據(jù),不斷調(diào)整對這件事概率的估算。最常用的方法就叫作“貝葉斯”

三種方法并不是涇渭分明,而是常常融合使用,一起更清晰和全面地認識這個世界。頻率法可以驗證定義法的正確性;迭代法也可以用定義法或者頻率法來獲得最初的判斷;頻率法和迭代法,又可以同時使用,相互驗證。打個比方來說,這三種方法,就好比工具箱里的三把尺子,共同對概率進行度量。這也是概率論和很多學(xué)科不一樣的地方。

07.頻率法:概率是對發(fā)生頻率的計算

頻率法認為,概率就是對發(fā)生頻率的計算,只要試驗數(shù)量或者觀測數(shù)據(jù)足夠多,隨機事件發(fā)生的頻率就會接近它的概率。比如歷史上的拋硬幣試驗

大數(shù)定律不是基于試驗的歸納,而是經(jīng)過了嚴格的數(shù)學(xué)證明,證明了用頻率度量概率是合理的。

現(xiàn)實中使用頻率法,往往無法獲得無限多的數(shù)據(jù),所以需要增加一些限制條件(精度誤差和置信度),來降低需要是數(shù)據(jù)量,比如常用的是95%的置信度和2%的精度誤差。

08.大數(shù)定律:局部頻率不是整體概率

大數(shù)定律被稱為“黃金定理”,它讓我們真正能用整體的確定性來對抗局部的隨機性

但現(xiàn)實中遇到的問題都是局部頻率,局部頻率不是整體概率,和真實的整體概率之間會存在差值

這個差值不需要通過補償對局部產(chǎn)生作用(也就是說拋硬幣連續(xù)拋出10次正面下一次是反面的概率還是50%),大數(shù)定律不需要靠補償來實現(xiàn),而是通過均值回歸,用大量的正常數(shù)據(jù)淡化,削弱不正常數(shù)據(jù)的影響

【可以這樣理解,整體概率就像大海,現(xiàn)實的情況就像一勺糖,放在水杯中你會覺得很甜,但倒進大海里,對大海的味道影響幾乎沒有,真實的情況和能跟整體的概率相差很遠,但概率還是沒有變化,而且真實情況也不會一直跟這個概率偏離,會有回歸均值的趨勢,可是我們永遠沒法知道是在什么時候回歸,但如果一直不回歸,我們也有理由認為這個真實情況里面可能有貓膩,比如硬幣一邊是否更重了】

09.數(shù)學(xué)期望:對隨機事件長期價值的衡量

數(shù)學(xué)期望是對隨機事件長期價值的數(shù)字化衡量,是判斷一件事情值不值得做的整體定量化指標

計算數(shù)學(xué)期望要把所有的隨機結(jié)果數(shù)值化,只有賦予每個結(jié)果一個具體的值,才能進行數(shù)學(xué)期望的計算

對于同一個結(jié)果,個體的數(shù)學(xué)期望也可能是不一樣的,具體計算結(jié)果需要加入自己對價值的主觀考量(比如人的生命)

10.方差:圍繞數(shù)學(xué)期望波動程度的度量

  1. 判斷兩個隨機事件是否相似,除了比較數(shù)學(xué)期望之外,還需要比較方差,兩者共同構(gòu)成了對隨機事件最基本的描述

  2. 方差是描述隨機結(jié)果圍繞期望波動范圍的指標,方差越大,波動越大,也意味著風險越大

  3. 現(xiàn)實生活中,我們可以通過減少方差對抗波動性【增大本金增大數(shù)據(jù)量】,也可以通過增大方差利用波動性【彩票頭獎的巨額獎金吸引】

03

收集“上帝”的骰子









11.概率分布:認識現(xiàn)實世界的數(shù)學(xué)模型

  1. 隨機變量所有的結(jié)果和每個結(jié)果出現(xiàn)的概率一一對應(yīng),就構(gòu)成了概率分布,概率分布讓我們擁有上帝之眼,獲得對一個隨機事件的整體認知

  2. 概率分布模型是我們對現(xiàn)實規(guī)律的抽象,正態(tài)分布,冪律分布都是這樣的模型,分別代表一種概率分布的規(guī)律

  3. 如果概率分布是一個解決問題的工具箱,概率分布模型就是工具箱里的一個個工具,數(shù)學(xué)家不斷豐富工具箱的工具幫助我們逼近真理

【就像《模型思維》里的思想】

12.正態(tài)分布:最簡單卻最重要的概率分布

  1. 均值就是期望,所以正態(tài)分布的平均值才有意義

  2. 數(shù)據(jù)集中在均值附近,極端值很少,且對均值影響很小

  3. 標準差決定胖瘦,從曲線的彎曲程度能看出隨機變量的波動

【就像運動比賽的正態(tài)分布,專業(yè)選手的標準差很小,均值很大;業(yè)務(wù)選手標準差很大,均值小一點】

13.中心極限定理:正態(tài)分布是概率分布的神

  1. 合法性:中心極限定理通過嚴格的數(shù)學(xué)推導(dǎo),證明了正態(tài)分布的正確性【中心極限定理就像青藏高原,正態(tài)分布就是喜馬拉雅山】

  2. 正統(tǒng)性:在所有的分布中,正態(tài)分布是統(tǒng)計學(xué)家的首選,它建立了一套穩(wěn)定的秩序,像參照系一樣對所有事情施加影響

  3. 主宰性:正態(tài)分布不僅在現(xiàn)實世界普遍存在,所有的分布不斷疊加最后也都會變成正態(tài)分布,換句話說,正態(tài)分布是世界的宿命【所有的分布,不是正態(tài)分布,就是在變成正態(tài)分布的路上】

14.冪律分布:給人帶來希望的魔鬼

  1. 冪律分布唯一的數(shù)學(xué)性質(zhì)就是三個字——無標度。任何尺度下截取任何一部分數(shù)據(jù),都仍然呈現(xiàn)冪律分布的特征【就像風險投資一樣,前10%幾筆投資的收益占據(jù)90%,而前10%的前10%,又占據(jù)90%】

  2. 之所以說冪律分布是魔鬼,是因為它有三個特征:極不穩(wěn)定,平均值失去意義【如平均工資】;長尾明顯,各種極端事件經(jīng)常發(fā)生【黑天鵝】;無法預(yù)測,讓人完全束手無策

  3. 冪律分布是熵減的必經(jīng)狀態(tài),是我們對抗熵增,對抗死寂,對抗死亡的希望之光。【比如在水變成冰,也就是從無序到有序的臨界狀態(tài)上,所有指標都呈現(xiàn)出冪律分布的現(xiàn)象】

15.泊松分布:打開統(tǒng)計推斷的大門

泊松分布是用來描述隨機事件發(fā)生次數(shù)和概率的一種分布【如50年一遇大雨】

泊松分布的參數(shù)λ是單位時間(或單位面積)內(nèi)隨機事件的平均發(fā)生次數(shù)。泊松分布適合于描述單位時間內(nèi)隨機事件發(fā)生的次數(shù):

  • e:自然常數(shù),已知

  • k:隨機事件的發(fā)生次數(shù)【如1次大暴雨,2次大暴雨】

  • λ:具體問題的整體概率【如50年一遇大雨,就是1/50=0.2】

具有兩個重要的特征:

  1. 基礎(chǔ)是正態(tài)分布【不斷計算50年一遇大雨和大暴雨不同發(fā)生次數(shù),曲線越來越接近正態(tài)分布】

  2. 隨機事件的間隔是無記憶的【前面事件發(fā)生對后面事件的結(jié)果沒影響】

泊松分布和正態(tài)分布互相驗證的關(guān)系,不僅能幫助我們在數(shù)據(jù)有限的時間進行精確計算,更打開了推斷統(tǒng)計的大門,推動了統(tǒng)計學(xué)的發(fā)展。泊松分布之前,概率和統(tǒng)計是兩個不同的學(xué)科,概率研究未發(fā)生的隨機事件,統(tǒng)計描述已發(fā)生的現(xiàn)實。【對于它的其他應(yīng)用還是不是很理解?。俊?/span>

16.假設(shè)檢驗(上):基于概率反證法的統(tǒng)計推斷

  1. 假設(shè)檢驗是一種基于概率的反證法。如果能證明一個假說發(fā)生的概率特別小,那就推翻這個假說,接受和它相反的那個假說。這就是假設(shè)檢驗的基本邏輯

  2. 概率分布是假設(shè)檢驗的基礎(chǔ),是進行假設(shè)檢驗時必須要用到的工具。關(guān)于顯著性,一般學(xué)界是有標準的,用得最多的就是 5%。只要 P 值小于 5%,就推翻 H0(零假設(shè)),相信 H1(備擇假設(shè));如果P 值大于 5%,就沒辦法推翻 H0。當然,也有一些領(lǐng)域覺得 5%這個標準太寬泛了,就設(shè)置成了 1%。甚至像物理學(xué)在發(fā)現(xiàn)粒子等問題上,執(zhí)行的這個標準是百萬分之一,要嚴格得多??傊?,顯著性水平要依領(lǐng)域而定,每個領(lǐng)域都有自己的共同體標

  3. 假設(shè)檢驗讓我們能依靠有限的數(shù)據(jù)發(fā)現(xiàn)很多靠譜的結(jié)論,所以一誕生就席卷各個領(lǐng)域,成為很多學(xué)科研究的底層方法之一

17.假設(shè)檢驗(下):

  1. 假設(shè)檢驗要從個別推導(dǎo)全部,就一定會忽視極端的小概率情況,這是他從娘胎里就帶的基因,沒法改變【如連續(xù)中彩票】

  2. 由于P值的大小直接由樣品決定,所以假設(shè)檢驗很容易產(chǎn)生系統(tǒng)性偏差,讓人們愿意相信一些錯誤的結(jié)論【如發(fā)郵件預(yù)言股票漲停騙局,不同人收到的郵件的預(yù)言準確性不一樣】

  3. 使用假設(shè)檢驗時,還要注意顯著性水平的設(shè)置要和問題聯(lián)動(不同領(lǐng)域的顯著性水平標準不同,在該嚴格的領(lǐng)域就要提高標準),以及根據(jù)問題選擇正確的分布(正態(tài)分布或冪律分布)

04

猜測“上帝”的底牌









18.條件概率:貝葉斯公式的基礎(chǔ)

  1. 如果一個隨機事件的概率會因為某個條件的發(fā)生而改變,那么在這個條件發(fā)生的情況下,隨機事件發(fā)生的概率就是條件概率

  2. 很多條件概率是很隱蔽的?,F(xiàn)實中,所有的概率本質(zhì)上都是條件概率

  3. 條件概率量化了條件對隨時事件的影響,但它只表示統(tǒng)計意義上的相關(guān)性,并不代表因果關(guān)系。

P(A│B) = P(AB)/P(B)

19.貝葉斯推理:概率是對信心的度量

  1. 貝葉斯推理:根據(jù)新信息不斷調(diào)整對一個隨機事件發(fā)生概率的判斷【就像偵探破案的過程】

  2. 貝葉斯推理拓寬了概率這個概念的邊界,在貝葉斯推理中概率是對信心的度量,是我們對某個結(jié)果相信程度的定量化表達【正如一場球賽,隨著比賽的進行,勝負結(jié)果慢慢明朗起來】

  3. 貝葉斯推理有兩大優(yōu)勢:1)起點不重要,迭代很重要,最后一定無窮逼近真理;2)信息越充分,結(jié)果越可靠

20.貝葉斯計算:定量解決逆概率問題

逆概率問題,比如酒駕,知道出事故中酒駕的占比,要求你如果酒駕會出事故的概率。

P(A│B) =P(B│A)×P(A)/P(B)

貝葉斯公式:現(xiàn)象B出現(xiàn)的情況下事件A發(fā)生的概率,等于事件A發(fā)生時現(xiàn)象B出現(xiàn)的概率,乘以事件A發(fā)生的概率,再除以現(xiàn)象B出現(xiàn)的概率(是條件概率的變型)——

  • P(A)是先驗概率,可以任意設(shè)置,如交通事故的概率

  • P(B│A)和P(B)是調(diào)整因子,是客觀的,必須查詢真實的數(shù)據(jù),如果找不到數(shù)據(jù),就不能使用貝葉斯公式,否則很容易越算越錯

貝葉斯計算難度不在計算本身,而是尋找調(diào)整因子的客觀數(shù)據(jù)


21.主觀與客觀:不同的概率學(xué)派在爭什么

貝葉斯公式中的先驗概率可以隨意設(shè)置,看起來比較主觀,不像頻率法那么客觀,其實兩者都完全正確完全有效。

只不過是對信息是否全知的預(yù)設(shè)不同,他們解決的不是同一類問題。頻率法必須有明確的嚴格的前提約束,假設(shè)信息都是全知的,貝葉斯是動態(tài)反復(fù)的過程,每出現(xiàn)一個新信息都要重新進行計算,獲得一個新的概率。兩種方法本身都是客觀的,只不過是使用過程中都活或多或少產(chǎn)生主觀性

應(yīng)用數(shù)學(xué)現(xiàn)在不太討論兩者的主客觀問題,而是哪個好用用哪個,利用兩個方法更好地解決現(xiàn)實問題

22.原則:怎么提高自己的概率思維

三個黃金法則:

  1. 對抗直覺,能算就算:人腦天生是一個貝葉斯大腦,直覺就是我們最快捷的概率計算器,我們要做的是遏制直覺的沖動,去尋找數(shù)據(jù),證據(jù),用概率公式計算

  2. 尋求條件,增大概率:如創(chuàng)業(yè)的成功率雖然低,但如果你擁有關(guān)鍵技術(shù)等條件,就能增大成功的概率

  3. 相信系統(tǒng),長期主義:所謂的堅持和努力,就是尋找一個大概率的方向,然后相信系統(tǒng)相信長期主義,得到長期的到來

參考閱讀:

《老喻人生算法》上:把自己打造成一輛賽車

《老喻人生算法》下:針對外部世界不確定性


    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多