引言 如今機(jī)器學(xué)習(xí)的熱度越來(lái)越高,尤其是前段時(shí)間的諾獎(jiǎng),頒給了兩位機(jī)器學(xué)習(xí)領(lǐng)域的專家! 不少學(xué)者表示“意料之外”,但也在“情理之中”。 今天將我們繼續(xù)介紹機(jī)器學(xué)習(xí)中常用的算法! 在機(jī)器學(xué)習(xí)領(lǐng)域,有種說(shuō)法叫做“No Free Lunch(世上沒(méi)有免費(fèi)的午餐)“,它是指沒(méi)有任何一種算法能在每個(gè)問(wèn)題上都能有最好的效果,這個(gè)理論在監(jiān)督學(xué)習(xí)方面體現(xiàn)得尤為重要。 這就需要我們對(duì)不同算法及其特性有所了解。 首先,借用魯偉老師編寫的《機(jī)器學(xué)習(xí):公式推導(dǎo)與代碼實(shí)現(xiàn)》一書(shū)中的插圖,該圖對(duì)機(jī)器學(xué)習(xí)模型做了分類匯總,介紹得也較為全面。 圖中提到的監(jiān)督模型,簡(jiǎn)單來(lái)說(shuō)就是模型通過(guò)學(xué)習(xí)有標(biāo)準(zhǔn)答案的數(shù)據(jù)來(lái)總結(jié)規(guī)律。
而無(wú)監(jiān)督模型則是模型通過(guò)學(xué)習(xí)沒(méi)有答案的數(shù)據(jù)來(lái)總結(jié)規(guī)律,它需要根據(jù)數(shù)據(jù)本身的特點(diǎn)來(lái)發(fā)掘信息。
概率模型則是模型基于概率論方法通過(guò)數(shù)據(jù)學(xué)習(xí)變量之間的概率關(guān)系。 醫(yī)學(xué)研究中最常見(jiàn)的是監(jiān)督學(xué)習(xí)模型,主要用于預(yù)測(cè)模型,包括診斷模型和預(yù)后模型的構(gòu)建。 ?在這些監(jiān)督學(xué)習(xí)模型中,常用的模型包括:一般線性回歸、Logistic回歸、LASSO回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、XGBoost和隨機(jī)森林。 因此,本專欄的后續(xù)推文將分別對(duì)這些模型進(jìn)行講解,概述這些模型的特點(diǎn)及其背后的思想,讓大家對(duì)這些模型有一個(gè)大致的理解,從而幫助大家在科研時(shí)選擇合適的模型、設(shè)置合理的參數(shù)。 ?同時(shí),無(wú)監(jiān)督學(xué)習(xí)模型在醫(yī)學(xué)研究中也得到了一定的應(yīng)用,其中較為常用的模型是k均值聚類和PCA,之后也將對(duì)這兩種方法進(jìn)行講解。 ?相對(duì)而言,概率模型在醫(yī)學(xué)研究中的應(yīng)用則較少。 機(jī)器學(xué)習(xí)并不是魔法,沒(méi)有那么復(fù)雜神秘,只要我們理解了背后的思想,掌握一定的工具,就可以自由的應(yīng)用它來(lái)解決實(shí)際問(wèn)題了。 |
|
來(lái)自: 妙趣橫生統(tǒng)計(jì)學(xué) > 《待分類》