相關(guān)閱讀

統(tǒng)計(jì)學(xué)習(xí)那些事

編輯部按:本文轉(zhuǎn)載Yang Can主頁中的文章,稍有修改。

作者簡介:楊燦,香港科技大學(xué)電子與計(jì)算機(jī)工程系。

主頁:http://ihome.ust.hk/~eeyang/index.html

在港科大拿到PhD,做的是Bioinformatics方面的東西。Bioinformatics這個(gè)領(lǐng)域很亂,從業(yè)者水平參差不齊,但隨著相關(guān)技術(shù)(比如Microarray, Genotyping)的進(jìn)步,這個(gè)領(lǐng)域一直風(fēng)風(fēng)光光。因?yàn)槲冶究剖菍W(xué)計(jì)算機(jī)電子技術(shù)方面的,對這些技術(shù)本身并沒有多大的興趣,支持我一路走過來的一個(gè)重要原因是我感受到統(tǒng)計(jì)學(xué)習(xí)(Statistical learning)的魅力。正如本科時(shí)代看過的一本網(wǎng)絡(luò)小說《悟空傳》所寫的:“你不覺得天邊的晚霞很美嗎?只有看著她,我才能堅(jiān)持向西走?!?/p>

離校前閑來無事,覺得應(yīng)該把自己的一些感受寫下來,和更多的愛好者分享。

1. 學(xué)習(xí)經(jīng)歷

先介紹一下我是如何發(fā)現(xiàn)這個(gè)領(lǐng)域的。我本科學(xué)自動(dòng)化,大四時(shí)接觸到一點(diǎn)智能控制的東西,比如模糊系統(tǒng),神經(jīng)網(wǎng)絡(luò)。研究生階段除了做點(diǎn)小硬件和小軟件,主要的時(shí)間花在研究模糊系統(tǒng)上。一個(gè)偶然的機(jī)會(huì),發(fā)現(xiàn)了王立新老師的《模糊系統(tǒng)與模糊控制教材》。我至今依然認(rèn)為這是有關(guān)模糊系統(tǒng)的最好的書,邏輯性非常強(qiáng)。它解答了我當(dāng)年的很多困惑,然而真正令我心潮澎湃的是這本書的序言,讀起來有一種“飛”的感覺。后來我終于有機(jī)會(huì)來到港科大,成為立新老師的PhD學(xué)生,時(shí)長一年半(因?yàn)榱⑿吕蠋熾x開港科大投身產(chǎn)業(yè)界了)。立新老師對我的指導(dǎo)很少,總結(jié)起來可能就一句話:“你應(yīng)該去看一下Breiman 和Friedman的文章?!绷⑿吕蠋熢谖倚哪恐械奈恢檬歉吒咴谏系?,于是我就忠實(shí)地執(zhí)行了他的話。那一年半的時(shí)間里,我?guī)缀醢阉麄兊奈恼驴戳撕脦妆?。開始不怎么懂,后來才慢慢懂了,甚至有些癡迷。于是,我把與他們經(jīng)常合作的一些學(xué)者的大部分文章也拿來看了,當(dāng)時(shí)很傻很天真,就是瞎看,后來才知道他們的鼎鼎大名,Hastie, Tibshirani, Efron等。文章看得差不多了,就反復(fù)看他們的那本書“The Elements of Statistical learning”(以下簡稱ESL)。說實(shí)話,不容易看明白,也沒有人指導(dǎo),我只好把文章和書一起反復(fù)看,就這樣來來回回折騰。比如為看懂Efron的“Least angle regression”,我一個(gè)人前前后后折騰了一年時(shí)間(個(gè)人資質(zhì)太差)。當(dāng)時(shí)國內(nèi)還有人翻譯了這本書(2006年),把名字翻譯為“統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ)”。我的神啦,這也叫“基礎(chǔ)”!還要不要人學(xué)啊!難道絕世武功真的要練三五十年?其實(shí)正確的翻譯應(yīng)該叫“精要”。在我看來,這本書所記載的是絕世武功的要義,強(qiáng)調(diào)的是整體的理解,聯(lián)系和把握,絕世武功的細(xì)節(jié)在他們的文章里。

 

[1]   [2]   [3]   [4]   [5]   [6]

 

分享到: