本書(shū)是一本數(shù)據(jù)科學(xué)的入門書(shū)籍。每個(gè)知識(shí)點(diǎn)盡量從實(shí)際的應(yīng)用案例出發(fā),從數(shù)據(jù)出發(fā),以問(wèn)題為導(dǎo)向,在解決問(wèn)題中學(xué)習(xí)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等數(shù)據(jù)科學(xué)相關(guān)方法。本書(shū)將數(shù)據(jù)讀寫、數(shù)據(jù)清洗和預(yù)處理作為開(kāi)端,逐漸深入到和數(shù)據(jù)科學(xué)相關(guān)的決策樹(shù)、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、無(wú)監(jiān)督學(xué)習(xí)等知識(shí)。此外,結(jié)合數(shù)據(jù)科學(xué)的實(shí)際應(yīng)用,書(shū)中還講解了推薦算法、文本挖掘和社交網(wǎng)絡(luò)分析等熱門實(shí)用技術(shù)。本書(shū)在寫作過(guò)程中盡量刪去太過(guò)抽樣的理論,讓具有一定高等數(shù)學(xué)和概率論基礎(chǔ)的讀者就能看得懂。當(dāng)然,如果讀者對(duì)方法原理確實(shí)不感興趣,只是為了用R程序?qū)崿F(xiàn)某種方法,可以跳過(guò)方法只看案例和程序。本書(shū)適合作為高校數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、大數(shù)據(jù)分析等相關(guān)專業(yè)的研究生和高年級(jí)本科的教科書(shū),也適合作為相關(guān)企業(yè)的數(shù)據(jù)科學(xué)家、數(shù)據(jù)挖掘工程師、數(shù)據(jù)分析師及數(shù)據(jù)科學(xué)的愛(ài)好者等的工具書(shū)。方匡南,現(xiàn)為廈門大學(xué)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)系教授、博士生導(dǎo)師,耶魯大學(xué)博士后,廈門大學(xué)數(shù)據(jù)挖掘研究中心副主任,靠前統(tǒng)計(jì)學(xué)會(huì)會(huì)士,全國(guó)工業(yè)統(tǒng)計(jì)學(xué)會(huì)理事、廈門統(tǒng)計(jì)學(xué)會(huì)常務(wù)理事。主要研究方向?yàn)閿?shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、應(yīng)用統(tǒng)計(jì)。曾先后在國(guó)外非常不錯(cuò)期刊發(fā)表論文七十多篇,主持了國(guó)家自然科學(xué)基金等項(xiàng)目二十多項(xiàng)。多年從事大數(shù)據(jù)及相關(guān)領(lǐng)域研究與教學(xué),著有《R數(shù)據(jù)分析》等多部相關(guān)作品。
|