本書首先介紹數(shù)據(jù)分析的方法論,然后介紹數(shù)據(jù)分析的相關(guān)模型方法,并進一步通過數(shù)據(jù)分析案例,講解數(shù)據(jù)分析的思維、方法及模型實現(xiàn)過程。本書重點介紹R語言在數(shù)據(jù)分析方面的應(yīng)用,讓讀者能夠快速地使用R語言進行數(shù)據(jù)分析、構(gòu)建模型。本書分為17章,內(nèi)容包括:使用R語言獲取數(shù)據(jù)、數(shù)據(jù)分析中的數(shù)據(jù)處理與數(shù)據(jù)探索、生存分析、主成分分析、多維縮放、線性回歸模型、邏輯回歸模型、聚類模型、關(guān)聯(lián)規(guī)則、隨機森林、支持向量機、神經(jīng)網(wǎng)絡(luò)、文本挖掘、社交網(wǎng)絡(luò)分析,以及關(guān)于R語言數(shù)據(jù)分析的延伸內(nèi)容:H2O機器學(xué)習(xí)和R語言爬蟲。本書內(nèi)容通俗易懂,案例豐富,實用性強,特別適合R語言的入門讀者和進階讀者閱讀,也適合數(shù)據(jù)分析人員、數(shù)據(jù)挖掘人員等其他數(shù)據(jù)科學(xué)從業(yè)者。另外,本書也適用于統(tǒng)計學(xué)、計算機、機器學(xué)習(xí)、數(shù)學(xué)等相關(guān)專業(yè)的本科生、研究生使用。米霖,畢業(yè)于華中農(nóng)業(yè)大學(xué),本科數(shù)學(xué)專業(yè),研究生統(tǒng)計學(xué)專業(yè),8年R語言項目經(jīng)驗,擅長機器學(xué)習(xí)、統(tǒng)計模型。曾開發(fā)了多門R語言相關(guān)課程,課程包括《Shiny 初級教程》《R包開發(fā)》《H2O機器學(xué)習(xí)模型》《信用評分模型開發(fā)》《R語言文本挖掘》等,學(xué)員累計超過5000人。完成過很多數(shù)據(jù)分析項目,例如廣告虛假流量識別項目(通過虛假流量數(shù)據(jù)的挖掘幫助企業(yè)節(jié)省了上百萬元的營銷成本),信貸中的信用評分項目,電商風(fēng)控項目等。
|