編輯推薦: 本套裝共包含《SQL反模式》、《SQL必知必會(huì)(第4版))》、《數(shù)據(jù)科學(xué)實(shí)戰(zhàn)》、《Spark快速大數(shù)據(jù)分析》、《數(shù)據(jù)科學(xué)入門》、《Python數(shù)據(jù)挖掘入門與實(shí)踐》、《Hadoop安全:大數(shù)據(jù)平臺(tái)隱私保護(hù)》、《Kafka權(quán)威指南》、《Hadoop數(shù)據(jù)分析》、《Flink基礎(chǔ)教程》10本書 《SQL反模式》是一本廣受好評(píng)的SQL圖書。它介紹了如何避免在SQL的使用和開發(fā)中陷入一些常見卻經(jīng)常被忽略的誤區(qū)。它通過(guò)講述各種具體的案例,以及開發(fā)人員和使用人員在面對(duì)這些案例時(shí)經(jīng)常采用的錯(cuò)誤解決方案,來(lái)介紹如何識(shí)別、利用這些陷阱,以及面對(duì)問(wèn)題時(shí)正確的解決手段。另外,《SQL反模式》還涉及了SQL的各級(jí)范式和針對(duì)它們的正確理解。 《SQL反模式》適合SQL數(shù)據(jù)庫(kù)開發(fā)人員與管理人員閱讀。 SQL是使用廣泛的數(shù)據(jù)庫(kù)語(yǔ)言,幾乎所有重要的DBMS都支持SQL!秷D靈程序設(shè)計(jì)叢書:SQL必知必會(huì)(第4版)》由淺入深地講解了SQL的基本概念和語(yǔ)法,涉及數(shù)據(jù)的排序、過(guò)濾和分組,以及表、視圖、聯(lián)結(jié)、子查詢、游標(biāo)、存儲(chǔ)過(guò)程和觸發(fā)器等內(nèi)容,實(shí)例豐富,便于查閱。新版增加了針對(duì)ApacheOpenOfficeBase、MariaDB、SQlite等DBMS的描述,并根據(jù)新版本的Oracle、SQLServer、MySQL和PostgreSQL更新了相關(guān)示例。 《圖靈程序設(shè)計(jì)叢書:SQL必知必會(huì)(第4版)》適合SQL初學(xué)者,也可供廣大開發(fā)及管理人員參考。 《數(shù)據(jù)科學(xué)實(shí)戰(zhàn)》脫胎于哥倫比亞大學(xué)“數(shù)據(jù)科學(xué)導(dǎo)論”課程的教學(xué)講義,它界定了數(shù)據(jù)科學(xué)的研究范疇,是一本注重人文精神,多角度、全方位、深入介紹數(shù)據(jù)科學(xué)的實(shí)用指南,堪稱大數(shù)據(jù)時(shí)代的實(shí)戰(zhàn)寶典。本書旨在讓讀者能夠舉一反三地解決重要問(wèn)題,內(nèi)容包括:數(shù)據(jù)科學(xué)及工作流程、統(tǒng)計(jì)模型與機(jī)器學(xué)習(xí)算法、信息提取與統(tǒng)計(jì)變量創(chuàng)建、數(shù)據(jù)可視化與社交網(wǎng)絡(luò)、預(yù)測(cè)模型與因果分析、數(shù)據(jù)預(yù)處理與工程方法。另外,本書還將帶領(lǐng)讀者展望數(shù)據(jù)科學(xué)未來(lái)的發(fā)展。 《Spark快速大數(shù)據(jù)分析》講解了網(wǎng)絡(luò)大數(shù)據(jù)時(shí)代應(yīng)運(yùn)而生的、能高效迅捷地分析處理數(shù)據(jù)的工具——Spark,它帶領(lǐng)讀者快速掌握用 Spark 收集、計(jì)算、簡(jiǎn)化和保存海量數(shù)據(jù)的方法,學(xué)會(huì)交互、迭代和增量式分析,解決分區(qū)、數(shù)據(jù)本地化和自定義序列化等問(wèn)題。 《數(shù)據(jù)科學(xué)入門》本書基于易于理解且具有數(shù)據(jù)科學(xué)相關(guān)的豐富的庫(kù)的Python語(yǔ)言環(huán)境,從零開始講解數(shù)據(jù)科學(xué)工作。具體內(nèi)容包括:Python速成,可視化數(shù)據(jù),線性代數(shù),統(tǒng)計(jì),概率,假設(shè)與推斷,梯度下降法,如何獲取數(shù)據(jù),k近鄰法,樸素貝葉斯算法,等等。作者借助大量具體例子以及數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)等領(lǐng)域的重要概念,詳細(xì)展示了什么是數(shù)據(jù)科學(xué)。 《Python數(shù)據(jù)挖掘入門與實(shí)踐》作為數(shù)據(jù)挖掘入門讀物,介紹了數(shù)據(jù)挖掘的基礎(chǔ)知識(shí)、基本工具和實(shí)踐方法,通過(guò)循序漸進(jìn)地講解算法,帶你輕松踏上數(shù)據(jù)挖掘之旅。本書采用理論與實(shí)踐相結(jié)合的方式,呈現(xiàn)了如何使用決策樹和隨機(jī)森林算法預(yù)測(cè)美國(guó)職業(yè)籃球聯(lián)賽比賽結(jié)果,如何使用親和性分析方法推薦電影,如何使用樸素貝葉斯算法進(jìn)行社會(huì)媒體挖掘,等等。本書也涉及神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、大數(shù)據(jù)處理等內(nèi)容。 本書面向愿意學(xué)習(xí)和嘗試數(shù)據(jù)挖掘的程序員。 《Hadoop安全 大數(shù)據(jù)平臺(tái)隱私保護(hù)》闡述了Hadoop從早期開放的消費(fèi)互聯(lián)網(wǎng)時(shí)代到現(xiàn)在作為敏感數(shù)據(jù)可信平臺(tái)的演變歷程,介紹了包括身份驗(yàn)證、加密、密鑰管理和商業(yè)實(shí)踐在內(nèi)的諸多主題,并在實(shí)際環(huán)境下加以討論。第 1章是介紹性內(nèi)容,隨后分為四大部分:第 一部分是安全架構(gòu),第 二部分是驗(yàn)證、授權(quán)和安全審計(jì),第三部分是數(shù)據(jù)安全,第四部分是歸納總結(jié)。介紹了幾個(gè)使用案例,融合了書中諸多概念。 《Hadoop安全 大數(shù)據(jù)平臺(tái)隱私保護(hù)》適合對(duì)Hadoop感興趣的讀者,有大數(shù)據(jù)平臺(tái)保護(hù)需求的讀者。 《Kafka權(quán)威指南》是關(guān)于Kafka的全面教程,主要內(nèi)容包括:Kafka相對(duì)于其他消息隊(duì)列系統(tǒng)的優(yōu)點(diǎn),主要是它如何匹配大數(shù)據(jù)平臺(tái)開發(fā);詳解Kafka內(nèi)部設(shè)計(jì);用Kafka構(gòu)建應(yīng)用的實(shí)踐;理解在生產(chǎn)中部署Kafka的方式;如何確保Kafka集群的安全。 本書適合Java開發(fā)人員、大數(shù)據(jù)平臺(tái)開發(fā)人員以及對(duì)分布式系統(tǒng)感興趣的讀者閱讀。 《Hadoop數(shù)據(jù)分析》提供分布式數(shù)據(jù)存儲(chǔ)和并行計(jì)算框架,Hadoop已經(jīng)從一個(gè)集群計(jì)算的抽象演化成了一個(gè)大數(shù)據(jù)的操作系統(tǒng)。本書旨在通過(guò)以可讀且直觀的方式提供集群計(jì)算和分析的概覽,為數(shù)據(jù)科學(xué)家深入了解特定主題領(lǐng)域鋪平道路,從數(shù)據(jù)科學(xué)家的視角介紹Hadoop集群計(jì)算和分析。本書分為兩大部分,* 一部分從非常高的層次介紹分布式計(jì)算,討論如何在集群上運(yùn)行計(jì)算;* 二部分則重點(diǎn)關(guān)注數(shù)據(jù)科學(xué)家應(yīng)該了解的工具和技術(shù),意在為各種分析和大規(guī)模數(shù)據(jù)管理提供動(dòng)力。 近年來(lái),流處理變得越來(lái)越流行。作為高度創(chuàng)新的開源流處理器,F(xiàn)link擁有諸多優(yōu)勢(shì),包括容錯(cuò)性、高吞吐、低延遲,以及同時(shí)支持流處理和批處理的能力。《Flink基礎(chǔ)教程》分為6章,側(cè)重于介紹Flink的核心設(shè)計(jì)理念、功能和用途,內(nèi)容涉及事件時(shí)間和處理時(shí)間、窗口和水印機(jī)制、檢查點(diǎn)機(jī)制、性能測(cè)評(píng),以及Flink如何實(shí)現(xiàn)批處理。 本書面向有興趣學(xué)習(xí)如何分析大規(guī)模流數(shù)據(jù)的讀者。
|