登录
  • #数据科学

【分享Big Data资源】Hadoop,Hive和Spark的5本参考书

mozartkun
5337
19
昨天在另一个帖子里,向大家介绍了Hadoop新手怎么自学Hadoop框架和各种product,也分析了公开课和考试认证的优劣。

在这个贴子里,我分享5本Hadoop,Hive和Spark的参考书,以方便大家更深入了解Hadoop和各种product。大家有兴趣的可以自学,Hadoop还是很有意思的





1. 《Hadoop: The Definitive Guide (4th)》九阴真经总纲

Amazon链接:

简单介绍:这本书堪称Hadoop的圣经,圣经的意思你们懂的,就是入这行不得不看的意思,内容确实很全,可以当作《九阴真经》总纲来看待





2. 《Data Analytics with Hadoop: An Introduction for Data Scientists》 九阴真经速成版

Amazon链接:

简单介绍:这本书里全是hadoop的hands-on project,用python/scala来做mapreduce,只有hands-on project没有理论概念,能让你在最快的时间内学会用hadoop,所以算是《九阴真经》速成篇





3. 《Practical Hive: A Guide to Hadoop's Data Warehouse System》 2016年的Hive参考书

Amazon链接:https://www.amazon.com/Practical-Hive-Hadoops-Warehouse-System/dp/1484202724/ref=sr_1_1?ie=UTF8&qid=1540257905&sr=8-1&keywords=practical+hive

简单介绍:我选这本书,是因为这是比较新的Hive书(2016年),而且看书名就知道,侧重点在怎么应用Hive上,就是写代码。很多人可能用过《Programming Hive》但是本很老的书(2013年),内容有没有outdated不知道。





4. 《Spark: The Definitive Guide》和《Learning Spark: Lightning-Fast Big Data Analysis》 Spark中的剑宗+气宗

Amazon链接1:https://www.amazon.com/Spark-Definitive-Guide-Processing-Simple/dp/1491912219/ref=sr_1_2?ie=UTF8&qid=1540258273&sr=8-2&keywords=spark+big+data

Amazon链接2:

简单介绍:你们当初学Spark有没有觉得头痛?这两本Spark书是Amazon上Spark系列评分最高的几本了,也比较新,都是2016年后出版的





参考书一共30多M,我权限低,没法直接上传pdf格式的,所以我分享到我的【百度网盘】里:

链接: pan.baidu.com 提取码: f27a





收集这些资料花了很多精力,请大家给我点大米糊口,非常感谢大家!



19条回复
热度排序

发表回复