大数据学习路线及各阶段学习书籍推荐!废话不多说,直接切入主题,有需要的小伙伴可以参考学习!
阶段一、大数据基础 ——java 语言基础方面
【大数据开发学习资料领取方式】:加入大数据技术学习交流扣扣群 522189307,私信管理员即可免费领取开发工具以及入门学习资料
(1)Java 语言基础
Java 开发介绍、熟悉 Eclipse 开发工具、Java 语言基础、Java 流程控制、Java 字符串、Java 数组与类和对象、数字处理类与核心技术、I/O 与反射、多线程、Swing 程序与集合类
(2) HTML、CSS 与 JavaScript
PC 端网站布局、HTML5+CSS3 基础、WebApp 页面布局、原生 JavaScript 交互功能开发、Ajax 异步交互、jQuery 应用
(3)JavaWeb 和数据库
数据库、JavaWeb 开发核心、JavaWeb 开发内幕
推荐书籍:
《Effective Java 中文版》(第 2 版)
本书为我们带来了共 78 条程序员必备的经验法则,针对你每天都会遇到的编程问题提出了有效、实用的解决方案。
书中的每一章都包含几个 "条目",以简洁的形式呈现,自成独立的短文,它们提出了具体的建议,对于 Java 平台精妙之处的独到见解,以及优秀的代码范例。每个条目的综合描述和解释都阐明了应该怎么做,不应该怎么做,以及为什么。
阶段二、 Linux&Hadoop 生态体系
Linux 体系、Hadoop 离线计算大纲、分布式数据库 Hbase、数据仓库 Hive、数据迁移工具 Sqoop、Flume 分布式日志框架
推荐书籍:
1、《Big Data》
在大数据的背景下,我很少看到关于数据建模,数据层,数据处理需求分析以及数据架构和存储实现问题。这本书却提供了令人耳目一新的全面解决方案。
2、《Hadoop 权威指南》
《Hadoop 权威指南 (中文版)》从 Hadoop 的缘起开始,由浅入深,结合理论和实践,全方位地介绍 Hadoop 这一高性能处理海量数据集的理想工具。
3、《Hive 编程指南》
《Hive 编程指南》是一本 Apache Hive 的编程指南,旨在介绍如何使用 Hive 的 SQL 方法 HiveQL 来汇总、查询和分析存储在 Hadoop 分布式文件系统上的大数据集合。
阶段三、 分布式计算。
(1)分布式计算框架
Python 编程语言、Scala 编程语言、Spark 大数据处理、Spark—Streaming 大数据处理、Spark—Mlib 机器学习、Spark—GraphX 图计算、实战一:基于 Spark 的推荐系统(某一线公司真实项目)、实战二:新浪网(www.sina.com.cn)
(2)storm 技术架构体系
Storm 原理与基础、消息队列 kafka、Redis 工具、zookeeper 详解、实战一:日志告警系统项目、实战二:猜你喜欢推荐系统实战
推荐书籍:
1、《Learning Spark》
《Spark 快速大数据分析》是一本为 Spark 初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于 Spark 的用法,它对 Spark 的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。
2、《Spark 机器学习:核心技术与实践》
本书采用理论与大量实例相结合的方式帮助开发人员掌握使用 Spark 进行分析和实现机器学习算法。通过这些示例和 Spark 在各种企业级系统中的应用,帮助读者解锁 Spark 机器学习算法的复杂性,通过数据分析产生有价值的数据洞察力。
阶段四、 大数据项目实战(一线公司真实项目)
数据获取、数据处理、数据分析、数据展现、数据应用
阶段五、 大数据分析 —AI(人工智能)
主要是讲解 Data Analyze 数据分析基础、数据可视化、sklearn 中三类朴素贝叶斯算法以及 python 机器学习等提升个人能力的内容!
【大数据开发学习资料领取方式】:加入大数据技术学习交流扣扣群 522189307,私信管理员即可免费领取开发工具以及入门学习资料