极客时间 Spark核心原理与实战60讲完结百度网盘

名师简介：

王磊老师是《offer 来了：Java 面试核心知识点精讲. 原理篇》&《offer 来了：Java 面试核心知识点精讲. 架构篇》两本书的作者，并且有着十余年丰富的物联网、大数据研发以及技术架构经验，对物联网及大数据的原理和技术实现有着深刻理解。长期从事海外项目的研发和交付工作，对异地多活数据中心的建设及高可用、高并发系统的设计，有丰富的实战经验。

01-课程介绍.mp4

02-内容综述.mp4

03-Spark简介及生态介绍.mp4

04-Spark原理及特点：模块概述+特点.mp4

05-Spark原理及特点：运行模式+集群组角色.mp4

06-Spark原理及特点：Spark作业运行流程.mp4

07-Spark的运行环境安装：Standalone入门实战.mp4

08-Spark的运行环境安装：YARN入门实战.mp4

09-Spark批处理做作业入门Demo.mp4

10-Spark流处理做作业入门Demo.mp4

11-SparkRDD原理：RDD抽象及相关概念.mp4

12-SparkRDD原理：RDD依赖关系、Stage、RDD持久化、SparkPreferredLocation及CheckPoint原理和使用.mp4

13-SparkRDD实战：如何利用外部数据集生成RDD？.mp4

14-SparkRDD实战：Transformation和Action概念、LazyLoad及SparkFunction的3种实现方式.mp4

15-SparkRDD实战：常用Transformation原理及实战.mp4

16-SparkRDD实战：Action原理和实战、Spark广播变量原理和使用.mp4

17-SparkSQL、DataFrame、DataSet原理和使用.mp4

18-SparkSQLJoin操作及SparkSQLFunction.mp4

19-SparkSQL原理和执行过程.mp4

20-常用数据格式原理和使用：TEXT、CSV、JSON、PARQUET在Spark中的使用.mp4

21-常用数据格式原理和使用：ORC、AVRO在Spark中的使用.mp4

22-SparkConnecter：HDFS及HBase.mp4

23-SparkConnecter：MongoDB.mp4

24-SparkConnecter：Cassandra.mp4

25-SparkConnecter：MySQL及Kafka.mp4

26-SparkConnecter：ElasticSearch.mp4

27-SparkStearming原理及实战：创建一个SparkStreaming应用.mp4

28-SparkStearming原理及实战：DStream操作、数据持久化及性能优化.mp4

29-SparkStructuredStearming原理及实战：StructuredStreaming概念、特点、数据模型和应用实战.mp4

30-SparkStructuredStearming原理及实战：StructuredStearming事件时间、延迟数据处理策略、容错语义和编程模型.mp4

31-SparkStructuredStearming原理及实战：StructuredStearming时间窗口操作、水位线和数据更新模式.mp4

32-SparkStructuredStearming原理及实战：StreamJoin操作、重复数据处理、多Watermark处理策略、StructuredStearming结果输出.mp4

33-Spark文件读写原理.mp4

34-内存调优：JVM内存调优、堆外内存设置及storageFraction设置.mp4

35-任务调优：Executor数量内存及CPU配置、设置合理的并行度、Task等待时长调优、Blacklisting调优.mp4

36-失败重试与黑名单机制、推测式执行、资源申请机制.mp4

37-SparkOnYARN：Client模式与Cluster模式.mp4

38-SparkOnYARN：FIFOScheduler、CapacityScheduler原理和使用.mp4

39-SparkOnYARN：YARNFairScheduler原理、使用及特点.mp4

40-Spark文件读写原理.mp4

41-内存调优：JVM内存调优、堆外内存设置及storageFraction设置.mp4

42-任务调优：Executor数量内存及CPU配置、设置合理的并行度、Task等待时长调优、Blacklisting调优.mp4

43-数据调优：数据本地性、复用RDD、BroadCast、Kryo序列化和CheckPoint.mp4

44-算子调优.mp4

45-SparkSQL调优和SparkStreaming调优.mp4

46-Spark数据倾斜问题处理.mp4

47-Spark机器学习概述：机器学习应用场景、分类和常用算法.mp4

48-机器学习流程：数据收集与存储、数据清理与转换.mp4

49-机器学习流程：模型训练、模型测试、模型部署与整合、模型监控与反馈及数据探索和可视化.mp4

50-Spark常用统计方法：基础统计、相关性分析、数据抽样.mp4

51-分类模型：概念与种类、线性回归及逻辑回归原理实现.mp4

52-分类模型：朴素贝叶斯原理实现、决策树原理实现及协同过滤原理.mp4

53-聚类模型：基于K-Means的聚类算法原理实现.mp4

54-MLPipLine：如何通过SparkMLPipLine模式实现模型训练？.mp4

55-Spark3.0新特性概述.mp4

56-Spark未来趋势：为什么需要数据湖？.mp4

57-Spark未来趋势：DeltaLake原理.mp4

58-Spark未来趋势：DeltaLake实战.mp4

59-Spark应用番外篇：大数据任务调度.mp4

60-结束语.mp4

资料地址.txt

猜你喜欢

评论0