当前位置：首页大数据AI 正文

获取资料

尚学堂大数据Spark视频教程

2022-10-22 大数据AI

尚学堂大数据Spark视频教程

目录

01_Spark_初识

02_Spark_Java开发_RDD五大特性

03_Spark_运行时_程序调度

04_Spark_持久化策略_缓存优化

05_Spark_Standalone集群模式_ZK配合搭建HA_以及测试

06_Spark_Yarn集群模式_以及测试

07_Spark_操作算子本质_RDD的容错

08_Spark_宽窄依赖_DAG的切割

09_Spark_术语的归纳总结_源码的初步剖析

10_Spark_调度流程剖析_调度流程源码剖析

11_Spark_DAG源码剖析_Task最佳计算位置源码剖析

12_Spark_源码学习总结_SparkPi代码剖析

13_Spark_算子详解及优化

14_Spark_资源并行度优化分析_数据并行度优化分析

15_Spark_更多算子操作剖析

16_Spark_更多算子操作及总结

17_Spark_textFile详解_分组取TopN_二次排序

18_Spark_共享变量_SparkSQL初识_1

19_Spark_隐式转换和隐式参数_DataFrame初探_RDD反射转为DataFrame

20_Spark_RDD动态转为DataFrame

21_Spark_JSON数据源_JDBC数据源_以及Standalone集群测试

22_Spark_Hive数据源_以及Yarn集群测试_SQL来做分组取TopN

23_Spark_自定义函数_自定义聚合函数_Spark源码PageRank的问题

24_Spark_SparkStreaming初识

25_Spark_HDFS数据源_DStream的持久化存储

26_Spark_UpdateStateByKey算子_Tranform算子

27_Spark_Kafka的安装以及测试

28_Spark_Kafka数据源_Receiver方式接收数据_Direct方式接收数据

29_Spark_基于滑动窗口的操作_Spark和MR在Yarn运行的区别

30_Spark_对于内存的使用_静态模式_统一模式

Spark资料

尚学堂_百战程序员_1573题1.0版.pdf

评论0