客服咨询

意见反馈

分布式计算框架
大数据//
0.0
32
视频
2.6
课时
49.00
介绍
目录

课程概述

分布式计算框架作为一门大数据核心课程,系统讲授Spark分布式计算框架,Spark SQL、Spark Streaming和机器学习库MLlib,以及Spark实践的设计(开发)的基本理念、方法与思路。

课程目标

理解分布式计算框架的基本概念与理论,将其合理应用到实际情况中; 总结分布式批量计算和实时计算的思想,理解并熟练运用模型设计中的基本概念、梯度优化策略、损失函数等。

考核评价

掌握分布式计算框架基本概念,主要技术原理和实现机制等。

讲师介绍

详细介绍

01 课程导学
课程导学

(294s)

02 Spark概述
Spark概述

(482s)

Spark设计运行原理

(354s)

Spark安装和部署

(317s)

03 Spark编程基础
RDD编程

(599s)

RDD编程实践

(788s)

键值对RDD编程

(657s)

04 SparkSQL
SparkSQL简介

(434s)

DataFrame的创建和使用

(371s)

DataFrame与SparkSQL编程

(227s)

05 Spark Streaming
Spark Streaming运行原理

(499s)

Spark Streaming使用方法

(448s)

06 Spark Mllib
机器学习原理

(446s)

SparkMLlib工作流

(796s)

SparkMLlib案例

(366s)

技术支持: 钉钉(中国)信息技术有限公司 杭州沃土教育科技股份有限公司