客服咨询

意见反馈

数据获取与预处理实践
大数据//
0.0
61
视频
8.4
课时
119.00
介绍
目录

课程概述

本课程以大数据分析的全流程为目标,包括海量数据抓取、数据分析与预处理和数据可视化三个部分,本课程将综合Python语言课程与数据结构课程的基础知识,将其融会贯通。

课程目标

初步具备海量数据爬取的能力; 经过适当的数据判断与操作,对数据完成基本处理,同时实现基础的数据可视化操作。

考核评价

掌握基本的编程思想,理解模块的概念。

讲师介绍

详细介绍

01 项目导学
项目导学

(558s)

02 数据采集
requests库简介 1

(441s)

requests库简介 2

(691s)

Robots协议和爬虫规范

(797s)

网络爬虫程序基本结构 1

(471s)

网络爬虫程序基本结构 2

(542s)

03 HTML、XML、JSON简介
HTML、XML、JSON简介 1

(456s)

HTML、XML、JSON简介 2

(634s)

04 正则表达式
正则表达式 1

(516s)

正则表达式 2

(621s)

05 Beautiful Soup
Beautiful Soup库简介

(652s)

BeautifulSoup库的基本元素

(579s)

Beautiful Soup的内容获取 1

(447s)

Beautiful Soup的内容获取 2

(644s)

BeautifulSoup的循环遍历 1

(494s)

BeautifulSoup的循环遍历 2

(526s)

06 scray框架简介
scray框架简介 1

(484s)

scray框架简介 2

(534s)

07 XPath简介
XPath简介 1

(600s)

XPath简介 2

(435s)

08 基于Scrapy框架的数据提取
基于Scrapy框架的数据提取

(731s)

09 文件的遍历与基本操作
文件的遍历与基本操作 1

(480s)

文件的遍历与基本操作 2

(771s)

10 数据的导入与导出
数据的导入与导出

(836s)

11 字段拆分
字段拆分

(775s)

12 异常值和缺失值处理
异常值和缺失值处理 1

(492s)

异常值和缺失值处理 2

(535s)

13 重复值处理
重复值处理 1

(456s)

重复值处理 2

(672s)

14 数据分组与统计
数据分组与统计

(844s)

15 数据可视化
数据可视化 1

(442s)

数据可视化 2

(563s)

16 JSON文件的读写操作
JSON文件的读写操作

(728s)

17 饼状图的绘制方法
饼状图的绘制方法

(690s)

18 柱状图和条形图的绘制方法
柱状图和条形图的绘制方法 1

(457s)

柱状图和条形图的绘制方法 2

(469s)

19 折线图和面积图的绘制方法
折线图和面积图的绘制方法 1

(495s)

折线图和面积图的绘制方法 2

(495s)

20 散点图的绘制方法
散点图的绘制方法

(833s)

技术支持: 钉钉(中国)信息技术有限公司 杭州沃土教育科技股份有限公司