信盈达—您身边的嵌入式&人工智能专家
全国免费咨询热线:400-8788-909

python大数据处理方向学习路线

时间:2019-06-24 00:00:00 来源:信盈达 作者:信盈达

Python的学习,知识涵盖极为广泛,对不同应用目标的学习,进阶的路线有很大的差异。下面分享一下python大数据处理方向的学习路线,希望对大家有所帮助。


1、Python基础学习

(1)Python语句

学习python的运算符和表达式,声明语句,基本的输入输出语句、注释语句、流程控制语句

(2)函数、模块和包

函数的定义和使用,模块的导入,多模块和包声明

(3)数据结构

元组,列表,字典,集合的抽象与使用

(4)面向对象

类定义、对象的构建和实例化、子类继承和方法重写、异常类的使用

(5)正则表达

字符串匹配和过滤,数据的搜寻和识别

(6)文件操作

文件和目录的新建与查找,文件内容的读取与写入

2、大数据进阶学习

(1)Linux系统及网络服务

Linux操作系统命令行环境,网络服务配置

(2)Hadoop核心组件

MapReduce和HDFSGoogleHadoop的概念,Hive数据仓库操作,HBase存储设计,Pig计算,Sqoop数据迁移,Oozie、Azkaban工作流

(3)Spark技术

Spark大数据处理Spark的特点与应用场景,PythonSpark程序开发,GraphX架构

3、大数据高级学习

(1)SparkMLlib与机器学习

机器学习分类及算法,MLlib算法库

(2)Storm实时开发框架

Storm的开发环境与生产环境,拓扑与流分组,spout和bolt类

(3)Storm的辅助框架

Zookeeper分布式服务框架,storm-starter项目管理,trident实时计算抽象

(4)大数据架构设计

flume数据采集+kafka数据缓冲接入+storm流式计算+mysql分析结果持久化存储


以上就是python大数据处理方向的学习路线。