python大数据处理方向学习路线
时间:2019-06-24 00:00:00
来源:信盈达
作者:信盈达
Python的学习,知识涵盖极为广泛,对不同应用目标的学习,进阶的路线有很大的差异。下面分享一下python大数据处理方向的学习路线,希望对大家有所帮助。
1、Python基础学习
(1)Python语句
学习python的运算符和表达式,声明语句,基本的输入输出语句、注释语句、流程控制语句
(2)函数、模块和包
函数的定义和使用,模块的导入,多模块和包声明
(3)数据结构
元组,列表,字典,集合的抽象与使用
(4)面向对象
类定义、对象的构建和实例化、子类继承和方法重写、异常类的使用
(5)正则表达
字符串匹配和过滤,数据的搜寻和识别
(6)文件操作
文件和目录的新建与查找,文件内容的读取与写入
2、大数据进阶学习
(1)Linux系统及网络服务
Linux操作系统命令行环境,网络服务配置
(2)Hadoop核心组件
MapReduce和HDFSGoogleHadoop的概念,Hive数据仓库操作,HBase存储设计,Pig计算,Sqoop数据迁移,Oozie、Azkaban工作流
(3)Spark技术
Spark大数据处理Spark的特点与应用场景,PythonSpark程序开发,GraphX架构
3、大数据高级学习
(1)SparkMLlib与机器学习
机器学习分类及算法,MLlib算法库
(2)Storm实时开发框架
Storm的开发环境与生产环境,拓扑与流分组,spout和bolt类
(3)Storm的辅助框架
Zookeeper分布式服务框架,storm-starter项目管理,trident实时计算抽象
(4)大数据架构设计
flume数据采集+kafka数据缓冲接入+storm流式计算+mysql分析结果持久化存储
以上就是python大数据处理方向的学习路线。