破解北京pk10冠亚和值 1比0.95刷流水教程 pk10稳赚技巧方案 北京pk10怎么研究走势 北京pk赛车一天多少期 北京pk赛车历史记录 全天北京pk10赛车计划 北京pk10冠军单双技巧 北京pk两期免费计划 北京pk10冠军公式大全 pk10高手单期人工计划 北京pk10免费人工计划 pk10一天赚300好搞吗 北京pk10杀3码公式 app软件购买北京pk10 北京pk10每天开多少期 北京pk10精准一期计划 北京pk拾全天精准计划 二分pk10怎么玩 pk10怎么引诱别人玩 北京赛車pk10网站 北京pk2期计划在线网站 pk10前三跨度怎么算 赌场最怕什么样的赌法 北京pk赛车彩票官网 怎样控制自己每天赢500 北京pk10正规彩票网站 北京pk10前五1码计划 一无所有怎么白手起家 北京pk10去一尾图解

大数据基础班课程详细列表

第一阶段:JavaSE

初识Java 数据类型和运算符 控制语句和方法 数组及其查找排序算法

第二阶段:Oracle数据库+MySQL+JDBC

数据库和Oracle入门 SQL语句:单表select、DDL SQL语句:连接查询和子查询 数据库对象 三大范式 MySQL PowerDesigner JDBC DBC案例:员工管理系统 XML和反射机制 SQL面试题详解和SQL查询优化

第三阶段:Web前端基础(HTML5+CSS3+JavaScript+jQuery)

HTML/HTML5 CSS/CSS3 JavaScript jQuery

第四阶段:JavaEE阶段(Servlet+JSP+JSTL/EL+Ajax+EasyUI)

Servlet JSP MVC模式、JSTL/EL 过滤器?#22270;?#21548;器 分页和上传下载技术 jQuery Ajax、JSON、Gson EasyUI JavaEE课上项目

第五阶段:linux和高并发

Linux基础 Linux初级 Linux文本操作 Linux文本分析 Linux管理 Linux安装管理 Linux高级 Linux脚本编程 Linux脚本案例 网络基础 四层负载均衡 Keepalived实现高可用 Nginx原理与配置 Nginx的反向代理和负载均衡 Session和缓存

第六阶段:Hadoop生态体系

HDFS基本概念 HDFS高级概念 MR MR源码解析 MapReduce案例 Hive介绍及架构 Hive架构 Hive DDL Hive DML Hive查询 Hive访问方式 Hive安全管理 Hive存储及压缩 Hbase介绍及架构 Hbase架构及操作 Hbase Java API Hbase压缩存储 Flume架构 flume source讲解 flume sink讲解 Sqoop介绍及架构 Sqoop操作 zookeeper ElasticSearch CDH cloudera manager使用 Hue的使用 Impala的安装使用 Oozie的使用

第七阶段:Spark生态体系

Scala基础语言应用 Scala函数编程 Scala字符串、集合 Scala高级应用 Spark基础使用 Spark核心RDD Spark 转换算子 Spark行动算子 Spark 持久化算子 Spark任务提交方式及参数 Spark术语 Spark计算模式 Spark任务调度 Spark任务提交案例 Spark 高阶应用 Spark 核心之Shuffle SparkSQL初级 SparkSQL高级 SparkStreaming流式处理框架 Kafka分布式消息系统应用 SparkStreaming+kafka整合 Redis语法 Storm流式计算 Storm计算详解

第八阶段:机器学习和算法

Python介绍及安装 Python基础知识 Python集合类型 Python函数 Python文件操作 Python类与对象 设计模?#25509;?#24322;常 Python模块及数据库操作 Numpy库 机器学习基础 机器学习算法 机器学习案例

第九阶段:平台架构师课程体系

Hive优化 hbase优化 Spark核心源码分析 Spark核心源码分析 Spark优化 机器学习优化 Kylin介绍及架构 kylin的安装与部署 kylin的使用及访问方式 Flink流式处理框架

大数据基础班课程大纲

第一阶段

JavaSE
  • 01初识Java

    DOS常见命令

    Java跨平台原理

    JDK安装和环境变量配置

    第一个Java程序的编写和运行

    注释

    反编译工具jd-gui

  • 02数据类型和运算符(1)

    进制及其转换

    标识符

    字符编码

    常量和变量

    八大基本数据类型

    final常量 / Scanner / 算术运算符

  • 03数据类型和运算符(2)

    ?#25345;?#36816;算符

    关系运算符

    逻辑运算符

    位运算符 / 条件运算符

    运算符的优先级关系

    基本数据类型的自动转换和强制转换

  • 04控制语句和方法

    if-else选择结构

    switch多重选择结构

    while循环

    do-while循环

    for循环 / 多重循环

    循环跳转break和continue

    方法定义和调用 / 方法重载

  • 05数组及其查找排序算法 (1)

    数组的特点和优缺点

    一维数组及其应用

    for-each循环

    使用数组做方法参数

    顺序查找

    数组工具类

    可变参数 / 二维数组及其应用

  • 06数组及其查找排序算法 (2)

    eclipse安装和使用

    eclipse下调试程序

    递归

    折半查找

    冒泡排序

    选择排序

    直接插入排序

第二阶段

Oracle数据库
+
MySQL+JDBC

第二阶段

Oracle数据库
+
MySQL+JDBC
  • 01数据库和Oracle入门

    数据库相关概念

    认识Oracle

    安装和卸载Oracle

    Oracle目录和用户

    配置监听器和本地网络服务名

    创建用户和分配权限

  • 02SQL语句:单表select、DDL

    select子句

    去除重复行

    where条件查询

    order by排序 / 使用函数

    group by分组 / having分组筛选

    insert / update / delete

  • 03SQL语句:连接查询和子查询

    内连接 / 外连接 / 自连接

    集合查询 / SQL99连接查询 / SQL92连接查询

    不相关子查询

    相关子查询

    rowid / rownum

    分页查询语句

  • 04数据库对象

    数据库表table

    五种约束constraints

    索引index / 序列sequence / 视图view

    存储过程procedure

    事务transaction / 导入导出数据

  • 05三大范式

    范式及作用

    第一范式

    第二范式

    第三范式

    一对一 / 一对多 / 多对多关系

  • 06MySQL

    MySQL简介

    数据库表列类型

    SQL语句

    导入导出数据

    navicat的使用

  • 07PowerDesigner

    认识PowerDesigner

    概念数据模型CDM / 物理数据模型PDM

    反向工程 / 数据库设计案例

  • 08JDBC(1)

    JDBC及其特点

    使用JDBC完成CRUD

    Connection / Statement / ResultSet

  • 09JDBC(2)

    PreparedStatement的优点和使用

    防止SQL注入

    手动事务操作

  • 10DBC案例:员工管理系统

    分层开发 / 查询所有员工 / 查询指定编号员工

    提取工具类DBUtil / 提取业务层

    复用代码 / 添加员工 / 更新员工 / ?#22659;?#21592;工

    完善DBUtil类

    使用Properties类读取属性文件

    后台数据库修改为MySQL / log4j

  • 11XML和反射机制

    XML特点和语法

    XML约束 / 反射作用和使用场合

    Class / Constructor / Field / Method

    使用反射完成动态操作

    使用反射模拟Hibernate的查询操作

    ORM对象关系映射思想

  • 12SQL面试题详解和SQL查询优化

    涉及分组

    连接

    子查询的SQL面试题讲解

    SQL查询优化

第三阶段

Web前端基础
HTML5
+
CSS3
+
JavaScript
+
jQuery
  • 01HTML/HTML5(1)

    HTML入门

    head标签

    body标签

    简单标签

    图片img

    超链接a

    列表list

  • 02HTML/HTML5(2)

    字符实体

    表格table

    表单form

    框架集frameset

    浮动框架iframe

    图层div

    ?#24515;?#20803;素和块元素

  • 03CSS/CSS3

    CSS样式基础

    三种引入方式

    基本选择器

    复合选择器

    超链接伪类样式

    常用CSS样式

    盒子模型 / CSS案例练习

  • 04JavaScript(1)

    JS入门 / JS基本语法

    函数 / 数组 / Date

    String / 事件机制

    浏览器开发者工具

    console

    BOM和DOM基础

    window / location

  • 05JavaScript(2)

    navigator

    history

    DOM获取元素

    DOM操作属性

    DOM操作样式

    DOM操作文本

    DOM操作元素

  • 06jQuery

    jQuery入门

    jQuery对象和DOM对象 / $的作用

    jQuery各种选择器

    操作属性 / 操作样式和文本 / 操作元素

    事件和动画 / 表单验证/ 正则表达式

    jQuery案例练习(表格、Tab、菜单等)

    jQuery框架

第四阶段

JavaEE阶段
Servlet+JSP
+
JSTL/EL+Ajax
+
EasyUI
  • 01Servlet

    HTTP协议 / HTTP请求头和响应头 / 理解无状态协议

    Tomcat安装使用 / 目录结构 / 架构原理

    Servlet作用 / Servlet / GenericServlet

    HttpServlet / Servlet生命周期

    HttpServletRequest / HttpServletResponse

    GET和POST区别 / 解决中文乱码 / 转发和重定向

    绝对路径和相对路径 / HttpSession / Cookie

    ServletContext/ ServletConfig / 注解 / Servlet3.0

  • 02JSP

    Servlet和JSP的关系

    JSP页面组成

    scriptlet

    表达式

    声明

    指令标签 / 动作标签

    JSP底层原理

    9大内置对象 / 4大作用域

  • 03MVC模式、JSTL/EL

    MVC模式

    合并Servlet

    EL的使用

    JSTL常用标签

    EL/JSTL底层原理

    多条件查询

  • 04过滤器?#22270;?#21548;器

    引入过滤器

    解决中文乱码问题

    进行权限验证

    职责链模式

    过滤器的更多原理细节

    监听器作用

    类型和使用

  • 05分页和上传下载技术

    Web项目分页的必要性

    分页工具的创建和使用 / 基本分页

    基本分页优化 / 带查询条件的的分页

    理解上传下载的基本思路

    commons-fileUpload上传API

    实现上传文件到指定目录 / 保存上传信息到数据库

    将服务器的图片在客户端下载

  • 06Ajax、jQuery Ajax、JSON、Gson

    理解Ajax异步请求和刷新的原理和过程

    使用原生Ajax完成多个操作

    使用jQuery Ajax改造多个操作

    JSON的定义和使用

    Gson的使用

    jQuery Ajax+JSON返回复杂数据

    三级联动 / 自动提示

  • 07EasyUI

    认识EasyUI

    EasyUI使用入门

    登录页面

    后台主页面布局

    带查询条件分页操作

    添加

    更新和?#22659;?#25805;作

  • 08JavaEE课上项目

    全面练习JSP/Servlet核心技能

    MVC模式 / Ajax / 数据库设计和多表SQL操作

    PowerDesigner绘制数据库模型图

    业务流程图 / 多种面向对象模型图

    使用ThreadLocal实现业务层事务

    RBAC权限管理、URL权限拦截

    POI、Echarts、JUnit

    My97DatePicker、kindeditor等辅助技术

  • 09阶段项目

    团队开发

    SVN的安装和使用

    丰富的案例库

    进度控制

    数据库设计

    FAQ

    日报

    PPT设计 / 项目答辩

第五阶段

linux和高并发

第五阶段

linux和高并发

第五阶段

linux和高并发
  • 01Linux基础

    操作系统概述

    Linux内核与GNU介绍

    Linux发行版介绍

    虚拟化安装centos / 虚拟网络编辑器

    规划多主机网络通信

    虚拟化管理快照与克隆

    SSH客户端使用与配置

  • 02Linux初级

    Linux命令行原理

    help内部命令帮助

    man命令8?#32844;?#21161;手册

    df/du文件系统分析

    文件系统HFS规范

    文件系统管理命令

    bash的{}、$扩展

  • 03Linux文本操作

    文件内容预览命令

    管道的使用

    基于管道的文件游标预览

    日志文件追踪

    vi命令?#30446;?#25463;操作

    vi命令的编辑模式

    vi命令的末行模式

  • 04Linux文本分析

    grep检索文件 / 正则表达式

    文本分析命令cut

    文本分析命令sort

    文本分析命令wc

    文本分析命令sed

    sed案例:正则和s命令另类使用

    文本分析命令awk

    awk脚本案例?#21644;?#35745;报表

  • 05Linux管理

    系统服务配置文件

    用户管理

    组管理

    权限管理

    案例:多用户角色?#35797;?#32465;定

    网络管理

    进程管理

    后台服务管理

  • 06Linux安装管理

    操作系统软件安装原理

    源码编译安装及原理

    RPM包管理机制原理

    RPM的查询、安装、卸载

    YUM仓库原理

    YUM本地、局域网仓库源配置

    案例:维护多个YUM源

    YUM安装中文帮助文档

  • 07Linux高级

    shell原理、命令原理

    shell解释器的4种脚本执行方式

    shell函数、内部命令、外部命令总结

    文件描述符与重定向

    输出重定向的6种方式

    输入重定向的4种方式

    案例:重定向http协议到网站请求主页

  • 08Linux脚本编程

    本地、局部变量 / 位置、特殊变量

    父子进程、环境变量

    linux中for进程原理 / 管道的子进程执行原理

    引用、命令替换扩展

    命令状态与逻辑?#21368;?/p>

    算数表达式及bash扩展 / 条件表达式

    流程控制语句&bash?#23454;?#25286;分扩展

  • 09Linux脚本案例

    shell脚本:用户管理

    shell脚本:文件管理

    shell脚本:增强for循环遍历文件

    shell脚本:游标for循环遍历文件

    shell脚本:重定向while循环遍历文件

    shell脚本:管道+while循环遍历文件

    bash解释器的7中命令扩展总结

  • 10网络基础

    高并发及解决方案概述

    TCP/IP协议资深讲解:应用层

    TCP/IP协议资深讲解:传输控制层

    TCP/IP协议资深讲解:TCP协议/报文/三次握手

    TCP/IP协议资深讲解?#21644;?#32476;层

    TCP/IP协议资深讲解:路由表和IP协议原理

    TCP/IP协议资深讲解:链路层

    TCP/IP协议资深讲解:ARP协议及?#25442;换?#21407;理

  • 11四层负载均衡

    四层负载均衡LVS拓扑

    NAT网络原理

    LVS的DNAT模式分析

    LVS的DR模式分析

    LVS的TUN模式分析

    LVS的静态调度算法

    LVS的动态调度算法 / 内核配置ARP协议

    LVS的命令讲解 / LVS的DR模式实验搭建

  • 12Keepalived实现高可用

    高可用概述

    健?#23548;?#26597;及故障迁移策略

    分布式选主策略

    keepalived原理

    keepalived配置文件详解

    基于keepalived的高可用LVS

    高可用验证

    后端健?#23548;?#26597;验证

  • 13Nginx原理与配置

    单点性能压力下的面向服务开发理论

    反向代理服务器原理

    Nginx介绍 / Nginx和Apache的httpd?#21592;?/p>

    IO的阻塞模型和异步非阻塞模型

    Nginx角色框架原理 / Nginx的内核参数配置

    Nginx的内核sendfile零拷贝原理

    Nginx的TCP配置

  • 14Nginx的反向代理和负载均衡

    Nginx的虚拟服务器原理

    Nginx的location匹配规则

    Nginx的自动索引

    Nginx的反向代理服务器配置

    Nginx的upstream负载均衡配置

    Nginx的DNS负载均衡配置

    Nginx负载均衡下数据一致?#36234;?#20915;方案

  • 15Session和缓存

    Session一致性问题

    Session复制

    Session共享

    Session同步

    Memcached的缓存

    K-V格式缓存

    Tomcat和Memcache / 缓存服务器

第六阶段

Hadoop生态体系

第六阶段

Hadoop生态体系

第六阶段

Hadoop生态体系

第六阶段

Hadoop生态体系

第六阶段

Hadoop生态体系
  • 01HDFS基本概念

    1T文件处理

    Hadoop历史 / Hadoop架构

    NameNode讲解

    SecondaryNameNode讲解

    DataNode与?#21271;?#38450;治策略

    HDFS权限 / HDFS安全模式

    HDFS文件上传流程 / HDFS读文件流程

    伪分布式集群搭建

  • 02HDFS高级概念

    hadoop完全分布式集群搭建

    hadoop3新特性

    NameNode的Federation

    NameNode-HA

    NameNode-HA集群搭建

    NameNode-HA手动切换

    NameNode-HA自动切换

    java客户端操作HDFS

  • 03MR

    MapReduce简介与原语

    MapReduce执行流程

    二次排序

    MapReduce作业提交流程

    MapReduce作业执行流程

    YARN-ResourceManager-HA搭建

    运行?#28304;?#30340;wordcount程序

    手写wordcount程序

  • 04MR源码解析

    MapReduce作业提交流程源码解析

    作业切片计算的源码解析

    MapTask输入方式的源码解析

    MapTask执行流程源码解析

    MapTask输出方式的源码解析

    MapTask环形缓冲区源码解析

    RedueTask的shuffle源码解析

    ReduceTask分组的源码解析

    ReduceTask输出的源码解析

  • 05MapReduce案例

    天气案例需求分析 / 天气案例映射为MR原语

    天气案例键值对设计 / 天气案例开发和运行

    天气案例排序比较器分组比较器设计

    好友推荐需求分析 / 好友推荐映射为MR原语

    好友推荐键值对设计 / 好友推荐开发和运行 / 好友推荐TopN

    PageRank简介及算法介绍 / PageRank映射为MR原语

    PageRank键值对设计 / PageRank编码和运行

    TFIDF简介及算法 / TFIDF映射为MR原语

    TFIDF键值对设计 / TFIDF编码和运行

    itemCF简介及算法 / itemCF键值对设计 / itemCF编码和运行

  • 06Hive介绍及架构

    hive的介绍

    数据仓库概念讲解

    数据仓库与数据库区别

    Hive的架构原理

    Hive元数据讲解

    Hive的使用场景

    Hive的优缺点

    Hive的执行引擎

    Hive操作符

    Hive语法解析

  • 07Hive架构

    linux环境下mysql安装

    mysql登录权限修改

    Hive三种安装搭建模式

    Hive元数据存储到mysql

    基于内存数据库模式搭建

    基于远程数据库模式搭建

    基于远程数据库服务搭建

    Hive配置文件讲解 / Hive命令操作

  • 08Hive DDL1

    Hive基础数据类型

    Hive复杂数据类型

    Hive数据类型转换

    Hive创建数据库

    Hive创建表三种方式

    Hive创建管理表

    Hive创建外部表

    Hive数据读取规则Row Format

  • 09Hive DDL2

    Hive数据读取规则 Serde

    Hive静态分区管理

    Hive动态分区管理

    Hive?#22659;?#34920;

    Hive修改表

    Hive分桶表管理

    Hive视图

    Hive索引

  • 10Hive DML

    Hive从本地加载数据

    Hive从hdfs加载数据

    Hive通过查询插入数据

    Hive插入数据到指定目录

    Hive insert values插入操作

    Hive事务管理

    Hive事务特性

    Hive事务配置

    Hive修改数据 / Hive?#22659;?#25968;据 / Hive清空数据

  • 11Hive查询

    Hive全表查询

    Hive条件查询

    Hive分组查询

    Hive运算符

    Hive内置函数

    Hive自定义函数

    Hive表连接

    Hive排序方式

    Hive嵌套查询 / Hive行转列

  • 12Hive访问方式

    Hive命令行方式

    Hive元数据管理

    Hiveserver2讲解

    Hive beeline客户端讲解

    Hive JDBC操作

    Hive参数

    Hive变量

    Hive脚本运行方式

    Hive GUI方式

  • 13Hive安全管理

    Hive授权模式

    Hive Legacy Mode

    Hive 基于SQL标准授权模型

    Hive 基于元数据授权模型

    Hive角色管理

    Hive授权命令

    Hive回收权限命令

  • 14Hive存储及压缩

    Hive存储压缩管理

    Hive列式存储 / Hive行式存储

    Hive textfile

    Hive sequencefile

    Hive orc file

    Hive parquet file

    Hive map端输出 / Hive reduce端输出

  • 15Hbase介绍及架构

    hbase介绍 / NoSQL介绍

    Hbase特点 / Hbase存储数据结构

    Hbase数据模型 / Hbase表结构介绍

    Hbase架构图 / Hbase角色

    Hbase内存结构介绍

    Hbase存储数据结构LSM树

    Hbase写数据流程 / Hbase读数据流程

  • 16Hbase架构及操作

    Hbase standalone模式安装

    Hbase 完全分布式安装

    Hbase 高可用

    Hbase搭建注意

    Hbase基本命令

    Hbase DDL命令 / Hbase DML命令

    Hbase命名空间命令

  • 17Hbase Java API

    Hbase创建表 / Hbase?#22659;?#34920;

    Hbase插入数据 / Hbase更新数据

    Hbase?#22659;?#25968;据

    Hbase获取一条数据

    Hbase获取某个?#27573;?#30340;数据

    Hbase过滤器

    Hbase与MR集成 / Hbase与hive集成

  • 18Hbase压缩存储

    Protobuffer讲解

    Protobuffer安装

    Protobuffer配置基本类型

    Protobuffer配置集合类型

    Protobuffer生成Java类

    Hbase读取Protobuffer生成的类

    Hbase压缩存储

  • 19Flume架构

    Flume日志收集工具

    Flume agent架构

    Flume组件

    Flume集群讲解

    flume不同架构介绍

    flume安装 / flume配置信息

    flume单台安装 / flume集群安装

    flume高可用讲解

  • 20flume source讲解

    Avro source

    Thrift source

    Exec source

    Spooling directory source

    Kafka source

    Netcat source

    自定义Source

    Source的分类

  • 21flume sink讲解

    Hdfs sink

    Hive sink

    Hbase sink

    Avro sink

    Thrift sink

    Logger sink

    Kafka sink

    自定义Sink

  • 22Sqoop介绍及架构

    Sqoop简介

    ETL讲解

    Sqoop架构图

    Sqoop架构设计

    Sqoop版本介绍

    Sqoop导入

    Sqoop导出

    Sqoop安装 / Sqoop配置

  • 23Sqoop操作

    Sqoop导入数据到hdfs

    Sqoop导入数据到hive

    Sqoop导入数据到hbase

    Sqoop通过查询语句到hdfs

    Sqoop导出数据到mysql

    导出配置

    Hdfs配置 / Hbase配置

    数据库配置

  • 24zookeeper

    分布式协调框架

    Zookeeper背景与介绍

    分布式zookeeper环境及安装

    Zookeeper源语命令操作

    关于节点类型、版本、元数据信息的意义

    Zookeeper 的api 环境java操作集群演示

    事件注册与节点的变更

    基于zookeeper的分布式协调案例

  • 25ElasticSearch

    ElasticSearch的现状与前景

    Lucene框架与倒排索引原理

    Lucene框架在el search搜索引擎中的作用

    ElasticSearch全分布式特性

    ElasticSearch的环境要求与安装

    Curl命令与rest风格的使用

    Api搜索项目演示1

    Api搜搜项目演示2

  • 26CDH

    国内外大数据平台介绍

    Cloudera产品介绍

    什?#35789;荂DH

    什?#35789;莄loudera manager

    什?#35789;莄loudera manager service

    cloudera manager框架原理

    集群基础设施配置

    纯手工安装cloudera manager

  • 27cloudera manager使用

    cloudera manager部署CDH

    cloudera manager管理主机

    cloudera manager管理集群、管理服务

    cloudera manager管理实例、管理配置

    cloudera manager管理监控、管理?#35797;?/p>

    cloudera manager service图表使用

    cloudera manager service图表创建

    cloudera manager service的dashboard

  • 28Hue的使用

    Hue介绍

    Hue安装

    Hue的HDFS管理与使用

    Hue的YARN管理与使用

    Hue的HIVE管理与使用

    Hue的Oozie管理与使用

    Hue的metadata管理与使用

    Hue的用户管理与使用

  • 29Impala的安装使用

    Impala介绍 / 内存计算与MR,SPARK计算的比较

    impala框架角色讲解 / impala的安装

    impala的命令行使用 / impala的命令参数详解

    impala的内部命令详解 / impala的SQL的ddl

    impala的SQL的dml / impala的SQL的dql

    impala的文件格?#25509;?#21387;缩

    impala的hbase整合

    impala的配置与监控 / impala的调优

  • 30Oozie的使用

    Oozie介绍

    Oozie的基于hadoop的分布式调度原理

    Oozie框架角色原理

    Oozie的xml配置文件

    Oozie的job配置文件

    Oozie的命令

    Oozie的配置与监控

    Oozie的开发

第七阶段

Spark生态体系

第七阶段

Spark生态体系

第七阶段

Spark生态体系

第七阶段

Spark生态体系

第七阶段

Spark生态体系
  • 01Scala基础语言应用

    Scala背景介绍

    Scala语言六大特性

    Scala下载安装配置

    Scala IDE开发Scala配置

    IDEA 开发Scala配置

    Scala类型推断机制

    Scala数据类型

    Scala基本语法

    Scala类和对象 / Scala 循环、?#21368;?/p>

  • 03Scala函数编程

    Scala函数定义

    Scala递归函数

    Scala默?#29616;?#20989;数

    Scala可变参数函数

    Scala匿名函数

    Scala嵌套函数

    Scala偏应用函数

    Scala高阶函数

    Scala柯里化函数

  • 04Scala字符串、集合

    Scala String操作

    Scala Array 操作

    Scala可变数组操作

    Scala List 操作

    Scala 可变列表操作

    Scala Set 操作

    Scala 可变Set操作

    Scala map 操作 / Scala 可变map操作

    Scala 元组操作及要点

  • 05Scala高级应用

    Scala伴生类 / Scala伴生对象

    Scala样例类 / Scala样例类案例

    Scala Trait要点 / Scala Trait 案例

    Scala match匹配

    Scala隐式值操作 / Scala隐?#35762;?#25968;操作

    Scala隐式函数操作 / Scala隐式类操作

    ScalaActor通信模型

  • 06Spark基础使用

    Spark技术介绍 / Spark技术站详解

    Spark演变历史 / Spark与MR的区别

    Spark 基于eclipse配置

    Spark基于IDEA配置

    Spark运行模式介绍

    Spark集群搭建 / Spark配置选项详解

    Spark Pi 任务提交运行 / Spark客户端搭建

  • 07Spark核心RDD

    Spark编程核心RDD

    SparkRDD原理及使用

    RDD结构及注意点

    RDD五大特性

    RDD弹性原理

    RDD分布式原理

    RDD容错原理

  • 08Spark 转换算子

    map算子使用 / flatMap算子使用

    filter算子使用 / sample算子使用

    reduceByKey算子使用 / SortByKey算子使用

    Join、union算子使用

    Cogroup算子使用

    distinct使用

    repartition算子使用

    coalesce算子使用

    zip,zipWithIndex使用

  • 09Spark行动算子

    Foreach算子使用

    Take算子使用

    SaveAsTextFile使用

    Count算子使用

    Take算子使用

    Collect算子使用

    First算子使用

    CountByKey使用

    CountByValue使用 / Reduce使用

  • 10Spark 持久化算子

    持久化数据级别分类

    持久化算子cache使用

    Cache要点注意事项

    持久化算子persist使用

    Persist要点注意事项

    持久化算子Checkpoint

    Checkpoint执行流程

    Checkpoint注意事项

    Checkpoint使用优化

  • 11Spark任务提交方式及参数

    Standalone-client模式原理 / 模式流程详解

    Standalone-cluster模式原理

    Standalone-cluster模式流程详解

    Yarn-client模式原理 / Yarn-client模式流程详解

    Yarn-cluster模式原理 / Yarn-cluster模式流程详解

    Client模式提交命令和特点

    Cluster模式提交命令和特点 / Spark任务提交参数详解

  • 12Spark术语

    Spark-ClusterManager

    Spark-Driver

    Spark-Master

    Spark-Worker

    Spark-Executor / Spark-线程池

    Spark-Application / Spark-job

    Spark-Stage / Spark-task

  • 13Spark计算模式

    SparkRDD窄?#35272;?/p>

    SparkRDD宽?#35272;?/p>

    SparkStage切割划分

    SparkStage计算模式

    Pipeline管道数据落地

    Stage并行度划分

    提高Stage并行度方式

  • 14Spark任务调度

    任务调度角色划分 / ?#35797;?#35843;度角色划分

    Spark?#35797;?#35843;度过程

    Spark任务调度过程

    SparkDAG有向无环图

    粗粒度?#35797;?#30003;请特点 / 细粒度?#35797;?#30003;请特点

    Spark推测执行机制

  • 15Spark任务提交案例

    Spark pv,uv案例

    Spark WordCount案例

    Spark二次排序案例

    Spark分组取topN案例

    Spark分组取topN优化

    Spark处理数据思路转换

  • 16Spark 高阶应用

    广播变量及注意事项 / 累加器及注意事项

    自定义累加器 / 版本?#21592;?#21464;化

    Spark-WebUI详解 / Spark日志查看

    Pipeline计算模式验证 / 历史日志服务器配置

    MasterHA高可用原理 / MasterHA高可?#38376;?#32622;

    MasterHA搭建注意点

  • 17Spark 核心之Shuffle

    SparkShuffle概念

    Spark-HashShuffle普通机制、优化机制

    Spark-SortShuffle普通机制

    Spark-SortShufflebypass机制

    HashShuffle执行流程详解 / SortShuffle执行流程详解

    HashShuffle与SortShuffle?#21592;?/p>

    Shuffle文件寻址详解 / Spark oom问题处理

    Spark统一内存管理划分 / Spark静态内存管理划分

  • 18SparkSQL初级

    Shark原理分析

    SparkSQL原理分析 / SparkSQL演变过程

    DataFrame与DataSet

    SparkSQL数据源 / SparkSQL底层架构

    SparkSQL谓词下推 / Json格式数据转DataSet

    普通RDD和DataSet互操作

    Parquet数据转DataSet

    JDBC数据转DataSet / aS

  • 19SparkSQL高级

    SparkSQL序列化问题

    Hive On Spark原理

    Spark On Hive原理

    Spark On Hive配置详解

    SparkSQL DataSet存储

    SparkSQL之UDF

    SparkSQL之UDAF

    SparkSQL之over函数

  • 20SparkStreaming流式处理框架

    SparkStreaming介绍

    SparkStreaming&Strom

    SparkStreaming接受数据原理

    SparkStreaming之Dstream

    SparkStreaming读取Socket数据

    foreachRDD算子使用

    transform算子使用

    updateStateByKey算子使用

    window窗口操作

    reduceByKeyAndWindow使用

    DriverHA原理及搭建

  • 21Kafka分布式消息系统应用

    Kafka分布式消息系统介绍

    Kafka应用场景

    Kafka生产消息原理

    Kafka存储消息原理

    Kafka Topic、partition原理

    Consumer消费消息原理

    Kafka集群搭建 / Kafka命令使用

    Kafka消息系?#31243;?#28857;

    KafkaLeader均衡机制

    Kafka版本更改?#21592;?/p>

    KafkaTopic更改、?#22659;?/p>

  • 22SparkStreaming+kafka整合

    Receiver模式整合原理

    Receiver模式问题及优化

    Direct模式整合原理

    Direct模式Api使用

    WAL机制配置及使用

    Receiver模?#35762;?#34892;度设置

    Direct模?#35762;?#34892;度设置 / Direct模式offset管理

    新版本Direct模式使用 / 新版本Direct模式?#21592;?/p>

    新版本Direct模式offset管理

    SparkStreaming配置参数详解

    SparkStreaming反压机制

  • 23Redis语法

    Redis介绍

    String1类型 / String2类型

    List1类型 / List2类型

    Set类型 / Sorted set类型

    Rdb 与aof类型

    无主架构模型 / 主从架构模型

    Redis集群搭建

  • 23Storm流式计算

    Storm应用场景

    Storm架构模型

    Storm框架介绍

    Storm单词统计练习

    Storm分组策略

    Storm分组实践

    Storm伪分布式安装

  • 24Storm计算详解

    Storm异?#25509;?#21516;步实时分析框架和实例

    Storm全分布式

    drpc实现

    kafka 与storm

    flume+kafka+storm

    Storm容错 / Storm事务

    Storm电信项目

第八阶段

机器学习和算法

第八阶段

机器学习和算法

第八阶段

机器学习和算法
  • 01Python介绍及安装

    Python介绍

    Python历史

    Python优缺点

    Python应用场景

    Python下载 / Python安装

    Python ide安装

    Python helloworld

    Python?#25442;?#24335;窗口

  • 02Python基础知识

    Python注?#22270;?#20081;码

    Python变量 / Python类型

    Python标识符 / Python关键字

    Python输入 / Python输出

    Python运算符

    Python分支结构

    Python input陷阱

    Python 循?#26041;?#26500;

  • 03Python集合类型

    字符串

    列表

    元组

    字典

    可变类型

    不可变类型

    集?#31995;?#36845;代

    集合排序 / 集合嵌套

  • 04Python函数

    Python函数介绍

    函数的定义与调用

    Python参数

    Python返回值

    Python递归函数

    Python匿名函数

    高阶函数 / 高阶函数和递归计算

    斐波拉契数列

  • 05Python文件操作

    Python文件的打开与关闭

    Python的?#21015;?/p>

    Python的定位?#21015;?/p>

    Python文件操作

    Os模块

    文件批量处理

    Mp3音乐播放

    文件批量处理

  • 06Python类与对象

    面向对象编程介绍

    类与对象

    定义类与创建对象

    Self

    保护对象的属性

    继承 / 多继承 / 多态

    类属性与实例属性

    类方法与静态方法

  • 07设计模?#25509;?#24322;常

    单例模式

    工厂模式

    异常简介

    异常捕获

    异常的传递

    自定义异常

    异常处理中排除异常

    异常的分类

  • 08Python模块及数据库操作

    模块的使用与安装

    模块制作

    Python中的模块

    模块的发布

    模块安装及使用

    Python连接mysql

    Python查询数据库

    数据API / API的封装

  • 09Numpy库

    numpy介绍 / numpy特点

    numpy安装 / numpy基础

    矩阵的创建 / 矩阵的属性

    矩阵的基本运算

    矩阵的常用函数

    矩阵的切片

    矩阵的索引

    矩阵的迭代 / 矩阵的形状操作

  • 08机器学习基础

    PySpark基础配置

    Python开发工具配置

    PySpark运行开发原理

    Python模块安装方式

    机器学习数学基础 / 线性回归原理

    梯度下?#26723;?#20195;?#33539;?#27169;型

    多元线性回归原理 / 参数优化

    模型过拟合问题 / 模型欠拟合问题

    线性回归案例分析

  • 09机器学习算法一

    贝?#31471;?#20998;类算法

    贝?#31471;?#27010;率分类原理

    贝?#31471;构?#24335;推广

    拉普拉?#26500;?#35745;原理

    模型保存

    KNN算法原理

    KNN问题

    机器学习中的归?#25442;?/p>

    距离度量方式

  • 10机器学习算法二

    Kmeans聚类算法原理

    Kmeans聚类问题

    Kmens++算法

    K值的选择策略

    TF-IDF原理

    逻辑回顾分类算法原理

    ?#36947;?#21494;变化

    最大似然估计思想

    逻辑回归构造损失函数

  • 11机器学习算法三

    逻辑回顾损失函数公式?#39057;?/p>

    逻辑回归归?#25442;?/p>

    混淆矩阵

    ROC&AUC评估指标

    推荐系统原理

    推荐系统架构

    lambda架构处理数据

  • 12机器学习算法四

    实时和离线场景应用

    ML下python在Hive中应用

    dubbo使用zookeeper协调应用

    dubbo服务提供端原理

    dubbo服务消费端原理

    dubbo在推荐系统中应用

    实时在线推荐app

  • 13机器学习案例

    垃圾邮件分类案例

    数据点基于贝?#31471;?#20998;类案例

    手动实现KNN算法 / 数据点基于KNN算法分类

    数据点Kmeans聚类案例

    基于Python的KMeans可视化

    微博聚类案例 / 音乐分类案例

    道路拥堵预测案例 / 推荐系统

第九阶段

平台架构师课程体系

第九阶段

平台架构师课程体系

第九阶段

平台架构师课程体系
  • 01Hive优化

    hive优化思想 / hive查询计划

    hive本地模式 / hive并行计算

    hive?#32454;?#27169;式 / hive排序

    hive map join / hive大表join

    hive map-side聚合

    hive合并小文件

    hive map与reduce个数

    hive-jvm重用

    Hive数据倾斜 / Hive脚本编程

    Hive脚本执行架构 / Hive的任务的监控

  • 02hbase优化

    预分区 / Rowkey设计 / 列族个数

    Compact合并优化

    Split优化

    多htable并发写

    Htable参数设置

    批量写 / 批量读

    多线程并发写 / 多htable并发读

    多线程并发读

    缓存查询结果

    Blockcache / Htablepool / Hbase索引

  • 03Spark核心源码分析

    Spark-pipeline iter 源码分析

    map源码分析

    flatMap源码分析

    reduceByKey源码分析

    combineByKey源码分析

    aggregateByKey源码分析

    sortByKey源码分析

    repartition源码分析

    coalesce源码分析

    distinct源码分析

  • 04Spark核心源码分析

    Spark-Master启动源码分析

    Spark-Worker启动源码分析

    Spark-Driver启动源码分析

    Spark-Application注册源码分析

    Spark-Executor启动源码分析

    Spark-?#35797;?#35843;度源码分析、任务调度源码分析

    Spark-Shuffle-Write源码分析

    Spark-Shuffle-Read源码分析

  • 05Spark优化

    Spark分配更多的?#35797;?/p>

    Spark并行度调优 / Spark 代码调优

    Spark 算子选择使用

    Spark 自定义分区器

    Spark数据结构优化 / Spark数据本地化调优

    Spark内存调优 / Spark对外内存调优

    SparkShuffle调优

    Spark数据倾斜不同解决方案

  • 06机器学习优化

    有无截距

    线性不可分问题

    调整分类域值

    鲁棒性调优

    归?#25442;?#25968;据

    均值归?#25442;?/p>

    逻辑回归训练方法选择

    机器学习中python脚本优化

  • 07Kylin介绍及架构

    kylin的背景介绍 / kylin的应用场景

    kylin的发展历史 / kylin的工作原理

    kylin的体系架构

    kylin的核?#27169;琧ube构建

    kylin的sql查询原理 / kylin的特?#38498;?#29983;态圈

    kylin事实表 / kylin维度表

  • 08kylin的安装与部署

    kylin的下载 / kylin的安装准备

    kylin的部署方式 / kylin安装部署

    KyLin和Hive / KyLin和hbase

    KyLin和Zookeeper

    OLAP分类

    ?#20999;?#27169;型 / 雪花模型

  • 09kylin的使用及访问方式

    simple cube描述

    cube构建

    kylin的视图

    kylin的元数据存储

    kylin JDBC访问方式

    kylin rest方式

  • 10Flink流式处理框架一

    Flink架构原理

    Flink与Storm的区别

    Flink与SparkStreaming的区别

    Flink编程模型抽象层次

    Flink无界数据流

    Flink有界数据流

    Flink程序和数据流

    Flink保存点

  • 11Flink流式处理框架二

    窗口和时间

    有状态算子操作

    容错检查点原理

    Flink任务和算子链

    Flink-TaskManager

    Flink-JobManager

    任务槽和?#35797;?/p>

    Flink下载安装使用

  • 12Flink流式处理框架三

    Flink-DataStream Api操作

    Flink与Kafka整合

    基于本地模型部署Flink

    基于Yarn模式部署Flink

    TableApi 及SQL查询使用

    网页排名案例实现

    数据类型和序列化

    Flink高可用 / Flink状态和容错

大牛引路,实战贯穿!

  • 智慧交通项目
  • 电商日志分析项目
  • 游戏运营分析项目
  • App个性化推荐项目
  • 联盟广告分析项目

阿里?#26742;?#22522;于杭州智慧交通项目

智慧交通是指在交通领域中充分运用大数据、云计算、互联网、机器学习、等技术,通过高新技术汇集交通信息,?#36234;?#36890;管理、交通运输、公众出行等等交通领域全方面以及交通建设管理全过程进行管控支?#29275;?#20351;交通系统在区域、城市甚至更大的时空?#27573;?#20855;?#29238;?#30693;、互联、分析、预测、控?#39057;?#33021;力,以充分保障交通安全、发挥交通基础设施效能、提升交通系统运行效率和管理水平,为通畅的公众出行和?#27801;中?#30340;经济发展服务。

项目模块:

天网搜车,智能?#20449;校?#36712;迹分析,套?#21697;?#26512;,稽查布控,跟车分析,昼伏夜出,统?#21697;?#26512;等15大模块。

技术架构:

hdfs +spark +kafka +flume + spark Streaming +spark MLlib+redis

某大型电商日志分析项目

日志分析项目是以数据为驱动,关注电商运营每一个?#26041;冢?#36143;穿不同运营阶段,随时发现运营问题,调整运营计划。一般来?#26723;?#21830;平台每天会产生100G到50T左?#19994;?#26085;志数据。有了海量的数据就可以挖掘出有价值的决策依据。

需求模块:

用户分析,流量分析,活动效果分析,渠道分析和订单分析等8?#22235;?#22359;

技术架构:

nginx + HDFS+ mapreduce +Hive+hbase +spark +flume +sqoop+mysql +D3

大型游戏运营分析项目

大型网络游?#35775;?#22825;会产生10G—100G的数据,通过大数据分析可以帮助追踪注册转化率数据、快速定位注册刷号行为。通过对关卡的访问数,成功率,失败原因进行分析,来合理调整难易?#21462;?#28216;戏生产虚拟物品,而不是印钞。您需要?#19994;?#29609;家在不同阶段对哪类物品有最强?#35272;擔?#25165;能刺激痛点策划拉收。

项目模块:

玩家在线分析,等级分析,任务难度分析,收入分析,虚拟消费分析等7大模块。

技术架构:

linux+hdfs+spark+mapreduce+hive+hbase。

App个性化推荐项目

推荐系统是利用 大数据和数据挖掘技术向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户?#34892;?#36259;的信息和商品。

功能模块:

清洗数据,构建训练集,训练模型,评估模型,推荐APP等

技术架构:

hdfs +hive +hbase +kafka +spark +spark MLlib+ python+redis +dubbo

联盟广告分析项目

广告分析是指用大数据来分析和测定广告促进商品或劳务销售的效果。可以检验广告目标是否正确、广告媒体运用是否得当、广告分布时间与频率是否适宜、投入的广告费用是否合理等,从而进一步检验出广告决策是否正确、广告创意设计是否需要改进?#21462;?#24191;告分析,能较客观地测定广告效果所取得的效益,提高广告主对广告的信?#27169;?#20063;有利于广告公司的业务发展。

项目模块:

联盟广告分析项目-项目模块:这块没有提供文案

技术架构:

nginx + HDFS+ mapreduce +Hive+hbase +spark +flume +sqoop+mysql +D3

其他培训机构一直在模仿我们的项目,却讲不明白项目的思路,大数据实战项目,思路?#25925;?#21407;装的好

领取hadoop实战书一本 >>

领取机器学习数据(100课时) 平台架构师(140课时)
大数据174.35G视频

  • 北京校区
  • 山西校区
  • 郑州校区
  • 武汉校区
  • 四川校区
  • 长沙校区
  • 深圳校区
  • 上海校区
  • 广州校区
  • 保定招生办

山西学区地址:山西省晋中市榆次区大学城大学生活广场万科商业A1座702

郑州学区地址?#27721;幽系?#23376;商务产业园6号楼4层407
咨询电话:0371-55177956

武汉学区地址?#27721;?#21271;省武汉市江夏区江夏大道26号 宏信悦谷创业园4楼
咨询电话:027-87989193

四川学区地址:成都市高新区锦晖西一街99号布鲁明顿大厦2栋1003室
咨询电话:028-65176856 / 13880900114

网址:http://www.cssxt.com/
咨询电话:0731-83072091

深圳校区地址:深圳?#26012;?#23433;区航城?#20540;?#33322;城大道航城创新创业园A4栋210(固戍地铁站C出口)
咨询电话:0755-23061965 / 18898413781

上海尚学堂?#23665;?#26657;区地址:上海市?#23665;?#21306;荣乐东路2369弄45号绿地伯顿大厦2层
咨询电话:021-67690939

广州校区地址:广州市天河区元岗横路31号慧通产业广场B区B1栋6楼尚学堂(地铁3号线或6号线到“天河客运站”D出口,?#22812;?#30452;走约800米)
咨询电话:020-2989 6995

保定招生办公室

地址?#27721;?#21271;省保定市?#30418;?#21306;朝阳南大街777号鸿悦国际1101室

电话:15132423123

Copyright 2006-2019 北京尚学堂科技有限公司  京ICP备13018289号-19  京公网安备11010802015183  
媒体联系:18610174079 ?#35780;?#24072;  
pk10单双最好方法