大数据时代已来,您准备好了吗?

前景一:国家战略 大数据国家战略-加米谷大数据 国务院印发《促进大数据发展行动纲要》,李克强总理出席大数据产业峰会,习近平主席主持推动实施国家大数据战略,加快完善数字基础设施,加快建设数字中国,更好服务我国经济社会发展和人民生活改善。

前景二:技术应用 大数据技术应用-加米谷大数据 国内国外顶级互联网公司如亚马逊、阿里巴巴、FaceBook、雅虎、淘宝、美团、360、京东等全部使用大数据技术架构,其他很多IT信息技术企业逐步使用大数据技术开发产品满足市场需求。

前景三:社会需求 大数据社会需求-加米谷大数据 随着IT信息技术的发展,很多从事传统IT技术的人已经不满足大型企业很需求。人才市场对大数据人才的需求巨大,薪资比传统IT信息技术翻一倍不止。

掌握大数据技术,让您真正步入高薪精英阶层
大数据开发 大数据开发人员收入 大数据开发人员收入
Hadoop工程师 Hadoop工程师收入 Hadoop工程师收入
大数据算法工程师 大数据算法工程师收入 大数据算法工程师收入

海量大数据技术岗位等您来
海量大数据技术岗位等您来
麦肯锡报告 全球最顶尖管理咨询公司麦肯锡(McKinsey)出具的一份详细分析报告显示,预计到2018年,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在140000到190000之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达1500000!
大数据钱景 事实上,大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构,到处需要大数据项目来做创新驱动。数据分析或数据处理的岗位报酬也非常丰厚,在硅谷,入门级的数据科学家的收入已经是6位数了(美元)。

专注于打造全流程的大数据开发人才
熟练掌握Java语法并灵活运用,能够基于Java开发后台应用 Java基础
大数据基础 熟练掌握Linux及Maven等相关知识并灵活运用
深入理解Hadoop技术体系的原理并灵活运用及调优 Hadoop技术体系
Spark生态系统 熟练掌握Spark生态系统的各种应用场景并灵活运用
能够基于所学知识在真实的项目中操练,明白该如何在生产环境中使用它们并调优 项目实战

理论+代码+实战+实操的独有课程体系
加米谷大数据开发课程体系包括5个板块、20个阶段、200+模块以及4个真实项目实战。
第一阶段 Java设计与编程思想 学习内容:Java设计与编程思想 学习目标:Java基础、Java面向对象、Java高级、数据库与JDBC 学习效果:熟练掌握Java语法并灵活运用,能够开发后台应用 大数据Java设计与编程思想
第二阶段 Web前端开发 学习内容:Web前端开发 学习目标:HTML基础、CSS3基础、JS脚本编程 学习效果:能够基于HTML+CSS+JQuery进行前端开发 大数据Web前端开发
第三阶段 JavaEE进阶 学习内容:JavaEE进阶 学习目标:JavaWeb后端开发、SSM框架 学习效果:掌握主流JavaWeb框架并灵活运用 加米谷大数据JavaEE进阶
第四阶段 大数据基础 学习内容:大数据基础 学习目标:Linux基础、Maven基础 学习效果:熟练掌握Linux及Maven等相关知识并灵活运用 加米谷大数据基础
第五阶段 HDFS分布式文件系统 学习内容:HDFS分布式文件系统 学习目标:HDFS原理剖析、HDFS编程 学习效果:深入理解HDFS的原理并灵活运用 加米谷HDFS分布式文件系统
第六阶段 MapReduce分布式计算模型 学习内容:MapReduce分布式计算模型 学习目标:MapReduce原理剖析、MapReduce实践 学习效果:熟练掌握MapReduce原理并灵活运用 加米谷MapReduce分布式计算模型
第七阶段 Yarn分布式资源管理器 学习内容:Yarn分布式资源管理器 学习目标:Yarn原理剖析、Yarn实践 学习效果:深入理解Yarn的原理并调优 加米谷Yarn分布式资源管理器
第八阶段 Zookeeper分布式协调服务 学习内容:Zookeeper分布式协调服务 学习目标:Zookeeper原理剖析、Zookeeper实践 学习效果:深入理解Zookeeper的原理并灵活运用 加米谷Zookeeper分布式协调服务
第九阶段 Hbase分布式数据库 学习内容:Hbase分布式数据库 学习目标:Hbase原理剖析、Hbase编程实践 学习效果:深入理解Hbase的原理并灵活运用及调优 加米谷Hbase分布式数据库
第十阶段 Hive分布式数据仓库 学习内容:Hive分布式数据仓库 学习目标:Hive原理剖析、Hive编程实践 学习效果:深入理解Hive的原理并灵活运用 加米谷Hive分布式数据仓库
第十一阶段 FlumeNG分布式数据采集系统 学习内容:FlumeNG分布式数据采集系统 学习目标:FlumeNG原理剖析、FlumeNG编程实践 学习效果:熟练掌握FlumeNG的各种应用场景 加米谷FlumeNG分布式数据采集系统
第十二阶段 Sqoop大数据迁移系统 学习内容:Sqoop大数据迁移系统 学习目标:Sqoop原理剖析、Sqoop编程实践 学习效果:熟练掌握Sqoop并灵活运用 加米谷Sqoop大数据迁移系统
第十三阶段 Scala大数据黄金语言 学习内容:Scala大数据黄金语言 学习目标:Scala语法剖析、Scala应用实践 学习效果:熟练掌握Scala各种语法并灵活运用 加米谷Scala大数据黄金语言
第十四阶段 kafka分布式总线系统 学习内容:kafka分布式总线系统 学习目标:kafka原理剖析、kafka编程实践 学习效果:深入理解kafka原理并灵活运用及调优 加米谷kafka分布式总线系统
第十五阶段 SparkCore大数据计算基石 学习内容:SparkCore大数据计算基石 学习目标:SparkCore核心原理、SparkCore实践 学习效果:深入理解SparkCore原理并灵活运用及调优 加米谷SparkCore大数据计算基石
第十六阶段 SparkSQL数据挖掘利器 学习内容:SparkSQL数据挖掘利器 学习目标:SparkSQL核心原理、SparkSQL实践 学习效果:熟练掌握SparkSQL的各种应用场景并灵活运用 加米谷SparkSQL数据挖掘利器
第十七阶段 SparkStreaming流失计算平台 学习内容:SparkStreaming流失计算平台 学习目标:SparkStreaming核心原理、SparkStreaming实践 学习效果:深入理解SparkStreaming原理及各种应用场景和调优 加米谷SparkStreaming流失计算平台
第十八阶段 SparkMllib机器学习平台 学习内容:SparkMllib机器学习平台 学习目标:SparkMllib算法模型及核心原理、SparkMllib实践 学习效果:熟练掌握SparkMllib的常用算法并灵活运用 加米谷SparkMllib机器学习平台
第十九阶段 SparkGraphx图计算平台 学习内容:SparkGraphx图计算平台 学习目标:SparkGraphx核心原理、SparkGraphx实践 学习效果:深入理解SparkGraphx的原理并灵活运用 加米谷SparkGraphx图计算平台
第二十阶段 大数据项目实战 学习内容:大数据项目实战 学习目标:4个大数据项目的实战 学习效果:能够基于所学知识在真实的项目中操练 加米谷大数据项目实战

大数据开发课程明细
从理论到实训代码到云端实操环境到项目实战,手把手教您从0掌握大数据技术,带您走进大数据世界。

第一阶段(Java设计与编程思想)

Java基础 1、Java是什么类型语言,Java语言的编译、解释、执行过程 2、Java运行环境的安装和配置 3、标识符与关键字 4、基本数据类型 5、方法初识 6、运算符与表达式 7、分支语句 8、循环语句 9、Math、Date、Random

Java面向对象 1、什么是面向对象 2、类、对象、数组 3、介绍面向对象多态 4、抽象类的概念 5、抽象类的声明语法 6、抽象类被继承 7、接口的声明语法 8、实现接口的实现类 9、普通类与抽象类思想上的区别 10、抽象类与接口思想上的区别

Java高级 1、异常处理 2、I/O、JavaBean 3、反射/多线程 4、网络编程 5、泛型和集合

数据库与JDBC 1、安装与介绍 2、创建数据库与表 3、表与表之间关系 4、字段类型/函数/查询语句 5、存储器/触发器 6、增删改查 7、事务并发 8、操作存储器和触发器

第二阶段(Web前端开发)

HTML基础 1、Web开发简介 2、开发环境介绍 3、html与css编程介绍 4、JavaScript编程介绍 5、头部标记/文字格式标记 6、字体/列表/图像标记 7、超链接/表格/表单 8、框架

CSS3 1、web标准 2、css语法基础与选择器 3、css继承与优先级 4、css编写原则 5、css属性与浮动 6、css盒子模型 7、css定位

JS脚本编程 1、JavaScript定义 2、JavaScript特点与核心 3、JavaScript开发环境 4、JavaScript基本使用 5、DOM介绍与节点相关操作 6、DOM类型与操作 7、DOM获取表格元素 8、DOM获取元素样式

事件与JQuery框架 1、事件介绍与内联模型 2、脚本模型与事件对象 3、键盘事件与鼠标事件 4、JQuery基本语法 5、JQuery常用选择器 6、JQuery事件处理 7、JQuery文档操作

第三阶段(JavaEE进阶)

Web环境配置 1、Tomcat服务器

JavaWeb开发核心 1、JSP&Servlet基础 2、JSP&Servlet高级

SSM框架 1、SpringIOC 2、SpringAOP 3、SpringMVC配置文件详解 4、OGNL详解 5、控制器的实现 6、注解方式实现 7、文件上传与下载 8、拦截器详解 9、表单验证流程详解 10、SSM + Jquery + Ajax整合开发

Mysql 1、数据库基础知识 2、SQL理论基础和数据类型 3、DDL、LML、DQL语句 4、函数和关联查询 5、子查询、约束、视图 6、编程存储过程,触发器 7、Sql查询案例和优化

第四阶段(大数据基础:Linux基础、Maven基础)

Linux系统管理 1、Linux安装 2、用户与用户组管理 3、文件操作 4、目录操作 5、RPM安装与卸载 6、YUM安装与卸载 7、打包、压缩与解压缩 8、网络配置(network) 9、后台运行程序(nohup & ;)

Shell编程设计 1、Shell是什么 2、Shell分类 3、基本语法与环境变量 4、预定义变量 5、用户变量 6、特殊符号使用 7、逻辑判断与流程控制 8、正则表达式 9、模式匹配 10、Grep使用

Maven部署/配置/仓库 1、Maven部署 2、Maven配置 3、Maven安装目录解析 4、Maven本地仓库与中央仓库 5、Maven远程仓库 6、Maven 私服 7、如何从Maven远程仓库下载 8、Maven添加远程仓库 9、部署至远程仓库 10、Maven镜像

Maven POM 1、Maven核心元素 2、Maven核心插件/坐标/依赖 3、Maven依赖范围 4、Maven传递性依赖 5、Maven依赖调解/可选依赖/排除依赖 6、Maven快照及发布版本 7、Maven聚合与继承 8、Maven依赖管理与插件管理 9、Maven反应堆与灵活构建

第五阶段(HDFS分布式文件系统)

HDFS原理剖析 1、HDFS概念 2、HDFS内核/读写原理 3、HDFS数据块 4、HDFS数据副本的存放策略 5、HDFS安全模式/负载均衡/机架感应 6、HDFS名称节点NameNode 7、HDFS第二名称节点SecondNameNode 8、HDFS高可用HA/联邦Federation

HDFS 编程实践 1、HDFS分布式文件读取 2、HDFS写入剖析/读取剖析组 3、HDFS一致模型/数据完整性 4、HDFS压缩/序列化 5、HDFS基于文件的数据结构 6、HDFS数据备份/网络拓扑 7、HDFS集群的构建和安装 8、HDFS配置管理/环境设置/安全性 9、文件系统操作Hadoop fs与hdfs dfs

第六阶段+第七阶段+第八阶段(MapReduce分布式计算模型+Yarn分布式资源管理器+Zookeeper分布式协调服务

MapReduce原理剖析 1、MapReduce产生背景 2、MapReduce适用场景 3、MapReduce基本原理 4、MapReduce作业执行流程 5、MapReduce基本组件 6、MapReduce JobTracker 7、MapReduce TaskTracker

MapReduce实践 1、MapReduce高级编程应用 2、MapReduce Combiner 3、MapReduce Partitioner 4、MapReduce性能优化技巧 5、MapReduce案例分析 6、MapReduce开发实践操作

Yarn原理剖析 1、Yarn架构设计 2、Yarn核心原理 3、Yarn主节点ResourceManager 4、Yarn从节点NodeManager 5、Yarn从节点Container 6、Yarn的Application

Zookeeper原理+实践 1、Zookeeper 介绍 2、Zookeeper核心原理 3、Zookeeper结构 4、Zookeeper Server 5、Zookeeper Client程 6、Zookeeper访问 7、Zookeeper常用访问工具

第九阶段+第十阶段(Hbase分布式数据库+Hive分布式数据仓库)

Hbase原理剖析 1、Hbase存储原理 2、Hbase列式存储原理 3、Hbase稀疏存储设计 4、Hbase KeyValue存储设计 5、Hbase数据多版本 6、Hbase Rowkey设计 7、Hbase 存储无模式设计

Hbase编程实战象 1、Hbase 访问Shell接口实践 2、Hbase 访问API接口实践 3、Hbase 实战训练

Hive原理剖析 1、Hive介绍 2、Hive应用场景 3、Hive架构 4、Hive运行原理 5、Hive命名空间 6、Hive库的位置 7、Hive数据仓库

Hive实践 1、Hive创建库 2、Hive修改库与删除库 3、Hive普通表与带分区的表 4、Hive带Bucket的表/外部表/相似表 5、Hive分区/Bucket管理/向Hive表中装载与插入数据 6、创建并加载数据到Hive表与导出数据 7、Hive SelectFrom/Where/GroupBy/Join

第十一阶段+第十二阶段(FlumeNG分布式数据采集系统+Sqoop大数据迁移系统)

FlumeNG原理剖析 1、FlumeNG概述 2、FlumeNG部署配置 3、FlumeNG分布式架构 4、FlumeNG应用场景 5、FlumeNG与同类产品的优缺点 6、FlumeNG工作原理 7、FlumeNG运行时系统实现的逻辑

FlumeNG实践 1、FlumeNG指定文件数据作为数据源 2、FlumeNG监测并读取新增文件数据作为数据源 3、FlumeNG命令输出作为数据源 4、FlumeNG监听TCP的端口作为数据源 5、FlumeNG获取HTTP数据作为数据源 6、FlumeNG HDFS作为输出源 7、FlumeNG本地目录作为输出源

Sqoop原理剖析 1、Sqoop介绍 2、Sqoop架构原理

Sqoop实践 1、数据迁入大数据存储 2、数据迁出大数据存储

第十三阶段+第十四阶段(Scala大数据黄金语言+kafka分布式总线系统)

Scala语法剖析 1、Scala基础 2、Scala流程控制 3、Scala异常处理 4、Scala数据类型 5、Scala运算符 6、Scala函数基础 7、Scala匿名函数 8、Scala嵌套函数 9、Scala递归函数、部分应用函数、柯里函数、高阶函数

Scala应用实践 1、Scala闭包 2、Scala对象 3、Scala特征 4、Scala模式匹配 5、Scala隐式转换 6、Scala Lists 7、Scala Seqs 8、Scala Sets 9、Scala Maps 10、Scala Tuples、Scala Iterators、Scala Options

Kafka原理剖析 1、Kafka初识 2、Kafka主题 3、Kafka日志 4、Kafka生产者 5、Kafka消费者 6、Kafka消费组 7、Kafka消息读写原理 8、Kafka位移管理 9、Kafka副本机制、分布式、消息传送机制

Kafka实践 1、Kafka命令工具 2、Kafka生产API 3、Kafka消费API 4、Kafka实战训练

第十五阶段+第十六阶段+第十七阶段(SparkCore大数据计算基石+SparkSQL数据挖掘利器+SparkStreaming流式计算平台)

SparkCore核心原理 1、SparkCore 基础原理 2、SparkCore核心代码剖析 3、SparkCore运行架构 4、Rdd编程模型 5、Rdd内存弹性分布式数据集的工作原理和机制 6、RDD Transform 7、RDD Action

SparkSQL原理 1、SparkSQL简介 2、SparkSQL运行原理 3、SparkSQL程序开发光速入门 4、SparkSQL程序开发之数据源 5、SparkSQL程序开发之DataFrame态 6、SparkSQL程序开发之DataSet 7、SparkSQL程序开发之数据类型 8、SparkSQL实战训练

SparkStreaming原理 1、SparkStreaming原理 2、SparkStreaming与Storm 在流处理方面的比较 3、SparkStreaming与Spark 交互的实现机制 4、SparkStreaming核心代码剖析

SparkStreaming实践 1、SparkStreaming 滑动窗口 2、SparkStreaming foreachRDD 3、SparkStreaming 性能优化 4、SparkStreaming 持久化 5、SparkStreaming Checkpoint 6、SparkStreaming 容错 7、SparkStreaming 事务 8、SparkStreaming客户端编程实践

第十八阶段+第十九阶段(SparkMllib机器学习平台+SparkGraphx图计算平台)

SparkMllib算法模型原理 1、数据挖掘基础知识 2、机器学习基础知识 3、机器学习案例 4、Mahout/Spark MLib 并行挖掘平台中的关联规则 5、Mahout/Spark MLib 并行挖掘平台中的预测协同过滤 6、Mahout/Spark MLib 并行挖掘平台中的推荐模型 7、SparkMllib模型的原理 8、SparkMllib模型的算法实现

SparkMllib算法实践 1、推荐分析模块的深度剖析 2、推荐分析算法MapReduce 并行实现及应用开发 3、关联规则挖掘算法MapReduce 并行实现及应用开发 4、频繁模式挖掘算法的 MapReduce 并行实现及应用开发 5、回归预测的 MapReduce 实现和 Spark 实现技术 6、局部加权线性回归预测算法 MapReduce、Spark实现技术

SparkGraphX核心原理 1、SparkGraphX基础原理 2、SparkGraphX核心代码剖析

SparkGraphX实践 1、SparkGraphX客户端 API 介绍 2、基于 Spark GraphX 实现图数据的分析程序开发

第二十阶段(大数据项目实战)

电商数据离线分析平台 用SparkSQL、SparkStreaming,进行离线计算和实时计算业务模块的开发。实现了用户访问session 分析、页面单跳转化率统计、热门商品离线统计、广告点击流量实时统计4 个业务模块。合理的将实际业务模块进行技术整合与改造,项目完全涵盖了Spark Core、Spark SQL和Spark Streaming这三个技术框架中几乎所有的功能点、知识点以及性能优化点

移动基站信号监测大数据 移动通信基站信号数据采集,实时分析及移动信号监测系统。该系统利用移动与联通两家运营商的信令数据,通过对基站信号大数据的实时提取与分析,结合基站信号覆盖模式、信号强弱、覆盖区域等实际情况,实时动态采集及分析监测置信度较高、精度较高的移动基站信号监测系统。

运维大数据平台 银行和金融服务行业相关系统每天产生数以 TB 计的交易、支付、渠道等各种日志数据。运维大数据平台为迅速增长的海量数据建立全新的处理策略和维护能力,应对日趋复杂的管理需求。运维大数据通过海量日志数据分析,可以帮助银行机构提高服务质量,占据竞争优势。

舆情大数据平台 舆情大数据监测平台系统是针对互联网新兴媒体,通过对海量网络舆论信息进行实时的自动舆情采集,舆情分析,舆情汇总,舆情监视,并识别其中的关键舆情信息,及时通知到相关人员,从而第一时间应急响应,为正确舆论导向及收集网友意见提供直接支持的一套信息化平台。

真实项目贯穿整个学习流程
  • 基于互联网海量数据的舆情大数据项目
  • 大规模设备运维大数据分析挖掘项目
  • 移动基站信号监测大数据项目
加米谷基于互联网海量数据的舆情大数据项目
项目名称: 舆情大数据

项目简述:舆情大数据监测平台系统是针对互联网新兴媒体,通过对海量网络舆论信息进行实时的自动舆情采集,舆情分析,舆情汇总,舆情监视,并识别其中的关键舆情信息,及时通知到相关人员,从而第一时间应急响应,为正确舆论导向及收集网友意见提供直接支持的一套信息化平台。

加米谷大规模设备运维大数据分析挖掘项目
项目名称: 运维大数据

项目简述:银行和金融服务行业相关系统每天产生数以 TB 计的交易、支付、渠道等各种日志数据。运维大数据平台为迅速增长的海量数据建立全新的处理策略和维护能力,应对日趋复杂的管理需求。运维大数据通过海量日志数据分析,可以帮助银行机构提高服务质量,占据竞争优势。

加米谷移动基站信号监测大数据项目
项目名称: 移动信号监测大数据

项目简述:移动通信基站信号数据采集,实时分析及移动信号监测系统。该系统利用移动与联通两家运营商的信令数据,通过对基站信号大数据的实时提取与分析,结合基站信号覆盖模式、信号强弱、覆盖区域等实际情况,实时动态采集及分析监测置信度较高、精度较高的移动基站信号监测系统。

现在预报名