第六届中国云计算--Hadoop应用实战技术培训

天辰东路北京国家会议中心   2014-05-20 08:00 — 17:30

会议介绍

数据已经成为当今企业的核心竞争力,拥有大数据并智慧地使用和运营数据成为企业不可缺少的成功要素。

Hadoop生态系统提供了一种实用的、经济有效的、可扩展的架构,帮助企业存储、管理和处理海量数据。业界在Hadoop上的兴趣和投资形成了包括开源软件和商业化软件的整个生态系统。Hadoop迅速成为大数据处理方面的业界事实标准。

ChinaHadoop小象社区是中国最活跃、最专业的大数据社区,借此第六届云计算大会的机会,组织社区核心专家资源为大家献上一场Hadoop高端技术培训。

 Hadoop应用实战技术培训

解剖麻雀——Hadoop在电信运营商的应用实践

电信行业数据应用现状和挑战

  • 电信系统数据类型分类及特点
  • 业务转型带来的数据技术挑战
  • 传统数据库技术的短板
  • Hadoop带来的机会与风险

Hadoop在电信领域的成功应用

  • 离线统计分析系统
  • 详单查询系统
  • ETL
  • 未来趋势:融合的多租户Hadoop集群

如何从零开始设计一个Hadoop集群

  • 需求分析与配置计算
  • 硬件选型
  • 软件选型
  • 组网设计

如何调优及高效运维一个Hadoop集群

  • 常用的系统级调优手段
  • 常用的Hadoop调优手段
  • 运维工具的选择与推荐

 分布式在线存储系统——HBase

  • HBase的系统架构
  • HBase数据模型
  • HBase存储模型
  • HBase API及通常用法
  • 案例分析:HBase在搜索业务中的使用及体会

数据仓库——Hive

  • Hive是什么
  • Hive原理和体系结构
  • HQL介绍
  • Hive内部表和外部表
  • Hive文件类型
  • Hive的分区
  • Hive的复合数据类型
  • Hive自定义UDF
  • Hive的transform实战
  • 案例分析:Hive日志分析实例

 

时间地点

  • 时间:2014-05-20 08:00 — 17:30
  • 地点:北京市朝阳区天辰东路北京国家会议中心

联系我们

如果想在CSDN会议平台发布会议,请与我们联系: 联系人:王小姐 电话:010-51661202-822
邮箱:wangchao#csdn.net(将#改成@)