2016上海第二次Spark Meetup

上海市长宁区延安西路2299号上海世贸商城22楼英特尔公司   2016-04-09 13:00 — 18:00

会议介绍

Note:请如实填写您的相关信息方便联系和审核,否则将禁止出席,我们将在8日发送短信和Email提醒。

主办方: Intel

时间表/Agenda:

4月9日下午

• 12:30 - 13:00 签到/Sign in

• 13:00 - 13:10 开场白/Opening (程浩,英特尔大数据部门Spark Core团队研发经理)

• 13:10 - 13:50 基于Apache Spark的大规模机器学习应用(杨玉皓,英特尔大数据工程师)

• 13:50 - 14:30 Flink:统一的流执行引擎(李呈祥,英特尔大数据工程师)

• 14:30 - 14:50 茶歇/Tea break

• 14:50 - 15:30 Spark在计算广告领域的应用实践(朱广彬/刘忆智,来自聚效广告)

• 15:30 - 16:10 Splunk & Spark(陶刚, Splunk上海架构师)

• 16:10 - 16:40 交流时间/Networking time

• 开场/Opening Keynote:程浩,Intel大数据部门Spark Core团队研发经理

个人介绍:2012年加入Intel大数据技术团队,Apache Spark开源社区活跃开发者,同时也领导Intel Spark Core团队,优化Spark在IA(Intel Architecture)平台的执行性能,充分发挥硬件特性,并回馈给开源社区。

•演讲者1:杨玉皓,英特尔大数据工程师

演讲主题:基于Apache Spark的大规模机器学习应用

演讲简介:伴随着机器学习需求的快速增长和数据规模的不断增大,Spark MLlib在不断丰富功能的同时,也需要应对更大规模数据的挑战。本次分享将选取一些典型的企业应用和重要算法(LR,KMeans,LDA等)进行深入分析,讨论使用Spark MLlib进行大规模机器学习运算的经验和技巧,同时介绍Spark MLlib 2.0的最新进展。

杨玉皓,Intel大数据技术部门软件工程师,主要关注分布式机器学习应用和基础框架,为企业大规模机器学习应用提供合作与支持。Apache Spark Contributor,为Spark MLlib贡献多个算法和改进。

• 演讲者2:李呈祥,英特尔大数据工程师

演讲主题:Flink:统一的流执行引擎

演讲简介:Flink项目是大数据处理领域最近冉冉升起的一颗新星,其不同于其他大数据项目的诸多特性也吸引了越来越多的人关注Flink项目。这次分享主要介绍Flink一些关键的技术与特性,并和Spark进行深入对比,比较Spark与Flink相互的优点与劣势。

李呈祥,Apache Hive Committer, Apache Flink Committer. Intel大数据技术部门软件工程师,主要关注Hadoop平台分布式计算框架与分布式SQL引擎的设计开发与性能优化工作。

•演讲者3:朱广彬/刘忆智,来自聚效广告

演讲主题:Spark在计算广告领域的应用实践

演讲简介:计算广告是近几年非常火热的一个话题,也是大数据应用重度使用的领域。聚效广告拥有日百亿的流量,在广告大数据处理上积累了一些经验。本次分享主要介绍Spark在我们内部的实践和经验,包括基于SparkSQL的快速数据仓库查询引擎的实践、基于MLlib做CTR预估/人群分类等实践案例。

朱广彬:北京交通大学硕士,2014年加入聚效广告,曾就职于大众点评基础架构部,目前负责聚效基础数据架构,对Hadoop、Hive、HBase、Spark等有一定的研究。

刘忆智:毕业于浙江大学,2012年加入聚效广告,负责聚效人群定向算法团队,DMLC member,深度学习框架MXNet commiter,致力于大规模机器学习算法在工业界的应用。

•演讲者4:陶刚,Splunk上海架构师

演讲主题:Splunk & Spark

演讲简介:Splunk是业内领先的机器数据的平台,Splunk公司也是业内第一家在纳斯达克上市的大数据公司。本次演讲介绍了Splunk的基本功能和技术架构,并就如何在Splunk平台上利用和集成Spark进行数据处理展开讨论。

2000年毕业于北京邮电大学,目前在Splunk上海担任架构师,负责数据采集和云平台产品的技术架构。 在加入Splunk之前,曾就职于SAP,EMC等企业,负责ERP,BI和存储管理产品的开发。陶刚拥有丰富的企业级产品的开发经验,对数据科学,数据可视化和机器学习等领域有着浓厚的兴趣。

已报名参会人员

参会人数:
1 5 0

时间地点

  • 时间:2016-04-09 13:00 — 18:00
  • 地点:上海市长宁区延安西路2299号上海世贸商城22楼

联系我们

如果想在CSDN会议平台发布会议,请与我们联系: 联系人:仲浩 电话:zhongyineng(微信)
邮箱:zhonghao@csdn.net