会议介绍
“未来世间万物,一切皆可量化,一切皆为数据”——这是舍恩伯格在《大数据时代》一书中的感慨。互联网的用户体验正在被大数据所颠覆,ebay平台上拥有超过6.5亿件商品,每天有1300万件新商品上市销售,通过eBay的拍卖搜索引擎每天有超过3亿次查询,对一个数据工程师而言,如何通过精准的分析为顾客推荐出最满意的商品?与此同时,传统的IT架构正在被大数据所革新,eBay的分析平台每天处理的数据量高达100PB,已经超过了纳斯达克交易所每天的数据处理量,对一个系统架构师而言,传统的IT架构在海量数据面前又将如何重构?而围绕大数据的采集、分析与挖掘正在进入更广泛的行业,医疗、金融等行业未来又将产生哪些创新的行业应用?
2014年10月25日,由eBay、CSDN共同举办的“大数据峰会”将在上海豫园万丽酒店举办。届时我们将联手数位来自国外的顶尖数据专家,为大家奉上一场大数据的技术盛宴。无论您是关注机器学习、数据仓库、Hadoop,还是系统架构领域;无论您是数据工程师还是系统架构师;无论您来自电商、游戏等互联网行业,还是金融、医疗等传统行业——在这里,我们相信您一定能找到您想听的议题、找到您想结识的朋友,学习您想了解的技术。
会议时间:2014.10.25
会议名称:eBay上海大数据峰会
会议地点:上海豫园万丽酒店 三层宴会厅(上海市黄浦区河南南路159号)
日程安排
时 间 |
演讲议题 |
演讲嘉宾 |
09:00 - 09:05 |
开场及主持
|
刘江
CSDN总编
|
09:05 - 09:15 |
开场致辞
|
田卫
总经理,eBay China Center of Excellence |
09:15 - 10:00 |
大数据基础架构的未来
|
Debashis Saha
eBay全球数据架构副总裁
|
10:00 - 10:45 |
大规模分佈式机器学習 |
林智仁
国立台湾大学卓越教授
|
10:45 - 10:55 |
茶歇
|
茶歇 |
10:55 - 11:40 |
Druid之旅,大数据实时分析数据存储框架
|
Eric Tschetter
Druid创始人 |
11:40 - 12:25 |
广告大数据上的机器学习 |
夏粉
大数据科学家 |
12:25 - 13:30 |
午餐
|
午餐
|
13:30 - 13:35 |
开场及主持
|
刘江
CSDN总编
|
13:35 - 14:20 |
Hadoop平台监控、预警及自动化
|
Sami Ben-romdhane
eBay全球平台架构资深架构师
|
14:20 - 15:05 |
数据科学的实践
|
Ying Li
EV Analysis Corporation首席数据科学家 |
15:05 - 15:15 |
茶歇
|
茶歇
|
15:15 - 16:00 |
Kylin–基于Hadoop的大规模联机分析引擎
|
蒋旭
eBay资深架构师
|
16:00 - 16:45 |
腾讯大数据平台与推荐应用架构
|
李勇
腾讯T4技术专家数据平台部精准推荐中心总监
|
16:45 - 17:00 |
Q&A问答
|
Q&A问答
|
讲师介绍
 |
Debashis Saha eBay全球数据架构副总裁
作为eBay全球数据架构副总裁,Debashis Saha是一位极具创造力的技术领导,他对数据产品发展的全生命周期有着精深广博的专业知识及实践经验,并且有着解决实际问题、开发和交付大型分布式软件和系统架构的经验。 他目前的主要工作为致力于开发高可扩展分布式大数据分析架构,以支撑eBay日益增长的业务需求。
演讲主题-《大数据基础架构的未来》
|
 |
Sami Ben-romdhane eBay全球平台架构资深架构师
Sami Ben-romdhane是硅谷两家创业公司的创始人,这两家公司被Symantec及BEA收购。目前是eBay全球技术部的资深架构师。Sami有着长期设计和实施高性能、高可靠的和高度可扩展系统的经验。在任职eBay之前,Sami曾担任Oracle和BEA的首席架构师。
演讲主题-《Hadoop平台监控、预警及自动化》
Hadoop,一个开源的、可靠的、可扩展的分布式并行计算框架,几乎是当前大数据处理和分析领域最热门的框架。保证Hadoop平台的可用性,高效性,可靠性越来越成为支撑不断成长的数据分析的关键任务。该议题将介绍如何通过Hadoop Eagle开源项目来监控,预警及自动化运帷。
|
 |
Ying Li EV Analysis Corporation首席数据科学家
Dr.Ying Li是EV分析公司的首席数据分析科学家,同时也是EV分析公司的创始人。在此之前,她在微软公司成功创建了服务、产品和相关团队,在数据挖掘和机器学习方面经验丰富。李博士是2012年美国计算机协会知识发现专委会的获奖者(ACM SIGKDD),该奖项主要表彰她在数据挖掘方面的杰出贡献。她在数据挖掘、机器学习、线上广告、软件性能优化、程序追踪、程序概要分析等领域申请并持有70余项专利。李博士拥有加拿大不列颠哥伦比亚大学的计算机科学博士学位,以及北京大学的应用数学学士学位。
演讲主题-《数据科学的实践》
数据科学正在进入公众的视野,并且有越来越多的企业正在对此进行深入研究。但数据科学要想真正融入到现实经济以及吸引社会更广泛的关注,同时将价值发挥出来,还需要对其进行应用准则的定义,同时还需要一套完整的系统引导。Dr. Li将介绍数据科学的应用准则,并通过案例对其进行解读。对于一个数据科学领域的从业者而言,Dr. Li将从实际案例出发,对其职业方向规划进行建议以及设想其理想化的未来。
|
 |
Chih-Jen Lin(林智仁) 国立台湾大学卓越教授
林智仁教授一直致力于大规模数据分析的研究。林教授主导开发了非线性SVM分类器LIBSVM以及为大规模数据的线性分类器LIBLINEAR。這些成果已被廣泛使用。他的團隊獲得許多獎項包含了ACM KDD 2010與ACM RecSys 2013之會議最佳論文獎。林教授拥有美国密歇根大学硕士和博士学位。他因機器學習之研究貢獻獲選為IEEE及AAAI會士(fellow)與ACM傑出科學家(distinguished scientist)。
演讲主题-《大规模分佈式机器学習》
大規模的機器學習是一個重要的研究課題因為比一台機器容量更大的數據已非常常見。然而分佈式的機器學習面對許多挑戰。首先,傳統的機器學習算法大多被設計成在一台計算機上運行。其次,取樣數據至一台機器來分析始終是一個選項。所以何時應該使用分佈式的機器學習是個值得探討的問題。我們針對這些挑戰做簡單的的概述後將討論分佈式的機器學習方法。一個具體的例子是牛頓法解大規模的邏輯回歸。我們也將回顧現有的其他發展和展示它們是如何在實際應用使用。最後,我們認為,大數據的機器學習涉及到很多算法之外的問。編程環境,系統,和應用的流程必須一起被考慮來成功的完成一個大數據的機器學習項目。
|
 |
Eric Tschetter Druid创始人
Eric Tschetter是大名鼎鼎的开源实时分析数据存储器Druid(http://www.druid.io)创始人和核心源代码贡献者。Eric目前也是非盈利性的糖尿病研究网站Tidepool.org的创始人。埃里克先前是Metamarkets的工程副总裁和首席架构师,并任职Ning和LinkedIn高级工程师。他拥有得克萨斯大学奥斯汀分校的计算机科学和日语的学士学位,东京大学的计算机科学硕士学位。
演讲主题-《Druid之旅,大数据实时分析数据存储框架》
|
 |
蒋旭 eBay资深架构师
蒋旭目前在eBay主要负责平台架构,他一直关注图数据库设计和基于云环境的开发及内核优化;最近主要负责Kylin (基于Hadoop的开源OLAP引擎)的架构设计和开发。蒋旭先前是摩根斯坦利的技术副总裁和Sybase的首席中间件工程师。
演讲主题-《Kylin——基于Hadoop的大规模联机分析引擎》
Kylin是由eBay开发并即将开源的基于Hadoop的大数据分析引擎,为Hadoop数据提供标准SQL接口及多维分析(OLAP)能力以支持TB至PB级别的分析。能够大大加速数据查询分析性能,并通过标准的ODBC 驱动与Tableau等商务智能分析工具无缝整合,使得用户能够利用Tableau直接查询和分析Hadoop上的数据,增强分析人员与Hadood数据的交互能力与体验。
|
 |
李勇 腾讯T4技术专家数据平台部精准推荐中心总监
国内知名数据专家,现任腾讯公司数据平台部经理,负责腾讯数据业务,拥有超过10年以上的从业经验。曾在阿里巴巴集 团工作5年,任支付宝BI首席架构师,负责数据平台基础架构和应用架构。在海量计算、分布式架构、流式计算等方面有丰富的经 验,同时热衷于新技术探索,关注组织和团队,有丰富的管理实践经验。
演讲主题-《腾讯大数据平台与推荐应用架构》
|
 |
夏粉 大数据科学家
大数据科学家, 十年以上机器学习研究和应用经验,主要研究方向为统计机器学习理论,大数据深度学习算法,计算广告学和排序学习,曾在机器学习顶级会议ICML, NIPS等发表多篇文章,中科院自动化优秀毕业生,中科院刘永龄奖学金获得者。
演讲主题-《广告大数据上的机器学习》
|
注:主办方会对所有报名人员进行审核,审核通过的嘉宾会在10月16日之后收到我们的电话确认及参会提醒,现场凭我们发放的邀请函签到入场。
请点击上方“申请参会”按钮免费报名,我们会对报名人员进行审核,可以参会者将在活动前夕电话和短信通知。参会即有机会获得精美礼品。