大数据与机器学习的实践|七牛架构师实践日

杭州市西湖区黄姑山路 29 号颐高创业大厦 4F 楼友会咖啡   2017-03-25 13:30 — 18:00

会议介绍

本界面不作报名使用,报名请至 http://www.bagevent.com/event/426506 !

随着互联网的全面发展,数据呈爆炸式增长,数据的挖掘、分析和多行业数据应用的技术也孕育而生,先进的分析技术和高效的处理能力才能挖掘出最大的价值和潜力。因此,大数据处理、机器学习和数据分析的能力已然变成了技术型企业竞争的新战场。

就这个话题七牛云将与 Kyligence 联手,并邀请美丽联合集团以及网易的资深技术专家,于3 月 25 日在杭州楼友会跟大家一起探索关于大数据和机器学习的最新技术并分享各自的最佳实践。

报名详情

本次为收费活动,线上线下同步进行,详至http://www.bagevent.com/event/426506。

时间:2017 年 3 月 25 日 13:30 - 1800

线下:杭州市西湖区黄姑山路 29 号颐高创业大厦 4F 楼友会咖啡

线上:请先报名网络直播票,截图报名信息后,加工作人员微信:air6760 拉你进入活动直播群。活动开始后,会有直播链接发出。(已经在七牛架构师实践日任意微信群的朋友,无需报名。)

活动亮点

  1. 七牛云大数据技术总监陈超将担任本次实践日的出品人,严格把控演讲质量,力求呈现最干货议题;
  2. 七牛云资深大数据工程师崔文正将分享承载日均数千亿、近百 TB 增量的大数据新产品的技术实践和细节;
  3. Kyligence 的技术合伙人兼高级软件架构师马洪宾将解密 Kylin 的 Spark Cubing 框架,并结合金融行业里最典型的案例,让听众了解更多技术的演变进程;
  4. 杭州本地明星企业——美丽联合集团——站台助阵, 架构师吴海波将用自己 3 年的技术经历讲述蘑菇街的机器学习从无到有的过程,分享干货,避免大家重复踩坑;
  5. 网易高级平台开发工程师冯宇为您详解网易大数据分析平台的建设及演进历程。

在活动流程上除了主题分享,今年我们还特意增加了一个 LeanCoffee 环节,希望能够给大家更多的互动交流时间,对于感兴趣的话题,做更深入地探讨。

活动议题

Topic 1 《 Apache Kylin 2.0 技术解密之 Spark Cubing 》

马洪宾 Kyligence技术合伙人兼高级软件架构师

嘉宾介绍:技术合伙人&高级软件架构师,Apache Kylin 核心开发者和项目管理委员会成员( PMC ),专注于大数据相关的基础架构和平台。毕业于上海交通大学计算机系。在工作于 Apache Kylin 之前曾经是微软亚洲研究院的图数据库 Trinity 的核心贡献者。加入 eBay 后成为 Apache Kylin 首席 committer(根据 github 统计)。在 Apache Kylin 主要负责存储引擎,查询优化,测试覆盖等领域。
 
演讲简介:作为领先的大数据 OLAP 分析引擎,Apache Kylin 即将步入 2.0 时代:从星型模型到雪花模型的转变、更加全面的 SQL 语法、TPC-H Benchmark 的支持、更加先进的构建框架Spark Cubing、更好地支持实时流式数据接入等等。Apache Kylin 正逐渐从一个 Hadoop 上的传统 OLAP 平台,演变为一个 Hadoop 上的实时数据仓库。本演讲将侧重介绍 Apache Kylin 2.0 中新引入的旨在大幅度提升构建性能的 Spark Cubing 框架,并结合实际案例,娓娓道来其背后的演变历史和设计考量。

Topic 2 《七牛XSpark一站式数据分析、可视化平台》

崔文正 七牛云 资深大数据工程师

嘉宾介绍:资深大数据工程师。曾在百度大数据平台部门任技术负责人。于 2016 年加入七牛云,负责 Pandora 大数据平台的建设工作。主要负责实时流数据处理平台、时序数据库,以及离线数据仓库等各项目的架构与开发工作。承载公司每天数千亿、近百 TB 增量的大数据业务。

演讲简介:Pandora 是七牛内部孵化的大数据产品,经过了两年的演化,现在已经承载了公司内外每天数千亿、近百 TB 的增量数据。在这过程中,Pandora 更面临了多租户的复杂需求场景。传统的 HDFS 和 Spark 集群已经不能很好的服务离线分析计算需求。XSpark 使用云存储取代传统 HDFS,使用容器云实现可伸缩式 Spark 集群,极大的降低了存储成本和运维复杂度。这次将和大家一起分享 XSpark 产品带来的优势,以及其技术细节。

Topic 3 《美丽联合业务升级下的机器学习应用》

吴海波 美丽联合架构师 

嘉宾介绍:花名吾加。毕业于浙江大学,2014 年入职蘑菇街,负责电商排序、推荐相关的工作,经历了蘑菇街机器学习从无到有的过程,主导排序从爆款模型到转化率模型再到个性化模型。

演讲简介:蘑菇街在这 3 年中经历了从打造爆款到追求品质商品的变化,依据业务目标的演变设计算法策略的迭代方向,和大家分享下在这个过程中遇到一些问题,包括目标选取、数据清洗、特征构建、系统架构改进。另外和大家探讨下数据挖掘工程师和业务方合作的一些问题,特别是在一些长期目标上abtest不能很快说明问题的时候,如何通过设计更合理的业务层来减少它们。

Topic 4 《网易大数据分析平台技术演进实践》

冯宇 网易高级平台开发工程师

讲师介绍:冯宇,网易高级平台开发工程师,Apache Kylin committer,于电子科技大学毕业后加入网易,主要从事大数据平台及 OLAP 引擎开发等工作,涉及大数据架构、OLAP 查询引擎优化以及平台化服务等方面,目前专注于大数据分析、分布式存储系统等技术领域。

内容介绍:随着移动互联网的发展,基于超大规模数据分析的决策支持系统已成为企业在互联网方面的基础业务需求,而这对于网易来说亦是如此。网易的大数据平台及服务,则需要提供针对网易多个产品的百亿级数据量进行快速分析的能力。本分享将主要介绍网易大数据分析平台的建设及演进历程,分析怎样组合不同的开源及自研系统为网易云音乐、网易考拉、网易新闻客户端、易信等不同产品提供支持,同时还将分享如何结合不同的业务及平台化需求,对开源系统进行二次开发。

时间地点

  • 时间:2017-03-25 13:30 — 18:00
  • 地点:杭州市西湖区黄姑山路 29 号颐高创业大厦 4F 楼友会咖啡

联系我们

如果想在CSDN会议平台发布会议,请与我们联系: 联系人:郭芮 电话:guorui_1118(微信)
邮箱:guorui@csdn.net