南京大数据技术Meetup第十次会议 暨 2017 CCF BDCI数据大赛 YOCESF南京专场

南京市栖霞区仙林大道163号南京大学(仙林校区)计算机科学技术楼221多功能报告厅   2017-11-04 13:30 — 17:30

会议介绍

活动时间:2017年11月4日下午13:30-17:30

活动地点:南京市栖霞区仙林大道163号南京大学(仙林校区)计算机科学技术楼221多功能报告厅,南京地铁2号线南大仙林校区站下车直达。

活动嘉宾&议题

Topic 1 《大数据时代下的自然语言处理研究进展

嘉宾介绍:周德宇,东南大学计算机学院,教授,博导。2008年博士毕业于英国里丁大学计算机学院,2009年英国剑桥大学博士后回国就职东南大学。从事大数据分析、自然语言处理等相关研究。主要围绕如何利用统计模型来表示外界事物的不确定性,研究数据模型在社交媒体分析,生物文本理解等若干领域上的应用。发表论文30余篇。部分论文(第一作者)发表在领域内重要国际期刊,如《IEEE Transactions on Knowledge and Data Engineering》、《Bioinformatics》、《Artificial Intelligence in Medicine》等,以及领域内一流国际会议,如ACL’16, IJCAI’16、EMNLP’16 ’15、AAAI’15、ACL’14、CIKM’11、ECIR’11、COLING’08等。担任《Frontiers of Computer Science》青年编委、中国中文信息学会理事、中国中文信息学会社会媒体处理专业委员会委员、中国中文信息学会健康与生物信息处理专业委员会委员。

内容简介:本报告针对互联网时代下海量的网络文本,围绕自然语言处理的若干技术:关系抽取、事件抽取和情感分析展开阐述。报告主要包括三部分内容:1)基于深度学习的药物之间不良反应的信息抽取,2)基于概率图模型的热点事件发现及其可视化,3)面向网络文本的社会舆情分析。最后结合工业界具体的应用案例,分析自然语言处理技术可能的发展方向和热点问题。

Topic 2 《大规模场景下的智能化硬盘故障预警及修复

嘉宾介绍:朱颖航,服务器智能运维领域的知名专家。毕业于哈尔滨工业大学,曾在百度系统部担任多年资深系统工程师,是百度“智能数据中心”项目的核心贡献人员,现任灵犀技术合伙人。在40万+台服务器规模下,实现了从硬件数据采集、存储、分析和挖掘的全程经验,从而将服务器硬件监控带入细粒度覆盖、定位效能、自动治愈、智能预测的新时代。

内容简介:在数据中心中,硬盘相关的故障占全部硬件故障的85%以上。随着大数据时代的到来,服务器数量大幅度增长,更多的存储需求、更低成本硬盘的使用,以及高温、高存储密度等技术的应用,硬盘故障及报废规模呈明显增加趋势。这对业务稳定、存储成本和运维效率都造成了严重的影响。基于数十万片硬盘近30个月的硬盘运行及故障大数据,使用机器学习技术,挖掘、分析海量数据,打造了可自动迭代的故障预测系统,支持全部厂商所有型号的 SATA 硬盘故障预测,准确率超过98%;同时与系统调度集成,能够提前避免故障对业务造成不良影响,有效降低云存储系统的平均故障修复时间(MTTR)。

Topic 3 《企业大数据在风控领域的应用与价值挖掘

嘉宾介绍:冯娟,量子数聚首席数据科学家,曾在业界领先的大数据应用服务提供商--龙信数据担任研发部经理、行业首席分析师等职务,有超过10年的企业大数据分析挖掘和应用经验。目前带领量子数聚研发团队,专注构建企业大数据价值体系,实现公司“用数据为组织赋能”之理念。

内容简介:企业大数据正以星火燎原之态向传统风控领域渗透。在数据来源、数据内涵、覆盖群体和模型思路上,企业大数据都有自己的特点。利用大数据信息对企业进行信用评价,除可以作为借贷风控领域的有力补充,还可以在政府征信领域用于企业扶持、政府采购、政策评估、企业监管等多个场景。

Topic 4 《数据挖掘思维的基础

嘉宾介绍:丁明,北京中电普华信息技术有限公司,数据应用研究事业部,数据挖掘工程师。2016年从零基础入门数据挖掘行业,两年时间参与各类大数据相关比赛,荣获“KDD CUP 2017”第三名,“携程云海-未来出行”第一名,“2016 CCF BDCI 用电行为分析大赛”第二名,“智慧中国杯,助学金分配”第三名,“IBM马拉松-聊天机器人”优胜奖,“第二届中国创新挑战赛”第五名。

内容简介:数据江湖中的“浪叫兽”讲述他在一年内快速入门数据挖掘的心得,从数据挖掘的思维框架讲起,实现一个比赛数据挖掘框架,需要实例化的代码模块,接着讲解数据分析的四个常见类型,在到对于特征工程的理解,多维度、多角度分析的概念,最后谈到了数据挖掘优化的工作中常常接触的8种常见的任务类型,为想从事数据科学家的数据挖掘新人们,提供基础指导。

Topic 5 《AI中的数据清洗

嘉宾介绍:李建峰,法海风控技术总监,原三星数据高级经理,从事技术相关工作十多年,目前负责光大银行总行、交通银行苏州分行、芝麻信用、京东金融、智能采集引擎等项目的统筹与领导工作。

内容简介:数据清洗,是整个数据分析过程中不可缺少的重要环节,其结果质量直接关系到模型效果和最终结论。大数据时代,数据清洗越来越重要、越来越复杂,干净的数据是机器学习的基础。

 

 

已报名参会人员

参会人数:
0 4 1

时间地点

  • 时间:2017-11-04 13:30 — 17:30
  • 地点:南京市栖霞区仙林大道163号南京大学(仙林校区)计算机科学技术楼

联系我们

如果想在CSDN会议平台发布会议,请与我们联系: 联系人:郭芮 电话:guorui_1118(微信)
邮箱:guorui@csdn.net