专题研讨会--数据管理(SIGMOD China)

组织委员会

主席

李建中 (哈尔滨工业大学,中国)

李国良(清华大学,中国)

王宏志(哈尔滨工业大学,中国)

程序主席

谢希科(中国科学技术大学,中国)

Xin Cao (新南威尔士大学,澳大利亚)

汪炀(中国科学技术大学,中国)



会议日程

日期(2021-07-31)地点(会议室6)
时间 演讲 主持人 演讲者
14:00 - 14:10 开幕式 谢希科,中国科学技术大学特聘研究员
14:10 - 15:00 特邀报告 1 数据分析软件栈的平民化方法 王晓阳,复旦大学教授,国家特聘专家
15:00 - 15:50 特邀报告 2 河图:面向超大模型的分布式深度学习框架 崔斌,北京大学教授,长江学者
15:50 - 16:00 茶歇
16:00 - 16:30 青年科学家报告1 人机结合的数据准备 谢希科,中国科学技术大学特聘研究员 柴成亮  清华大学
16:30 - 17:00 青年科学家报告2 视图传播系列问题研究 苗东菁  哈尔滨工业大学
17:00 - 17:30 青年科学家报告3 面向文本与表数据的真值发现 叶晨   杭州电子科技大学
17:30 - 18:00 青年科学家报告4 用户生成数据的个性化建模 张伟  华东师范大学
Online
Zoom Link: https://unsw.zoom.us/j/82592713872
20:30 - 21:30 特邀报告 3 Trajectory Data Analytics 曹欣,新南威尔士大学 Christian S. Jensen,丹麦奥尔堡大学教授



Keynote: Trajectory Data Analytics

Christian S. Jensen

丹麦奥尔堡大学教授
ACM Fellow
IEEE Fellow
欧洲科学院院士

摘要: The sweeping digitalization of societal processes generates massive volumes of data that, if harnessed properly, hold the potential to improve the processes. This talk considers the process of vehicular transportation and the use of vehicular trajectory data that captures detailed information about the underlying transportation system. Specifically, the increasing availability of such data holds the potential to enable smarter transportation. The talk covers recent advances in analytics that are capable of exploiting trajectory data to provide new or higher-resolution services related to transportation.

个人简介:Christian S. Jensen is Professor of Computer Science at Aalborg University, Denmark. His research concerns analytics and data management, focusing on temporal and spatio-temporal analytics, including machine learning, data mining, and query processing. Christian is an ACM and IEEE Fellow, and he is a member of Academia Europaea, the Royal Danish Academy of Sciences and Letters, and the Danish Academy of Technical Sciences. He has received several awards for his research, most recently the 2019 IEEE TCDE Impact Award. He is on the board of Villum Fonden, a major funder of research in Denmark. He is President of the steering committee of the Swiss National Research Program on Big Data. In Germany, he is on the scientific advisory board (SAB) of the Max Planck Institute for Informatics; and in Norway, he chairs the SAB of the Norwegian Research Center for AI Innovation. He recently finished a 6-year term as Editor-in-Chief of ACM TODS.

Keynote:数据分析软件栈的平民化方法

王晓阳

复旦大学计算机科学技术学院
中国计算机学会会士

摘要: 数据分析与机器学习目前是一个复杂的任务,涉及好几个层面软硬件系统,包括数据采集系统,数据存储及数据库系统,数据挖掘与机器学习系统,数据可视化与交互系统,云计算平台,超算平台,等等,而一个高效的人工智能实际应用往往需要多个层面的系统协同工作。这就给人们,尤其对于非计算机专业人士,带来了巨大的挑战。系统的平民化已经成为人工智能在全社会广泛应用的一个重要工作。计算机行业一直以平民化为一个重要的目标,产生了巨大的社会经济效益。数据分析的平民化势头也已展露头角,但仍需要在几个方面进一步研究和发展,包括自然人机交互、系统自动选择与部署、复杂流程自动化及自动优化等,在今后几年将大有作为。

个人简介:王晓阳是复旦大学特聘教授、博士生导师。中国计算机学会会士,ACM会员,IEEE高级会员。主要研究兴趣为大数据分析、数据安全等。于复旦大学获得计算机科学学士、硕士学位,于美国南加州大学获得计算机科学博士学位。曾在美国乔治梅森大学、美国佛蒙特大学、美国国家科学基金会任职。2011年至今在复旦大学任职,曾任复旦大学计算机科学技术学院、软件学院院长。主持过或正在主持多项美国国家科学基金项目、中国国家重点研发计划项目、自然科学基金重点项目、上海市重大科研项目等,并发表过百余篇高质量学术论文,现任Springer DSE期刊主编,IEEE ICDE会议系列、IEEE BigComp会议系列指导委员会委员,曾任CCF上海主席,IEEE ICDE 2012及ACM CIKM 2014总主席,WAIM会议系列指导委员会主席。曾获得美国国家科学基金CAREER Award。

Keynote:河图:面向超大模型的分布式深度学习框架

崔斌

北京大学计算机系副主任
长江学者特聘教授
网络与信息系统研究所所长
中国计算机学会数据库专委会副主任

摘要: 机器学习系统是人工智能应用的重要基础,其核心包括数据组织形式、模型计算方法以及硬件使用方式等。日益增长的模型和数据规模对现有系统带来了严峻的挑战。本次报告介绍了课题组自主研发的面向超大模型的自动并行分布式深度学习框架--河图。报告首先介绍了河图的特性和设计理念,剖析了目前“大模型”发展情况,然后重点介绍了河图面向复杂模型和硬件环境的优化进展以及在自动化并行训练上的探索。最后,对机器学习系统的发展进行了展望。河图系统已在GitHub开源 https://github.com/PKU-DAIR/Hetu。

个人简介: 崔斌,北京大学计算机系副主任、长江学者特聘教授,网络与信息系统研究所所长。研究方向包括数据库系统设计和性能优化、数据挖掘、大数据管理和分析等,在相关领域发表了100多篇学术论文。担任中国计算机学会数据库专委会副主任,VLDB理事会理事,IEEE TKDE、VLDB Journal等期刊编委,以及数十个国际会议的程序委员会委员。他是中国计算机学会杰出会员,于2008年获得微软亚洲研究院的“微软青年教授奖”,2009年获得中国计算机学会 “CCF 青年科学家奖”,2014年获教育部自然科学二等奖。