专题研讨会--数据管理(SIGMOD China)(活动地点:瑞华酒店)

组织委员会

大会主席

彭智勇 (武汉大学)

崔斌(北京大学)

王宏志(哈尔滨工业大学)

程序主席

江佳伟 (武汉大学)

祝园园(武汉大学)

王胜(武汉大学)



会议日程

日期(2023-07-29)地点(瑞华酒店芝加哥会议室)
时间 环节 题目 讲者 主持人
14:00-14:45 特邀报告1 在关系型数据库中支持复杂结构 于旭
(香港中文大学)
崔斌
(北京大学)
14:45-15:30 特邀报告2 分布式关系数据库的价值 阳振坤
(蚂蚁集团OceanBase)
王宏志
(哈尔滨工业大学)
15:30-15:50 茶歇
15:50-17:30
青年学者论坛
架构面向异构硬件的大数据处理系统 唐博
(南方科技大学)
祝园园
(武汉大学)
学习型查询优化器最新进展 朱镕
(阿里巴巴)
高效大图数据分析:介观和宏观角度 袁龙
(南京理工大学)
增量图计算技术探讨 巩树凤
(东北大学)



特邀报告

特邀报告: 在关系型数据库中支持复杂结构

于旭

香港中文大学

摘要:关系型数据库(RDBMS)已经被广泛研究了几十年,用于管理大型数据集。自1970年代初以来,使用关系型数据库支持复杂结构已经有很长的历史。在本次报告中,我们将回顾RDBMS中一些处理复杂结构的方法。由于在算法设计和系统开发中支持大规模图数据的处理变得越来越重要,我们再次讨论如何在RDBMS中支持图处理。我们的研究由以下实际问题驱动: 在实际应用中,有许多关系数据与存储在RDBMS中的大规模图密切相关,且需要在一个集成系统中一起进行图/数据分析。为了支持RDBMS中的图分析,我们讨论了新的关系代数运算,它们可以由带有group-by和aggregation的基本关系代数运算定义; 我们还讨论了新的SQL递归查询,并确保包含这些新的关系代数运算的递归查询具有迭代固定点。此外,我们还讨论了如何利用Spark上的SparkSQL和GraphX支持这些新的操作和新的SQL递归查询,以及如何在分布式系统中通过将通信与计算分离来优化SQL查询,以实现高性能的查询。

个人简介:于旭博士是香港中文大学系统工程及工程管理系教授。他目前的主要研究方向包括图算法、图处理系统和数据库系统中的查询处理。于教授曾担任ACM SIGMOD执行委员会的信息总监和成员(2007-2011),IEEE TKDE的副编辑(2004-2008),以及VLDB Journal的副编辑(2007-2013)。现任ACM TODS、WWW Journal等刊物副主编。于教授曾在多个国际会议/研讨会的组织委员会和程序委员会任职,包括APWeb 04、WAIM 06、APWeb/WAIM 07、WISE 09、PAKDD 10、DASFAA 11、ICDM 12、NDBC 13、ADMA 14、CIKM 15、Bigcomp17、DSAA 19、CIKM 19和DASFAA 20的程序联合主席,以及APWeb 13、ICDM 18和ADC 22的会议联合主席。

特邀报告:分布式关系数据库的价值

阳振坤

蚂蚁集团OceanBase

摘要: 1970年E. F. Codd博士发明关系模型以及随后SQL语言的出现,关系数据库在1980年代逐步成熟,成为了各种信息系统的基石。由于技术困难等原因,关系数据库系统一直是集中式,1990年代,随着互联网的发展,十分有限的伸缩能力使得集中式关系数据库无法满足互联网业务的高并发及海量数据的需求,分库分表几乎成为了唯一可行的手段。然而,分库分表意味着性能低下的跨分片事务以及业务系统的重构。分布式关系数据库具备水平扩展、敏捷伸缩的能力,是高并发以及海量数据问题的理想解决方案。本次报告分析了分布式关系数据库的优势,并介绍了OceanBase分布式关系数据库的实践。

个人简介:阳振坤,在北京大学数学系获得本科和硕士学位、计算机系获得博士学位并留校,先后破格晋升副教授和教授,1999年成为首批长江学者。曾获得国家科技进步一等奖(排名第四),北京市科技进步一等奖,第六届中国青年科技奖,第一届中国科协求是杰出青年奖,北京市五四青年奖等,2022年获得中国计算机学会王选奖,有超过20项第一发明人发明专利。2010年他在阿里巴巴发起了OceanBase分布式关系数据库研发项目,2019年OceanBase通过了国际事务处理性能委员会TPC的联机事务处理基准测试TPC-C,并打破了Oracle数据库保持了9年的世界纪录,2021年OceanBase通过了TPC的联机分析处理基准测试TPC-H并打破了世界记录(@30,000GB),初步展示了OceanBase的一体化联机事务处理和分析处理(HTAP)能力。现在OceanBase数据库已经在支付宝和多家银行、保险、能源、电信和政府等企业和部门使用。目前他是OceanBase公司的首席科学家。

青年学者报告

报告主题:架构面向异构硬件的大数据处理系统

唐博

南方科技大学

摘要: 随着新型计算硬件的广泛兴起,如何架构异构硬件感知的大数据处理系统成为学术界和工业界的热点问题。在该报告中,我将结合南方科技大学数据库团队近年来在该问题上的研究,简要介绍(1)基于渐近基数估计技术的查询优化器;(2)面向CPU-GPU的异构执行引擎和(3)查询执行过程可视分析工具等三项具体工作,总结团队在架构异构硬件感知的大数据处理系统过程中踩过的坑、获得的收获以及面临的挑战。

个人简介: 唐博博士是南方科技大学副研究员、博士生导师。研究方向为数据库系统和大数据技术,2017年加入南方科技大学并创建数据库研究团队,团队研究成果一贯发表于数据工程与数据管理顶尖国际会议和期刊上(如SIGMOD,PVLDB,TKDE等),研发技术广发应用于Microsoft 办公软件Excel和开源列式存储数据库MonetDB系统中。他曾获得ACM SIGMOD中国新星奖和深圳市优秀教师等荣誉。

报告主题:学习型查询优化器最新进展

朱镕

阿里巴巴

摘要: 作为AI4DB领域的热点方向,学习型查询优化技术受到了广泛关注。其不仅为机器学习的广泛应用提供了丰富场景,而且通过充分的证据证明了优越性。在本报告中,我们只在对学习型查询优化技术提供一个全面深入的介绍,包括算法设计、实际应用和系统部署。基于此,我们总结出该方向的设计理念和未来工作。

个人简介: 朱鎔博士现为阿里巴巴达摩院智能计算实验室研究科学家。同时,他也担任香港中文大学(深圳)兼职企业导师。他分别于2013年和2019年从哈尔滨工业大学获得学士和博士学位。他的研究兴趣包括数据库、机器学习和系统的交叉领域,主要集中于AI4DB方向。他在该领域VLDB, ICDE, TKDE, ICLR等顶级会议和期刊上发表了近30篇论文,并曾在EDBT和CIKM上做tutorial报告。他先后获得2019年教育部自然科学二等奖、2020年CCF优秀博士论文提名奖和2022年ACM SIGMOD中国新星奖。

报告主题:高效大图数据分析:介观和宏观角度

袁龙

南京理工大学

摘要: 图是一种由顶点和边对数据进行描述的结构,可以自然高效地建模现实应用中的多源异构数据。因此,图模型与图数据分析技术已成为当今大数据技术的重点研究方向之一,在现实应用中得到了大量应用。图数据分析可以从不同的尺度进行,此次报告将介绍介观和宏观图分析的典型问题与研究进展,探讨现有研究的不足与未来研究方向。

个人简介: 袁龙,南京理工大学教授。主要研究方向为图数据管理与分析,特别是针对大规模复杂图数据的高效图算法的设计,并应用于电子商务、社交网络、公共安全及智慧城市等重要领域,近年来在数据库领域的顶级会议和期刊发表论文40余篇,获国际学会会议DASFAA 2023最佳学生论文奖,ACM SIGMOD中国新星奖。担任VLDB、ICDE、The Web Conference、NeurIPS、AAAI、CIKM、WSDM等国际学术会议程序委员会委员和VLDBJ、TKDE、WWWJ、Information Science等国际期刊评审专家。

报告主题:增量图计算技术探讨

巩树凤

东北大学

摘要: 通过记录前期图计算过程的中间结果可以加速图数据的增量处理,这可能需要大量存储空间来存储中间结果。在存储尽量少,甚至不存储中间计算结果的情况下,如何仍然高效处理动态图数据?图数据的微小改变可能触发大面积甚至整个图数据参与增量计算,如何将增量计算局限在一个较小的范围内,且仍然能够正确更新图分析结果?报告将基于上述两个问题,进行探讨。

个人简介: 巩树凤博士于2021年博士毕业于东北大学计算机学院。现在是东北大学计算机学院讲师,硕士生导师。他的主要研究方向包括云计算,分布式图处理和图存储,流计算。