ACM中国图灵大会, ACM TURC 2023

专题研讨会--SIOPS China（活动地点：瑞华酒店）

SIGAI China的工作宗旨： ChinaSys / ACM SIGOPS China是中国计算机系统及相关领域的学术团体，宗旨是为本领域的研究者和从业者提供资源共享、交换思想和会晤的平台。为了促进中国计算机系统行业的发展，于2023年7月28日-30日在武汉召开第24届ChinaSys研讨会（暨ACM图灵大会2023 SIGOPS分论坛），交流和探讨本领域的最新研究成果。

组织委员会

主席

董德尊（国防科技大学）

王蕾（国防科技创新研究院）

程序委员会主席

崔鹤鸣（香港大学）

张宸（上海交通大学）

会议日程

Date（2023-07-28）Venue（瑞华贵宾厅）
8:50-9:00	开幕式
Networking and Communication		主持人
9:00-9:15	An Ultra-Low Latency and Compatible PCIe Interconnect for Rack-scale Communication 黄雨凯（复旦大学）	胡杏
9:15-9:30	SmartDS: Middle-Tier-centric SmartNIC Enabling Application-aware Message Split for Disaggregated Block Storage 张杰（浙江大学）
9:30-9:45	Characterizing Off-path SmartNIC for Accelerating Distributed Systems 魏星达（上海交通大学）
9:45-10:00	Persistent Memory Disaggregation for Cloud-Native Relational Databases 阮超逸（中国科学技术大学）
10:00-10:15	Roar: A Router Microarchitecture for In-network Allreduce 王瑞琦（国防科技大学）
茶歇 (10:15-10:25)
Security and Privacy/ 安全与隐私
10:25-10:40	Honeycomb: Secure and Efficient GPU Executions via Static Validation 郑鈜壬（清华大学）
10:40-10:55	Towards A Secure Yet Maintainable Encrypted Database 李明煜（上海交通大学）
10:55-11:10	SecretFlow-SPU: A Performant and User-Friendly Framework for Privacy-Preserving Machine Learning 马俊明（蚂蚁集团）
Performance Analysis and Optimization/ 性能分析与优化		主持人
11:10-11:25	VClinic: A Portable and Efficient Framework for Fine-Grained Value Profilers 游心（北京航空航天大学）	陈旭升
11:25-11:40	SPADA: Accelerating Sparse Matrix Multiplication with Adaptive Dataflow 陈泰杰（清华大学）
11:40-11:55	Bifrost: Analysis and Optimization of Network I/O Tax in Confidential Virtual Machines 李鼎基（上海交通大学
11:55-12:10	Understanding and Optimizing Workloads for Unified Resource Management in Large Cloud Platforms 卢澄志（中国科学院深圳先进技术研究院）
午餐 (12:10-13:30)
Storage Systems / 存储系统
13:30-13:45	Redesigning High-Performance LSM-based Key-Value Stores with Persistent CPU Caches 钟一捷（厦门大学）
13:45-14:00	Baryon: Efficient Hybrid Memory Management with Compression and Sub-Blocking 李一苇（清华大学）
14:00-14:15	Light-Dedup: A Light-weight Inline Deduplication Framework for Non-Volatile Memory File Systems 潘延麒（哈尔滨工业大学（深圳））
14:15-14:30	Revitalizing the Forgotten On-Chip DMA to Expedite Data Movement in NVM-based Storage Systems 苏景波（中国科学技术大学）
Systems for Machine Learning I / 机器学习系统 I		主持人
14:30-14:45	SmartMoE: Efficiently Training Sparsely-Activated Models through Combining Offline and Online Parallelization 翟明书（清华大学）	王卅
14:45-15:00	Optimizing Dynamic Neural Networks with Brainstorm 崔炜皞（上海交通大学）
15:00-15:15	Heron: Automatically Constrained High-Performance Library Generation for Deep Learning Accelerators Bi Jun（中国科学院计算技术研究所）
15:15-15:30	SDPipe: A Semi-Decentralized Framework for Heterogeneity-aware Pipeline-parallel Training 苗旭鹏（卡内基梅隆大学）
15:30-15:45	PetPS: Supporting Huge Embedding Models with Persistent Memory 谢旻晖（清华大学）
15:45-16:00	Cocktailer: Analyzing and Optimizing Dynamic Control Flow in Deep Learning 张晨（清华大学）
茶歇 (16:00-16:15)
Systems for Machine Learning II/ 机器学习系统 II
16:15-16:30	Hydro: Surrogate-Based Hyperparameter Tuning Service in Datacenters 胡擎昊（南洋理工大学）
16:30-16:45	OliVe: Accelerating Large Language Models via Hardware-friendly Outlier-Victim Pair Quantization 郭聪（上海交通大学）
16:45-17:00	Realizing Emotional Interactions to Learn User Experience and Guide Energy Optimization for Mobile Architectures 李雪亮（深圳大学）
17:00-17:15	Legion: Automatically Pushing the Envelope of Multi-GPU System for Billion-Scale GNN Training 孙杰（浙江大学）
17:15-17:30	iCache: An Importance-Sampling-Informed Cache for Accelerating I/O-Bound DNN Model Training 陈伟剑（浙江大学）
17:30-17:45	EinNet: Optimizing Tensor Programs with Derivation-Based Transformations 郑立言（清华大学）

7月29号（瑞华贵宾厅）
TURC Program
午餐		主持人
开场词（13:30-13:40）
合影（13:40-13:45）
Keynote Speech 1 / 特邀报告 1		王蕾、张宸
13:45-14:30	云原生体系结构过敏意，上海交通大学“致远”讲席教授，国家杰青，欧洲科学院外籍院士，IEEE Fellow
Keynote Speech 2/ 特邀报告2
14:30-15:15	基于持久内存的多层级内存型存储系统金海，华中科技大学教授，长江学者，国家杰青，万人领军，IEEE Fellow
茶歇 (15:15-15:30)
Keynote Speech 3 / 特邀报告 3		董德尊、崔鹤鸣
15:30-16:15	飞腾高性能通用CPU发展与思考卢凯，国防科技大学计算机学院院长，长江学者，万人领军，国防卓青
Keynote Speech 4 / 特邀报告 4
16:15-17:00	超大规模集成电路中的掩模优化 Bei Yu，香港中文大学副教授，IEEE CEDA 职业发展奖，ACM SIGDA功勋服务奖
Poster (17:00-18:00) / 海报

7月30号（瑞华贵宾厅）
TURC Program
午餐
开场词（13:30-13:40）
Database Systems and Query Processing / 数据库与查询系统		主持人
13:40-13:55	NeuChain: A Fast Permissioned Blockchain System with Deterministic Ordering 彭泽顺（东北大学）	陈旭升
13:55-14:10	GeoGauss: Strongly Consistent and Light-Coordinated OLTP for Geo-Replicated SQL Database 周慰星（东北大学）
14:10-14:25	VBase: Unifying Online Vector Similarity Search and Relational Queries via Relaxed Monotonicity 张虔熙（微软亚洲研究院）
14:25-14:40	VRevisiting Log-Structured Merging for KV Stores in Hybrid Memory Systems 段卓辉（华中科技大学）
Testing and Vulnerability Detection/ 图计算与分析
14:40-14:55	Achieving Sub-second Pairwise Query over Evolving Graphs 陈鸿韬（清华大学）	王则可
14:55-15:10	CompressGraph: Efficient Parallel Graph Analytics with Rule-Based Compression 陈政（中国人民大学）
15:10-15:25	XPGraph: XPline-Friendly Persistent Memory Graph Stores for Large-Scale Evolving Graphs 汪睿（浙江大学）
15:25-15:40	Bring orders into uncertainty: enabling efficient uncertain graph processing via novel path sampling on multi-accelerator systems 张珩（中国科学院软件研究所）
茶歇 (15:40-15:50)
Graph Processing and Analytics / 测试与漏洞检测		主持人
15:50-16:05	Model Checking Guided Testing for Distributed Systems 王栋（中国科学院软件研究所）	赵夏
16:05-16:20	ACETest: Automated Constraint Extraction for Testing Deep Learning Operators 石景宜（中国科学院信息工程研究所）
16:20-16:35	Effective ReDoS Detection by Principled Vulnerability Modeling and Exploit Generation 王欣熠（中国科学院信息工程研究所）
16:35-16:50	Detecting Isolation Bugs via Transaction Oracle Construction 崔紫玉（中国科学院软件研究所）
Emerging Computing Technology / 新兴计算技术
16:50-17:05	DataFlower: Exploiting the Data-flow Paradigm for Serverless Workflow Orchestration 李子俊（上海交通大学）
17:05-17:20	Adaptive Online Cache Capacity Optimization via Lightweight Working Set Size Estimation at Scale 顾荣（南京大学
17:20-17:35	Occamy: Elastically Sharing a SIMD Co-Processor Across Multiple CPU Cores 张忠诚（中国科学院计算技术研究所）
17:35-17:50	ANPL: Compiling Natural Programs with Interactive Decomposition 黄迪（中国科学院计算技术研究所）

特邀报告主题: 云原生体系结构

过敏意

摘要：云原生是云计算的新兴计算模式，已成为新一代云的任务执行标准。云原生计算将大规模应用分解为大量的小函数，并封装在容器中运行，具有按需使用，快速弹性等优点，在AI推理、图计算、科学计算等领域也有巨大的应用潜力。本报告主要介绍云原生概念，云原生的体系结构是什么，在系统、框架和支撑层各自的挑战和问题，最后介绍我们构建的一个完整的云原生系统，包括框架，调度，支撑这三层。每一层对应的技术是什么。上述技术将显著提升云原生性能，推动该技术快速落地。

报告人：上海交通大学电子信息与电气工程学院“致远”讲席教授，国家杰青，欧洲科学院外籍院士，教育部创新团队学术带头人，973计划首席科学家，享受国务院特殊津贴。IEEE Fellow，ACM 杰出科学家，中国计算机学会常务理事和会士。研究方向为高性能计算，并行编译与算法，并行与分布式系统，云计算与大数据，计算机体系结构。现担任IEEE Transactions on Sustainable Computing主编，IEEE Transactions on Parallel and Distributed Systems、IEEE Transactions on Cloud Computing、Journal of Parallel and Distributed Computing等期刊编委；在IEEE/ACM Transactions、MICRO、ASPLOS、ISCA、HPCA等国内外著名期刊和会议发表了500余篇论文，出版中英文著作6部，授权发明专利40多项，国际学术会议上获得最佳论文7次。主持国家杰出青年基金、国家自然科学基金重点项目、国家重点研发计划、863项目、973项目等多项国家级项目，曾获得2019年度国家技术发明二等奖和多个省部级一等奖。

特邀报告主题:基于持久内存的多层级内存型存储系统

金海

摘要：新型存储级内存（SCM）打破了内存和外存的界限，使得构建多层级的大容量内存型存储系统成为可能。然而，SCM的涌现对传统体系结构、操作系统和编程模型都带来了巨大的冲击。我们团队经过多年深入的研究，在异构内存硬件架构、系统软件栈和分布式内存池系统方面提出了一系列的关键技术，实现了全栈协同优化的多层次分布式内存型存储系统。本报告将从多层级异构内存架构、支持多层级大内存的系统软件栈、分布式共享内存系统三个层次介绍团队在异构内存地址转换加速、内存动态管理、应用透明移植、持久内存事务机制、分布式内存数据可靠持久化，多副本容错等方面的研究工作。

报告人：华中科技大学教授、博士生导师，长江学者特聘教授，国家杰出青年基金获得者，国家“万人计划”科技创新领军人才。中国计算机学会副理事长、会士，IEEE Fellow，华中科技大学“大数据技术与系统国家地方联合工程研究中心”主任、“服务计算技术与系统教育部重点实验室”主任。国务院特殊津贴专家。“十三五”“云计算与大数据”国家重点研发计划专家组副组长、“十四五”“先进计算与新兴软件”国家重点研发计划专家组组长、“高性能计算”国家重点研发计划专家组副组长。湖北省计算机学会理事长。获国家自然科学二等奖1项、国家科技进步二等奖2项、国家发明二等奖1项。主要研究领域为计算机体系结构、并行与分布式处理等、云计算与大数据。

特邀报告主题: 飞腾高性能通用CPU发展与思考

卢凯

摘要： CPU是高性能计算和各型信息系统的核心控制与运算部件。面对高性能计算领域不断增长的算力需求，CPU应如何发展与突破？本报告将回顾飞腾系列高性能通用CPU的发展脉络，总结取得的关键技术创新，并分享高性能通用CPU研制的思考与体会。

报告人：长期从事高性能计算、智能计算与大数据、信息安全等方向教学科研工作，是银河、天河团队带头人。领导研制的天河超级计算机、麒麟操作系统、飞腾微处理器、玉衡网络设备在国家和军队信息化建设中发挥重要作用，为国防和军队建设作出重要贡献。入选国家“百千万工程”人才库、国家有突出贡献的中青年专家、军队高层次创新人才工程领军人才、国防科技卓越青年科学基金、教育部新世纪优秀人才支持计划，受聘长江学者特聘教授;获得中国青年科技奖、中国科协“求是”奖，享受国务院政府特殊津贴。获国家科技进步特等奖1项、一等奖1项，国家科技进步创新团队奖1项，全国创新争先奖1项，国家级教学成果二等奖1项;获军队(省部) 级科技进步一等奖3项，省教学成果特等奖1项。

特邀报告主题：超大规模集成电路中的掩模优化

Bei Yu

摘要：集成电路技术的快速演变，以及设计复杂性的提升，带来了制造和产量⽅⾯⽇益增加的挑战。光刻过程在将设计图案转写到硅⽚上发挥了关键作⽤，然⽽，随着制造环境变得越来越复杂和多变，其建模和模拟成本急剧上升。与此同时，掩膜优化 - 设计过程的关键部分 - 变得更加重要且成本更⾼。本次演讲将探讨三个互相关联的领域：光刻建模，光学临近修正（OPC），以及⼤规模OPC的实施，尤其强调深度学习在解决这些挑战⽅⾯的最新进展。此外，演讲将聚焦深度学习在OPC中可以扮演的重要⻆⾊。我们将展示深度学习在我们全⽅位掩膜优化框架内的成功应⽤，展示其在提⾼半导体制造领域⼤规模OPC效率和效果⽅⾯的巨⼤潜⼒。

报告人：⾹港中⽂⼤学计算机科学与⼯程系副教授， 2010年毕业于清华⼤学计算机科学与⼯程系获硕⼠学位， 2014年毕业于美国德克萨斯⼤学奥斯丁分校电⼦计算机⼯程系，获博⼠学位。 2014年⾄2015年在美国德克萨斯⼤学奥斯丁分校做博⼠后研究，从事集成电路设计⾃动化(EDA)⽅⾯的研究。在2021年获得了IEEE CEDA 职业发展奖（early career award），这个是亚太区的学者第⼀次获得这个世界级的奖项。获得过 IEEE TSM 2022, ICCAD 2021 & 2013, DATE 2022, ASPDAC 2021 & 2012, ISPD2017、 SPIE2016 等世界顶级期刊会议的最佳论⽂奖，以及ASPDAC2023, MLCAD2022, DATE2021, DAC2014、 ICCAD2011、ASPDAC2013/2019 等多次最佳论⽂提名。是世界上唯⼆的学者同时获得过ICCAD的前端和后端两个最佳论⽂奖项（另⼀位是不莱梅⼤学的Rolf Drechsler教授）。他在世界级CAD竞赛中荣获多次世界前三名。已发表超过90篇重要国际期刊论⽂(包含50多篇EDA 领域世界顶级期刊论⽂ IEEE TCAD) 和 170余篇本领域重要国际会议论⽂。其中包括了98篇CCF-A的期刊和会议论⽂。在EDA的两⼤顶级会议， DAC'2023和ICCAD'2021分别发表了10篇和9篇⻓论⽂，分别创造了DAC和ICCAD的历史记录。担任了计算机辅助设计领域多个世界顶级期刊和国际重要会议的编委会委员和客座编辑，是IEEE TCCPS Newsletter的总编辑，同时也是IEEE CEDA⾹港分会的组委会委员。因为在领域内的杰出贡献，获得了ACM SIGDA功勋服务奖（Meritorious Service Award）。