ACM中国图灵大会, ACM TURC 2023

专题研讨会--SIGAI China（活动地点：瑞华酒店）

SIGAI China的工作宗旨： 围绕人工智能各个专业领域开展学术/技术交流，尤其鼓励学科交叉融合发展；促进学术和产业的紧密结合，促进AI技术的产业落地，推动我国自主知识产权向产业界的成果转化；协助ACM China开展学术交流，提升在国家科技活动和国际学术方面的影响力。

组织委员会

主席

王亦洲（北京大学）

董乐（北京通用人工智能研究院）

副主席

潘纲（浙江大学）

朱毅鑫（北京大学）

程序委员会主席

张拳石（上海交通大学）

魏平（西安交通大学）

本地委员会主席

夏桂松（武汉大学）

宣传委员会主席

宋国杰（北京大学）

董亦飞（北京通用人工智能研究院）

曲延云（厦门大学）

产业关系委员会主席

陈维（北京通用人工智能研究院）

段炎彪（北京赢识科技有限公司）

会议日程

日期（2023-07-29）地点（TBC）
时间	环节	内容	讲者	主持人
13:30-13:40	开幕	开场致词	朱松纯，北京通用人工智能研究院院长，北京大学智能学院、人工智能研究院院长，北京大学与清华大学讲席教授	董乐，北京通用人工智能研究院常务副院长
13:40-14:10	主题报告	浅谈人类理性与智能	张俊，美国密西根大学心理学系终身教授、数学系终身教授	王亦洲，北京大学前沿计算研究中心副主任，博雅特聘教授
14:10-14:40	主题报告	智能化信息加工——来自脑科学的启示	李武，北京师范大学认知神经科学与学习国家重点实验室主任，教授
14:40-15:10	主题报告	知识、推理和创造，重塑数智商业技术——从北大-阿里妈妈人工智能创新联合实验室谈起	郑波，阿里妈妈及闲鱼CTO
15:10-15:30	茶歇（Poster）
15:30-15:50	学术报告	人机对齐：开放环境下的安全决策对齐	杨耀东, 北京大学人工智能研究院助理教授
15:50-16:10	学术报告	具身智能：机器人的场景理解与任务运动规划	刘航欣，北京通用人工智能研究院机器人实验室负责人
16:10-17:30	圆桌论坛	“大模型” 与通用人工智能	王亦洲（主持人）、朱松纯、张俊、李武、杨耀东、刘航欣、郑波

日期（2023-07-30）地点（待定）
时间	环节	内容	讲者	主持人
14:00-14:05	暖场	主持人暖场		张拳石，上海交通大学电子信息与电气工程学院
14:05-14:25	学术报告	社会智能：社会交互中的心智建模	范丽凤，北京通用人工智能研究院认知与推理实验室研究员
14:25-14:45	学术报告	对话式 AI 技术的实践与探索	万玉龙，OPPO 智能交互部部长，小布助手首席架构师
14:45-15:05	学术报告	基于时序数据的因果推理	孙鑫伟，复旦大学副研究员
15:05-15:25	学术报告	图神经网络是否可以解决实际问题？	贺笛，北京大学助理教授、博士生导师
15:25-15:45	茶歇	茶歇	-	茶歇
15:45-16:05	学术报告	人工智能音乐与美学	金鑫，北京电子科技学院副教授，可视计算与安全实验室主任	曲延云，厦门大学计算机科学与技术系教授
16:05-16:25	学术报告	主动推理：知行合一	张驰，北京通用人工智能研究院研究员
16:25-16:45	学术报告	价值驱动的自主通用智能体	钟方威, 北京大学博雅博士后
16:45-17:05	闭幕	结束词	王亦洲，北京大学前沿计算研究中心副主任，博雅特聘教授

特邀报告主题:

朱松纯

北京通用人工智能研究院院长
清华大学与北京大学讲席教授

摘要：

报告人：1991年毕业于中国科学技术大学，获计算机专业学士学位，1996年获美国哈佛大学计算机博士学位，在国际顶级期刊和会议上发表论文300余篇，三次问鼎计算机视觉领域国际最高奖项——马尔奖，两次担任国际计算机视觉与模式识别大会主席（CVPR2012、CVPR2019）。在认知科学领域，如视觉常识推理、场景理解等领域做出重要贡献。自2010年以来，两次担任美国视觉、认知科学、AI领域跨学科合作项目MURI负责人(Principal Investigator)。在科研方面具有很强的前瞻性，选题和方法独树一帜，长期致力于构建计算机视觉、认知科学、乃至人工智能科学的统一数理框架。 2002年加入美国洛杉矶加州大学（UCLA），任统计系与计算机系教授，视觉、认知、学习与自主机器人中心主任。2020年9月，朱松纯回国创建北京通用人工智能研究院（Beijing Institute for General Artificial Intelligence）同时担任清华大学与北京大学讲席教授，并任北京大学人工智能研究院院长、北京大学智能学院院长。

特邀报告主题:浅谈人类理性与智能

张俊

美国密西根大学心理学系终身教授、统计系终身教授
美国心理学协会会士，心理规律协会会士

摘要：我们将探讨理性在人类智能和通用人工智能中的角色。为了阐述理性在推理、记忆和决策过程中的应用，这次讲座将展示各种认知陷阱和认知偏差，以及人类思维的失败。通过研究理性的失败，我们希望激发听众对心智与认知、机器智能和数学推理这些交叉主题的好奇心。

报告人：现任《数学心理学》杂志副主编，《信息几何学》杂志创刊联合主编，全美脑与行为科学协会联盟（FABBS）执行董事。历任数学心理学协会副主席、主席、执行委员会委员。1985 年获得复旦大学理论物理学士，1992年获得加里福尼亚大学伯克利神经生物学博士，并获聘于密西根大学任终身教职。张俊教授曾在澳洲墨尔本大学、法国科学院马赛所、加拿大滑铁卢大学、日本理研脑科学研究所、英国剑桥大学、美国哈佛大学等，担任客座研究员、访问教授等席位。 2007-2011 年期间，受聘于美国国防部空军科研署数学信息生命学部担任基础研究项目经理。张俊教授主持的 M3 实验室（“Mind，Machine，Mathematics”）长期开展认知建模、机器学习等人机界面、累脑人工智能算法研究，持续获得美国自然科学基金会、国防部等部门的科研经费支持和支撑。他的“信息几何：信息科学的几何化”受到美国 DARPA（国防先进科研项目署）的种子基金资助。

特邀报告主题: 智能化信息加工——来自脑科学的启示

李武

北京师范大学认知神经科学与学习国家重点实验室主任教授、博士生导师

摘要：人工智能的发展伴随着脑科学的影子，然而二者之间一直存在鸿沟。例如，大脑视觉系统自下而上的层级加工模式启发了深度卷积人工神经网络，但是二者之间缺乏更多的交集，特别是在体现感知灵活性的信息提取和整合原理层面，包括低级和高级脑区之间以及视觉系统与其它功能系统之间的信息交互原理。虽然人工智能无需借鉴大脑复杂的工作原理，单凭大模型、大数据、大算力的优势就能在许多特定任务中超越大脑，但是，要突破目前人工智能算法固有的局限性，大脑智能化的信息加工原理将具有重要借鉴价值。反过来，人工智能也为脑认知原理解析提供了模拟和验证模型，二者之间可以相互启发、迭代发展。本报告将围绕上述内容，结合近年来的研究发现展开讨论。

报告人：长江学者特聘教授，国家杰出青年科学基金获得者，新世纪百千万人才工程国家级人选、万人计划领军人才，973项目首席科学家，主持国家科技创新 2030 —“脑科学与类脑研究”重大项目。现任中国神经科学学会常务理事、认知神经生物学分会主任。 1989年毕业于中国科学技术大学生物系生物物理专业，1994年获中科院上海生理研究所神经生物学博士学位。1994-1996年在美国加州大学伯克利分校从事视觉心理物理学博士后研究，1996-1999年在德国马普生物控制论研究所做访问学者，1999-2006年受聘于美国洛克菲勒大学，2007年加入北京师范大学。研究兴趣：视觉图像解析和视觉学习的脑机制；大脑感知、认知、情绪系统的相互作用。

特邀报告主题：知识、推理和创造，重塑数智商业技术——从北大-阿里妈妈人工智能创新联合实验室谈起

郑波

阿里妈妈及闲鱼CTO
阿里妈妈首席科学家

摘要：阿里妈妈技术团队致力于探索最前沿的人工智能技术并应用到商业场景中来，让更多的品牌商家和中小商家享受到科技进步带来的红利。在以生成式AI大模型为代表的此轮人工智能技术浪潮下，我们认为面向未来的数智商业技术，将带有明显的知识驱动、逻辑推理和创造性特征，阿里妈妈技术团队基于以上方向，在包括生成式AI大模型等领域不断进行技术探索和研究应用。此外，我们和国内众多知名高校、研究机构一起开展产学研合作，比如，自去年北大-阿里妈妈人工智能创新联合实验室（PAAI）正式成立以来，我们在大规模图模型、决策智能、智能音乐生成等方向进行了若干具体研究和应用，并取得了一些效果。本次报告将围绕上述内容进行介绍和讨论。

报告人：负责阿里妈妈广告技术事业部以及闲鱼的包括算法、机器学习、工程架构在内的整体技术工作， CCF计算经济学专业组执行委员。毕业于清华大学计算机系，2017年加入阿里巴巴之前，在谷歌工作了11年，领导谷歌的展示广告算法团队以及中国地图团队。研究兴趣：主要研究方向为深度学习、展示和搜索广告算法、多模态以及引擎优化等领域。

特邀报告主题：开放环境下的安全决策对齐

杨耀东

北京大学人工智能研究院助理教授，博士生导师
北京通用人工智能研究院研究员
2022年ACM SIGAI China新星奖获得者

摘要：大语言模型在智能问答上体现出了惊艳的效果。如果利用大语言模型中的通识辅助智能决策是迈向通用人工智能的关键步骤。本讲中，我将会介绍决策模型序列化的工作以及决策模型与大语言模型的对齐问题。相关技术在灵巧手操作、我的世界中已取得重要进展。

报告人：人社部高层次留学人才回国计划、中国科协青年托举计划获得者科研领域包括强化学习、博弈论和多智能体系统，重点关注基于强化学习方法的智能群体博弈及群体智能涌现本科毕业于中国科学技术大学，并在伦敦帝国理工大学与伦敦大学学院获得硕士及博士学位，回国前他于伦敦国王大学信息学院任助理教授。他发表AI顶会论文及专利专著 60 余篇，谷歌引用两千余次。工作曾获机器人学习会议CoRL’20 最佳系统论文奖、多智能体顶会AAMAS’21 最具前瞻性论文奖。因在多智能体强化学习上的工作，他曾获得世界人工智能大会（WAIC 2022）云帆奖璀璨明星。

报告主题：机器人的场景理解与任务运动规划

刘航欣

北京通用人工智能研究院前沿研究中心联席执行主任
机器人实验室负责人

摘要：本报告介绍了一种基于虚拟运动链条（virtual kinematic chain）的机器人建模思路，该方法能够将机器人的移动底座、机械臂和被操作的物体建模为一个整体，更全面地表示机器人的姿态和运动，从而使机器人在困难环境中的产生更协调、灵活的动作。这个建模思路进一步驱动了一种以体现运动信息为目标的场景重建方法，该方法可以从RGB-D输入中构建一个能够与虚拟运动链条思路结合的场景图表征，实现了一个新的机器人感知和规划框架。该框架在多步骤复杂移动操作任务中展现了机器人更强的移动操作和抓取能力。

报告人：从事自主机器人感知、规划、学习与交互方面的研究，获得美国国防高级研究计划局、美国海军研究办公室等研究经费的支持（DARPA SIMPLEX、DARPA XAI、ONR MURI）加州大学洛杉矶分校获得计算机科学博士学位和机械工程硕士学位在Science Robotics/IJCV/Engineering/RA-L/ICRA/IROS/AAAI等机器人、计算机视觉和人工智能领域的顶级期刊和学术会议发表论文近30篇。并在2019年中国ACM图灵大会上获最佳论文奖。

报告主题：社会智能：社会交互中的心智建模

范丽凤

北京通用人工智能研究院认知与推理实验室研究员

摘要：除了对世界的物理理解之外，人类还拥有高度的社会智能——感知社会事件、推断他人心理状态、促进社会互动的智能。我们相信，人工智能（ASI）将在塑造人工智能（AI）的未来中发挥至关重要的作用。我们提出了一种新的用于社交互动理解和信念动态建模的分层计算框架。

报告人：博士毕业于加州大学洛杉矶分校(UCLA)，师从朱松纯教授。主要从事心智认知建模、非口头交流、社会交互建模，在包括ICCV、CVPR、NeuRIPS等国际期刊/会议上发表文章10余篇，一作工作曾被媒体广泛报道。曾获得国际认知学会最佳建模奖、2021 ACM SIGAI China新星奖。

特邀报告主题：对话式 AI 技术的实践与探索

万玉龙

OPPO 智能交互部部长
小布助手首席架构师

摘要：随着GPT、Diffusion等AIGC技术的快速发展，对话式AI类产品的需求开始爆发，Midjourney、ChatGPT等产品备受欢迎，越来越多的国内外企业开始加大在对话式AI技术的投入。作为已拥有上亿月活的对话式AI助手团队，我们也在积极思考和探索新AI浪潮下的演进路径。本次分享主要就OPPO对话式AI助手的技术演进、产品创新等方面展开，同时面向未来行业发展探讨演进趋势。

报告人：北京大学理学学士，经济学学士，中国科学院博士，现任OPPO小布助手首席架构师，智能交互部部长，曾任OPPO智能助手技术委员会主任 CCF&IEEE&CAAI专业会员，CCF人机交互专委会执委，语音对话与听觉专委会执委，虚拟现实专委会执委，CCF CTO Club成员。曾就职于中国科学院声学研究所和阿里巴巴达摩院，长期从事语音语义、多模态等人机交互技术研发和产品化工作。

基于时序数据的因果推理

孙鑫伟

复旦大学副研究员
2022年ACM SIGAI China新星奖获得者

摘要：时序数据广泛存在于人工智能的应用，例如视频分析、机器人规划、以及脑神经信号分析等。而从时序数据推理事件间的因果关系知识对规划、决策具有重要意义。然而，已有方法面临因果关系图不可识别的问题，造成错误的推断结果。我们首先注意到，当采样频率小于因果影响频率时，会产生无法观测的子采样点，而这些子采样点是造成推断有偏的原因。为了去除偏差，我们将这些子采样点的未来观测点的信息作为代理变量，并利用代理变量将因果关系的推断转化成假设检验问题。我们证明，该方法可无偏地恢复出因果关系图。我们利用所提方法学习了阿尔茨海默疾病中脑区传播的因果链路，相比较已有方法，该链路具有更强的可解释性。

报告人：助理教授，2018年在北京大学获得博士学位，2019年-2022年在微软亚洲研究院担任机器学习研究员。于2022年3月进入复旦大学大数据学院工作。论文发表在Applied and Computational Harmonic Analysis, IEEE TPAMI, IEEE Transactions on Signal Processing, IEEE Transactions on Image Processing 等期刊上，以及ICML, NeurIPS, ICLR等机器学习国际会议上。研究兴趣: 高维统计、因果推断等理论以及在机器学习领域的应用。

报告主题：图神经网络是否可以解决实际问题？

贺笛

北京大学助理教授、博士生导师
曾担任微软亚洲研究院主管研究员

摘要：如何设计具有强大表达能力的图神经网络是图机器学习领域的一个核心话题。近年来，虽然已经提出了大量的网络结构，但人们尚不清楚这些网络结构能够系统地获得怎样的表达能力。在本研究中，我们将从图双连通性的新颖角度来系统探究这一领域的基本问题。图双连通性是图论中的核心概念，它们在各类图学习中具有重要意义。然而，我们的结果表明，绝大多数主流的图神经网络不具有在图双连通性方面的任何表达能力。我们进而提出了一种系统性的方法，通过引用距离信息来可证明地获得对各类图双连通性问题的表达能力。实践中，该方法可以被基于Transformer的网络架构高效的实现，并取得了比先前方法更好的实验结果。

报告人：在机器学习顶级国际会议 ICML，NeurIPS，ICLR 上发表数十篇论文。长期担任机器学习顶级会议领域主席及审稿人工作。带领团队设计的图神经网络 Graphormer 在 KDD 2021图神经网络挑战赛及 NeurIPS 2021 几何神经网络挑战赛中击败包括 DeepMind，Facebook AI Research 等对手夺冠。工作曾获得ICLR 2023杰出论文奖

报告主题：人工智能音乐与美学

金鑫

北京电子科技学院副教授
可视计算与安全实验室（victory-lab）主任
北京通用人工智能研究院AI音乐项目联合负责人

摘要：人工智能音乐生成是AIGC领域的研究热点之一，当前的方法大多基于语言类深度学习模型，从人类制作的音乐数据中进行模仿学习与生成，在可解释性、可控性、交互性等方面还存在较大不足，缺少专业的音乐标注数据集，较少考虑音乐美学以及与人类价值观的对齐。北京通用人工智能研究院在AI音乐领域提出一纵一横的研究路线，纵向上提出音乐的与或图（Music AOG）表示，横向上研究基于Music AOG的作曲、编曲与音频生成，目标是在纵向音乐结构上以及横向音乐制作过程中，实现逐节点与逐过程的可解释，可操控、可交互。本次报告主要介绍旋律、和弦、和声、节奏等的AOG表示、Music Parser专业音乐标注工具、音乐采样生成、音乐UV理论、计算音乐美学、视频配乐应用等方面的探索。

报告人：北京航空航天大学CS博士，师从赵沁平院士；莲花山计算机视觉研究院访问学生，师从朱松纯教授；清华大学访问学者，师从戴琼海院士与刘烨斌教授。主要研究方向为计算美学、计算机视觉、人工智能安全。在计算机视觉、图像处理、人工智能、多媒体技术等领域的重要学术期刊与会议发表论文70余篇，包括TIP、TMM、TITS、SC-IS、ACM MM、AAAI、IJCAI、CVPR、ECCV等。获国家发明专利授权31项、2023金海鸥影视荣誉作品杰出技术贡献奖、ROSENET2018/19最佳论文奖、ISAIR2017最佳学生论文奖等，参与了全国信标委国家标准《信息技术计算机视觉术语》的制定。主持或参与国家级科研项目9项，省部级与企业合作项目20余项（含华为、阿里、兵器工业、中石化等）。CCF高级会员，担任ISAIR常务委员、CSIG视觉大数据专委会常务委员、CIE虚拟现实分会副秘书长、CCF计算机视觉专委会、计算艺术分会执行委员、中国电影美术学会虚拟空间专委会委员等。

报告主题：机器人的场景理解与任务运动规划

张驰

北京通用人工智能研究院研究员

摘要：近期的语言和视觉-语言学习进展在一系列完整信息问答数据集上展现出惊人的成果，这是通过将大量的世界知识融入到学习模型中实现的。人类并非仅被动地被提问并从知识库中检索信息，而是可以主动地反应、探索、收集，并从新的和已知的信息中推理出对不完整信息问题的解答。为了填补这个至关重要的空白，我们引入了一套在交互环境中的推理问题，以启发和评估智能体的这种主动推理能力。具体来说，这套任务允许智能体在知识丰富的环境中，对具有不完整信息的问题进行积极的探索和多轮推理。这套任务覆盖了直观物理、因果归纳和溯因推理。相比之下，现有的具身推理的工作只要求智能体按照语言指示执行单轮推理，忽视了人类推理的主动性。相较之下，在这套任务中，智能体需要积极地与环境互动，以寻找新的证据，并结合已有知识，根据观察解释发生的事情。我们检查了多个最先进的模型，展示了它们在积极探索环境和理解复杂情景方面的限制。我们希望这套任务能帮助启发、评估和改善智能体的主动推理能力，并为未来能够做到知行合一的人工智能铺平道路

报告人：张驰博士本科毕业于浙江大学，博士毕业于加州大学洛杉矶分校VCLA实验室，博士期间师从朱松纯教授。长期致力于神经符号方法下的视觉推理问题：研究领域涵盖视觉数感问题，时空推理问题，和统一的抽象推理框架，技术涉及概率前向-后向规划和双级优化。他的研究工作也包含风格迁移、因果推理、物理推理、溯因推理和大模型探测等。张驰在IJCAI，AAAI，CVPR，ECCV，NeurIPS，IROS和ICRA都有优秀论文录取（包括口头报告2篇）并长期担任上述顶级会议的审稿人。他曾是著名开源深度学习项目MXNet的重要贡献者之一，并在谷歌研究院，亚马逊研究中心都有丰富的实习经历。

报告主题：价值驱动的自主通用智能体

钟方威

北京大学博雅博士后
2021年ACM SIGAI China优博奖获得者

摘要：自主智能体是能够在复杂和动态环境中积极感知并行动，追求一系列自我激励的目标或任务的计算系统。在这次演讲中，我将介绍我们关于开发可以有效驱动智能体完成各种任务的通用价值系统的研究。价值系统的通用性将与自主智能体的通用性密切相关。具体来说，我将讨论构建价值系统的三种主要方式：先验知识，人类反馈，以及交互式使用。我还将演示如何使用价值系统来指导智能体在开放性任务和多智能体环境中的决策制定。

报告人：研究兴趣：自主学习、多智能体系统、认知推理获国家博士后创新人才计划（“博新计划”）资助在人工智能领域顶级国际期刊和会议上发表高质量论文20余篇，包括2篇IEEE TPAMI（IF 17.86， SCI 一区）和ICLR、ICML、NeurIPS、CVPR等会议论文。担任Nature Machine Intelligence, International Journal of Robotics Research (IJRR)等顶级期刊和会议审稿人。开源项目UnrealCV的团队核心成员之一，为人工智能研究提供近真实的虚拟环境。