观察与分析
0 引 言
神经信息处理系统大会(Conference on Neural Information Processing Systems, NeurIPS)是机器学习领域的顶级会议,是神经计算方面最好的会议之一,在中国计算机学会(China Computer Federation, CCF)推荐国际学术会议中被评为人工智能(artificial intelligance, AI)领域的A类会议。在Google Scholar发布的2020年学术指标中,H5指数为198,位于计算机领域的第3位,位列所有领域出版物的第21位。
第34届 NeurIPS 原定于2020年12月6日—12日在加拿大温哥华举办。因为疫情,NeurIPS 2020 变成了一届线上会议。
1 NeurIPS 2020的亮点
由于新冠疫情的持续蔓延,NeurIPS 2020 完全采取了线上会议的形式,世界各地的参会者通过互联网参会交流。为了提升线上会议的参与体验,NeurIPS大会组委会专程邀请了两名在线体验主席,并在Poster环节使用了名为GatherTown的交互网站,十分逼真地模拟了线下交流。除此之外,会议注册费用大幅下降。学生注册费用为 25 美元,其他参会者为 100 美元,而前一年的注册费用分别为 420 和 750 美元。值得注意的是,所有人都可以在无需注册的情况下访问Tutorial、Keynote、Oral论文和Spotlight论文的宣讲内容。在会议结束后,NeurIPS 2020 预计还会将 Poster 的录像公开。
除了涵盖人工智能领域丰富的主题,NeurIPS 2020还开始探讨机器学习的社会影响,例如投稿论文需要添加Broad Impact、审稿流程中引入道德审查机制。不过仅有290篇投稿论文被审稿人提出了道德担忧,主要集中在虚假人脸的生成、新数据集的隐私泄露风险等。同时,大会邀请报告讨论了如何避免机器学习系统的不良社会影响,并关注数据标注员的职业发展问题。还特意举办了关于新冠病毒COVID-19的特别研讨会,体现了人工智能社区和科技工作者的社会责任感。
2 论文录用情况
NeurIPS 2020 的投稿量再创新高,共有9 467篇论文被提交,相比2019年增长了40%。经过7 062名审稿人的同行评议,最终有1 898篇论文入选,录取率仅为20.0%,低于前一年的21.6%,达到历史最低。其中105篇被录用为Oral Paper,280篇被录用为Spotlight Paper。Oral Paper和 Spotlight Paper的录取率仅有1.11%和2.96%。
在 NeurIPS 2020 中,谷歌位于所有高校/机构的榜首,入选论文高达202篇。麻省理工学院排名第2,共有109篇论文入选。斯坦福大学位居第3,共有106篇论文入选。国内高校/机构中,清华大学排名第1,共有63篇论文入选,排在国内外所有高校/机构的第7位;北京大学第2,共有37篇论文入选。从作者角度,有华人参与的论文共有568篇,占总论文数的29.91%。其中华人为第一作者的论文共有321篇,占华人参与论文数的56.51%,占总论文数的16.90%。华人在NeurIPS 2020 中贡献了重要力量。
NeurIPS作为机器学习领域的顶级会议,收录的论文包罗了人工智能领域的各种主题,包括深度学习及其应用、强化学习和规划、纯理论研究、概率方法、优化、机器学习和社会、神经科学和认知科学等多个方面。
3 邀请报告
NeurIPS 2020 共有7个邀请报告(Invited Talk),主题丰富,涵盖了密码学、反馈控制理论、因果推断和生物学等多个学科,反映了机器学习正在与其他学科不断影响并相互交融;同时探讨了人工智能大潮下的多个社会问题,展现了科研人员的社会责任感。部分邀请报告如下:
1)“Robustness, Verification, Privacy: Addressing Machine Learning Adversaries”。2012年的图灵奖得主、MIT(Massachusetts Institute of Technology)的密码学教授Shafi Goldwasser展示了在密码学的意义下,机器学习正面临的3大挑战,包括在有限良好数据下验证机器学习模型,在私有数据背景下进行大规模训练和在最坏情况对抗样本下模型的鲁棒性问题。对于可验证性,她提到了2018年加利福尼亚的一项提案:将现金保释更改为信用评估,展现了机器学习模型对现实生活带来的冲击和人们需要特别考虑的可靠性问题,以及从密码学角度解决可验证性问题的一些思路。其次,机器学习模型需要大规模的数据,然而由于现实原因,大多数数据都是私有数据,为大规模训练带来了障碍。Goldwasser介绍了可以借鉴密码学中的常用方法,如multi party computation (MPC),来突破这一瓶颈。最后,Goldwasser阐述了机器学习中需要考虑的鲁棒性问题本质上就是密码学中经常需要考虑的最坏对手问题。总体而言,Goldwasser的演讲为解决机器学习问题开辟了崭新的视角。
2)“Feedback Control Perspectives on Learning”。阿卜杜拉国王科技大学(King Abdullah University of Science & Technology,KAUST)的教授Jeff Shamma重点介绍了一些反馈控制概念,特别是鲁棒性、被动性、跟踪和稳定性。因为反馈控制与进化博弈论、无遗憾学习(no-regret learning)和多智能体学习中的特定问题相关,已经广泛应用于各种工程领域,包括航空航天、机器人、汽车、通信、制造业和能源应用,经过几十年的努力,超越人类性能的目标已经实现。学习中的许多设置都涉及反馈互联,例如,强化学习有一个智能体与其环境反馈,而多智能体学习则有多个智能体相互反馈。通过明确地认识到反馈互联的存在,人们可以利用反馈控制的观点来分析和综合此类系统,并研究所有反馈控制系统固有的可实现性能的基本限制的权衡。
文章来源:《CT理论与应用研究》 网址: http://www.ctllyyyyj.cn/qikandaodu/2021/0709/1351.html