马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
ICLR 2026这场突如其来的“开盒”事件中,无数作者亲眼看到了顶会审稿黑箱中的真相。
一夜之间,微信群、小红书等社交媒体上爆料横飞,到处都是“受害者”现身说法。有人震惊地发现给自己论文打出低分的竟是多年的好友。另一边,也有审稿人不再遮掩身份,直接跑到评论区回应作者质疑,在OpenReview平台上演跨平台撕逼,将本应严肃的学术讨论变成了网络骂战 。
更劲爆的是,一些令人瞠目结舌的内幕被逐一揭露:
CASE 1 同学,我有40个问题要考考你
有作者在社群里吐槽:自己收到了一份长达 80 条问题的“史诗级长评” ,当场心态爆炸。同行们看完纷纷表示震惊——不仅提问数量远超合理范围, 甚至比论文的页数还多 ,让人不得不怀疑这是不是审稿人直接让 AI 自动生成了一份评审模板。
更魔幻的是,后来陆续有作者晒出截图,发现自己也遭遇了同样的“ 40+40 魂斗罗套餐 ”:40 条弱点、40 条问题,排列整齐、风格一致,仿佛同一个人用复制粘贴在批量扫射投稿论文。被波及的作者们只好抱团取暖,一边自嘲“命运共同体”,一边苦笑着怀疑学术评审是不是已经被模板化、格式化到这种程度。
离谱还不止于此。事件曝光后,有人进一步扒出: 这位疑似“模板狂魔”的审稿人居然出现了光速提分的情况 ——有一篇论文直接被他从低分加到满分 10 分,前后态度判若两人。如此夸张的反差操作,让人不禁怀疑学术公平是不是被这样草率的流程掏空了。
CASE 2 我忍你很久了
除了“狂炖40问”这种离谱场面, 情绪失控的对骂 也首次登上顶会舞台。一名作者在评论区直接对审稿人爆粗口:“你有精神问题吗?!”这句话堂而皇之地挂在ICLR评审页面上,引发哗然 。尽管当事人秒删并火速道歉,但截图早已满天飞 。
评论区瞬间化为修罗场,匿名评审的压力和情绪在此刻全面炸裂。学术圈吃瓜群众惊呼:原来科研大佬撕起逼来,比谁都不讲武德!
CASE 3 本是同根生,相煎何太急
更令人不安的是,这次泄密揭开了 评审“潜规则” 的冰山一角。多名不同来源的爆料显示,有的审稿人给出低分并非因为论文本身的问题,而是出于 私人恩怨 ——甚至有同一课题组的“兄弟”互相压分 。
CASE 4 本科生评审恶意给低分?
更离谱的流言继续在社区里狂飙。有作者根据泄露出来的审稿记录发现, 多篇论文的审稿人竟然是一名在校本科生 。而且这位“神秘评审”不仅参与了不止一篇投稿的评审,还对好几篇论文给出了 2 分、confidence=5 的“斩杀式低分” ——相当于在顶会的判决书上直接盖了个“死刑”章。
虽然听上去像都市传说,但不少老作者却一点不惊讶。在 ICLR、AAAI 这类顶会上,审稿人水准跨度极大,从大牛到本科生都可能混在同一个 reviewer 队列里。 你以为是专家在评你的论文,实际上可能是某个还在上《离散数学》的本科生给你判了生死。
更戏剧的一幕很快出现:疑似这位审稿人试图现身“澄清”——不是他给分低,而是“刚好分到了几篇质量一般的论文”。这番解释不仅没有平息风波,反而让吃瓜群众炸裂: 这场漏洞曝光,像是把顶会审稿从多年的“黑暗森林”,一脚踹进了透明直播间。
过去深藏在匿名制度里的权力、偏见与随意性,全都被赤裸裸摆在桌面上,被成千上万的研究者围观、质疑、群嘲。
CASE 5 Money for Rating
本次事件最魔幻的扩散,是社区里突然出现的一条爆料: 有审稿人在漏洞曝光后,竟然公然向作者索要“好处费”换评分。
CASE 6 Reviewer Under Fire
还有一些 更令人唏嘘的是,一些审稿人也在小红书上站出来爆料,称自己在漏洞曝光后收到了 带有人身攻击、恶意谩骂甚至骚扰意味的邮件。
CASE 7 能动手的就不动嘴 最戏剧性的传闻来自一些被低分“狙击”的作者: NIPS 下周就要开会了,他们打算线下当面找审稿人“Battle” 。 匿名制度在这场漏洞事故后名存实亡,而部分作者已经从线上情绪内耗,升级为线下“正面对峙”的准备,让整个社区都在观望——今年的 NIPS,会不会从学术盛会变成现实版“作者与审稿人的修罗场”。
更离谱的“数据分析”也随之出现。有人把泄露出来的审稿记录抓下来做了份“民间审稿报告”,结果显示: 中国审稿人占比高达 65.4% ,并由此衍生出一个“审稿人红黑榜”。
不少作者惊讶地发现, 给出低分、confidence=5 的“断头式评分”往往来自中国审稿人。
漏洞始末:OpenReview 权限失误引发泄密
究竟是什么原因,让这场史无前例的评审泄密事件爆发在 ICLR 2026?
根源最终指向了本次大会所依赖的 OpenReview 系统。北京时间 11 月 27 日深夜,正值 ICLR 评审最紧张的阶段,一个看似不起眼的前端 bug 却打开了通往灾难的大门。数据库权限配置出现错误,原本严格匿名的评审机制瞬间失效——从作者到审稿人、从机构到邮箱,所有应被严格保护的身份信息都暴露在 URL 的明文参数里。
泄露方式简单到令人发指。用户只需在浏览器输入一段格式固定的网址,替换论文 ID 和审稿人编号,就能立刻看到对应的审稿人实名信息。整个过程不需要任何黑客技巧,不用登录,不用绕过权限,没有脚本也能完成,只要知道论文编号,服务器就会主动把审稿人姓名、单位、邮箱以及他对你论文打了多少分、confidence 有多高,一股脑地呈现出来。
事故源头指向 OpenReview 的 profiles/search 接口。原本应当严格限制访问权限、只能由大会主席查看的审稿人信息,因为一次低级的权限校验失误,对所有用户敞开了大门。
美国东部时间 10:09,ICLR 的一位 Workflow Chair 率先向 OpenReview 团队报告异常。工程师随后紧急上线排查,大约在 11:10 完成修补,整个漏洞生命周期总共只持续约 61 分钟。然而,在社交媒体和自动化脚本横行的时代,一小时已经足以引发一场席卷整个学术圈的海啸。消息在 Twitter、小红书、Discord 以秒为单位扩散,研究者蜂拥而入系统“查户口”,有人开始截图自保,还有人直接写脚本爬取整个平台的数据。短短几小时内,谁给谁审稿、谁给了几分、confidence 是 2 还是 5,像成绩单一样在各种群聊里横飞。
当天深夜,ICLR 和 OpenReview 的紧急声明几乎同时上线。ICLR 的措辞异常强硬,明确表示任何利用泄露信息骚扰、威胁、行贿审稿人,或试图操控评审过程的行为,都将被视为严重违规,一经核实将直接 desk reject,并可能遭遇多年禁赛。OpenReview 也发布公告承认此次为严重的权限漏洞,公开致歉,并感谢社区的及时反馈。尽管两方态度严肃,但泄密已经无法逆转,全球学术界的信任危机正在全面发酵。
更令人不安的是,这次事件的受灾范围远不止 ICLR。OpenReview 官方随后确认,所有托管在该平台上的会议均受到影响。换句话说,NeurIPS、ICML、ACL、ARR,乃至平台上的所有 Workshop 和 Challenge,都在同一时间内匿名性失效。只要替换 URL 里的会议代号和年份,任何会议的审稿人、打分、机构背景都能一览无余。这不再是一场单点事故,而是一次系统级的匿名性崩塌。整个 AI 学术圈数万名参与者的身份在一夜之间被迫透明,双盲评审瞬间从一套严格的制度变成一个无处遁形的“全面实名制”。
而在所有混乱之上,ICLR 还不得不拿出一套史无前例的“事后补救方案”。在内部激烈讨论近一天后,官方发布了新的强制处理方式,试图为这场持续扩散的风暴踩下刹车。
首先是彻底重置 Area Chair 的分配,理由是 AC 信息也在泄露中曝光,为避免潜在干扰,不得不重新洗牌。
随后,ICLR 宣布冻结所有论文的评分,审稿人自即日起不得修改分数,也不得再参与任何讨论。作者仍可回复,但讨论区已变成单向通道,AC 将根据现有材料独立做出最终决定。
最后,ICLR 关闭了 Public Comment 功能,防止有人利用公开评论区对审稿人“开盒”、挑衅或报复。与此同时,官方还表示,已开始调查可能涉及跨国法律风险的事件,包括开盒、威胁、骚扰、行贿等行为,并警告所有相关人员此事将被严肃处理。
更耐人寻味的是,ICLR 在公告中首次承认,他们观察到漏洞曝光后审稿人评分出现异常上升,并收到了试图与审稿人勾兑的举报。换言之,社区里流传的“光速提分”“审稿人被恐吓后急忙加分”并不是空穴来风。匿名制度的坍塌让整个评审体系出现了肉眼可见的混乱,规则开始滑向无序。
回头看,这不是学术会议第一次因系统漏洞导致双盲破功。早在 2018 年,NIPS 使用的 CMT 投稿系统就曾出现过严重漏洞,审稿人只需反复切换冲突信息,就能推断论文的机构和作者。那次事故被称作“双盲评审史无前例的灾难”。但相比之下,ICLR 2026 的泄密来得更猛烈、波及范围更广、传播更迅速。短时间内,大量顶会的评审共同体被迫脱盲,匿名评审的制度基础几乎在一瞬间被打碎。
许多人第一次清晰意识到,双盲评审并不是一道坚固的防线,而是一套只要一个权限错误、一次配置疏漏就可能瞬间破灭的脆弱机制。ICLR 2026 的泄密,不仅是一场技术事故,也是一场深刻的制度危机。它揭开了学术共同体多年来讳莫如深的问题:我们以为匿名能保护公平,实际上它建立在比任何人想象得更脆弱的结构之上。
深度反思:顶会评审制度的结构性问题
ICLR 2026 泄密事件如同一面镜子,照出了顶级会议评审体系中长期存在却被忽视的结构性问题。学术圈在震惊之余,不得不集体反思: 我们引以为傲的同行评审机制究竟怎么了?
1. 审稿人选拔不透明,门槛过低。 以往人们默认顶会审稿人应是该领域资深且中立的专家,但现实却并非如此。正如前文提到的那样,很多学生甚至本科生都混迹于审稿人名单中 。一些会议为了应对海量投稿,广撒英雄帖,甚至自动邀请投稿作者担任下一届审稿人。
著名物理学家 Lenka Zdeborová 教授曾质疑:“如果大量同行评审其实由本科生完成,我们为何还要费心进行同行评议?!” 她在推文中指出自己在筛选研究生申请时,发现许多申请人已拥有顶会审稿经历。这一吐槽得到众多学界大佬共鸣: 一群资历浅薄的人在评判前沿研究,学术审稿何谈专业性?
2. 审稿意见质量堪忧,缺乏有效监督。 当前顶会评审存在一个悖论:一方面,评论是匿名的、无后果的;另一方面,审稿任务繁重、回报微薄。在这种情况下,有些审稿人投入不足甚至敷衍塞责也就不足为奇了。
低质量评审意见 屡见不鲜,空洞无物的官话套话、一眼就能看出是模板拼凑的流水账,甚至张冠李戴、评错论文的乌龙,作者却只能哑巴吃黄连。
更过分的是 恶意评审和利益冲突 。此次泄密揭露出的压分“黑手”和审稿人串通案例,令人不寒而栗。就在去年ICLR 2024大会上,官方还曾通报查实了多起审稿人与作者串通作弊的行为:一些审稿人通过操纵 bidding 系统与特定论文匹配,给出不应有的高分;甚至有个别领域主席利用职权指派自己“熟人”审稿人, 以人情关系抬升论文得分。
ICLR 2024组委会承认这些行为 直接违反学术道德 ,已交由道德委员会审查并评估处罚 。可见, 审稿过程缺乏外部监督和问责 ,在匿名掩护下,少数人铤而走险牟取私利,破坏了学术公平。
3. 学生审稿与“影子审稿”盛行,问责机制缺位。 顶会审稿的另一公开秘密是“影子审稿”——教授将分配到的审稿任务交给学生或下属代为完成,却仍以自己的名义提交评审。这种做法在学界相当普遍,但显然 违背评审制度初衷 。学生代审往往缺乏经验,加之责任心主要不在自己身上,更可能导致审稿质量参差。此
4. 同行评议的可信度危机。 同行评审制度曾被视为科学研究的基石,然而近年来其可信度正面临前所未有的挑战。图灵奖得主 Geoffrey Hinton 就曾直言,顶会审稿正在扼杀真正的创新 :“如果你的论文有全新的想法,年轻的初级审稿人根本无法理解,它几乎没有机会被接受。”他批评现在很多审稿人见识不足又自以为是,对看不懂的创新工作一律判定为“胡说八道”,这无疑对学术发展非常有害 。
Hinton的担忧代表了相当一部分研究者的心声: 真正有创造性的工作常被埋没于武断的评审意见 之中,而一些平庸跟风的文章却可能因迎合了审稿人口味而蒙混过关。
5. 庞大会务与旧制度的不匹配。 更深层的矛盾在于,如今AI等热门领域投稿量爆炸式增长,而评审机制的革新却相对迟缓。ICLR 2026 收到近 19,490 篇投稿,却仅靠数千名志愿者审稿人来处理 75,800 份评审意见 。如此 供需失衡 下,评审过程几乎不可能面面俱到。
正如很多人感慨的那样:“顶会审稿已经从学术评鉴沦为体力活儿”,审稿人成了流水线上的螺丝钉,面对海量稿件有心无力。在这种情况下,质量下降、纰漏增多就成了必然。 |