找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 89|回复: 1

[综艺大观] 深度丨ICLR 开盒事件持续发酵,同行压分、勾兑行贿、本科生审稿,学术圈原来比江湖更险

[复制链接]
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-11-29 11:07 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
ICLR 2026这场突如其来的“开盒”事件中,无数作者亲眼看到了顶会审稿黑箱中的真相。

一夜之间,微信群、小红书等社交媒体上爆料横飞,到处都是“受害者”现身说法。有人震惊地发现给自己论文打出低分的竟是多年的好友。另一边,也有审稿人不再遮掩身份,直接跑到评论区回应作者质疑,在OpenReview平台上演跨平台撕逼,将本应严肃的学术讨论变成了网络骂战

更劲爆的是,一些令人瞠目结舌的内幕被逐一揭露:

CASE 1 同学,我有40个问题要考考你
有作者在社群里吐槽:自己收到了一份
长达 80 条问题的“史诗级长评”
,当场心态爆炸。同行们看完纷纷表示震惊——不仅提问数量远超合理范围,
甚至比论文的页数还多
,让人不得不怀疑这是不是审稿人直接让 AI 自动生成了一份评审模板。

1.webp


2.webp


更魔幻的是,后来陆续有作者晒出截图,发现自己也遭遇了同样的“
40+40 魂斗罗套餐
”:40 条弱点、40 条问题,排列整齐、风格一致,仿佛同一个人用复制粘贴在批量扫射投稿论文。被波及的作者们只好抱团取暖,一边自嘲“命运共同体”,一边苦笑着怀疑学术评审是不是已经被模板化、格式化到这种程度。

离谱还不止于此。事件曝光后,有人进一步扒出:
这位疑似“模板狂魔”的审稿人居然出现了光速提分的情况
——有一篇论文直接被他从低分加到满分 10 分,前后态度判若两人。如此夸张的反差操作,让人不禁怀疑学术公平是不是被这样草率的流程掏空了。

3.webp

CASE 2 我忍你很久了
除了“狂炖40问”这种离谱场面,
情绪失控的对骂
也首次登上顶会舞台。一名作者在评论区直接对审稿人爆粗口:“你有精神问题吗?!”这句话堂而皇之地挂在ICLR评审页面上,引发哗然
。尽管当事人秒删并火速道歉,但截图早已满天飞

4.webp

评论区瞬间化为修罗场,匿名评审的压力和情绪在此刻全面炸裂。学术圈吃瓜群众惊呼:原来科研大佬撕起逼来,比谁都不讲武德!

CASE 3 本是同根生,相煎何太急

更令人不安的是,这次泄密揭开了
评审“潜规则”
的冰山一角。多名不同来源的爆料显示,有的审稿人给出低分并非因为论文本身的问题,而是出于
私人恩怨
——甚至有同一课题组的“兄弟”互相压分

5.webp

CASE 4 本科生评审恶意给低分?

更离谱的流言继续在社区里狂飙。有作者根据泄露出来的审稿记录发现,
多篇论文的审稿人竟然是一名在校本科生
。而且这位“神秘评审”不仅参与了不止一篇投稿的评审,还对好几篇论文给出了
2 分、confidence=5 的“斩杀式低分”
——相当于在顶会的判决书上直接盖了个“死刑”章。

虽然听上去像都市传说,但不少老作者却一点不惊讶。在 ICLR、AAAI 这类顶会上,审稿人水准跨度极大,从大牛到本科生都可能混在同一个 reviewer 队列里。
你以为是专家在评你的论文,实际上可能是某个还在上《离散数学》的本科生给你判了生死。

6.webp


更戏剧的一幕很快出现:疑似这位审稿人试图现身“澄清”——不是他给分低,而是“刚好分到了几篇质量一般的论文”。这番解释不仅没有平息风波,反而让吃瓜群众炸裂:
这场漏洞曝光,像是把顶会审稿从多年的“黑暗森林”,一脚踹进了透明直播间。

过去深藏在匿名制度里的权力、偏见与随意性,全都被赤裸裸摆在桌面上,被成千上万的研究者围观、质疑、群嘲。

7.webp

CASE 5 Money for Rating

本次事件最魔幻的扩散,是社区里突然出现的一条爆料:
有审稿人在漏洞曝光后,竟然公然向作者索要“好处费”换评分。
8.webp

CASE 6 Reviewer Under Fire

还有一些
更令人唏嘘的是,一些审稿人也在小红书上站出来爆料,称自己在漏洞曝光后收到了
带有人身攻击、恶意谩骂甚至骚扰意味的邮件。
9.webp

CASE 7 能动手的就不动嘴
最戏剧性的传闻来自一些被低分“狙击”的作者:
NIPS 下周就要开会了,他们打算线下当面找审稿人“Battle”
匿名制度在这场漏洞事故后名存实亡,而部分作者已经从线上情绪内耗,升级为线下“正面对峙”的准备,让整个社区都在观望——今年的 NIPS,会不会从学术盛会变成现实版“作者与审稿人的修罗场”。
10.webp

更离谱的“数据分析”也随之出现。有人把泄露出来的审稿记录抓下来做了份“民间审稿报告”,结果显示:
中国审稿人占比高达 65.4%
,并由此衍生出一个“审稿人红黑榜”。
11.webp

不少作者惊讶地发现,
给出低分、confidence=5 的“断头式评分”往往来自中国审稿人。
12.webp

漏洞始末:OpenReview 权限失误引发泄密

究竟是什么原因,让这场史无前例的评审泄密事件爆发在 ICLR 2026?

根源最终指向了本次大会所依赖的 OpenReview 系统。北京时间 11 月 27 日深夜,正值 ICLR 评审最紧张的阶段,一个看似不起眼的前端 bug 却打开了通往灾难的大门。数据库权限配置出现错误,原本严格匿名的评审机制瞬间失效——从作者到审稿人、从机构到邮箱,所有应被严格保护的身份信息都暴露在 URL 的明文参数里。

泄露方式简单到令人发指。用户只需在浏览器输入一段格式固定的网址,替换论文 ID 和审稿人编号,就能立刻看到对应的审稿人实名信息。整个过程不需要任何黑客技巧,不用登录,不用绕过权限,没有脚本也能完成,只要知道论文编号,服务器就会主动把审稿人姓名、单位、邮箱以及他对你论文打了多少分、confidence 有多高,一股脑地呈现出来。

事故源头指向 OpenReview 的 profiles/search 接口。原本应当严格限制访问权限、只能由大会主席查看的审稿人信息,因为一次低级的权限校验失误,对所有用户敞开了大门。

美国东部时间 10:09,ICLR 的一位 Workflow Chair 率先向 OpenReview 团队报告异常。工程师随后紧急上线排查,大约在 11:10 完成修补,整个漏洞生命周期总共只持续约 61 分钟。然而,在社交媒体和自动化脚本横行的时代,一小时已经足以引发一场席卷整个学术圈的海啸。消息在 Twitter、小红书、Discord 以秒为单位扩散,研究者蜂拥而入系统“查户口”,有人开始截图自保,还有人直接写脚本爬取整个平台的数据。短短几小时内,谁给谁审稿、谁给了几分、confidence 是 2 还是 5,像成绩单一样在各种群聊里横飞。

当天深夜,ICLR 和 OpenReview 的紧急声明几乎同时上线。ICLR 的措辞异常强硬,明确表示任何利用泄露信息骚扰、威胁、行贿审稿人,或试图操控评审过程的行为,都将被视为严重违规,一经核实将直接 desk reject,并可能遭遇多年禁赛。OpenReview 也发布公告承认此次为严重的权限漏洞,公开致歉,并感谢社区的及时反馈。尽管两方态度严肃,但泄密已经无法逆转,全球学术界的信任危机正在全面发酵。

13.webp


更令人不安的是,这次事件的受灾范围远不止 ICLR。OpenReview 官方随后确认,所有托管在该平台上的会议均受到影响。换句话说,NeurIPS、ICML、ACL、ARR,乃至平台上的所有 Workshop 和 Challenge,都在同一时间内匿名性失效。只要替换 URL 里的会议代号和年份,任何会议的审稿人、打分、机构背景都能一览无余。这不再是一场单点事故,而是一次系统级的匿名性崩塌。整个 AI 学术圈数万名参与者的身份在一夜之间被迫透明,双盲评审瞬间从一套严格的制度变成一个无处遁形的“全面实名制”。

而在所有混乱之上,ICLR 还不得不拿出一套史无前例的“事后补救方案”。在内部激烈讨论近一天后,官方发布了新的强制处理方式,试图为这场持续扩散的风暴踩下刹车。

首先是彻底重置 Area Chair 的分配,理由是 AC 信息也在泄露中曝光,为避免潜在干扰,不得不重新洗牌。

随后,ICLR 宣布冻结所有论文的评分,审稿人自即日起不得修改分数,也不得再参与任何讨论。作者仍可回复,但讨论区已变成单向通道,AC 将根据现有材料独立做出最终决定。

最后,ICLR 关闭了 Public Comment 功能,防止有人利用公开评论区对审稿人“开盒”、挑衅或报复。与此同时,官方还表示,已开始调查可能涉及跨国法律风险的事件,包括开盒、威胁、骚扰、行贿等行为,并警告所有相关人员此事将被严肃处理。

14.webp

更耐人寻味的是,ICLR 在公告中首次承认,他们观察到漏洞曝光后审稿人评分出现异常上升,并收到了试图与审稿人勾兑的举报。换言之,社区里流传的“光速提分”“审稿人被恐吓后急忙加分”并不是空穴来风。匿名制度的坍塌让整个评审体系出现了肉眼可见的混乱,规则开始滑向无序。

回头看,这不是学术会议第一次因系统漏洞导致双盲破功。早在 2018 年,NIPS 使用的 CMT 投稿系统就曾出现过严重漏洞,审稿人只需反复切换冲突信息,就能推断论文的机构和作者。那次事故被称作“双盲评审史无前例的灾难”。但相比之下,ICLR 2026 的泄密来得更猛烈、波及范围更广、传播更迅速。短时间内,大量顶会的评审共同体被迫脱盲,匿名评审的制度基础几乎在一瞬间被打碎。

许多人第一次清晰意识到,双盲评审并不是一道坚固的防线,而是一套只要一个权限错误、一次配置疏漏就可能瞬间破灭的脆弱机制。ICLR 2026 的泄密,不仅是一场技术事故,也是一场深刻的制度危机。它揭开了学术共同体多年来讳莫如深的问题:我们以为匿名能保护公平,实际上它建立在比任何人想象得更脆弱的结构之上。

深度反思:顶会评审制度的结构性问题

ICLR 2026 泄密事件如同一面镜子,照出了顶级会议评审体系中长期存在却被忽视的结构性问题。学术圈在震惊之余,不得不集体反思:
我们引以为傲的同行评审机制究竟怎么了?

1. 审稿人选拔不透明,门槛过低。
 以往人们默认顶会审稿人应是该领域资深且中立的专家,但现实却并非如此。正如前文提到的那样,很多学生甚至本科生都混迹于审稿人名单中
。一些会议为了应对海量投稿,广撒英雄帖,甚至自动邀请投稿作者担任下一届审稿人。

著名物理学家 Lenka Zdeborová 教授曾质疑:“如果大量同行评审其实由本科生完成,我们为何还要费心进行同行评议?!”
她在推文中指出自己在筛选研究生申请时,发现许多申请人已拥有顶会审稿经历。这一吐槽得到众多学界大佬共鸣:
一群资历浅薄的人在评判前沿研究,学术审稿何谈专业性?


2. 审稿意见质量堪忧,缺乏有效监督。
 当前顶会评审存在一个悖论:一方面,评论是匿名的、无后果的;另一方面,审稿任务繁重、回报微薄。在这种情况下,有些审稿人投入不足甚至敷衍塞责也就不足为奇了。


低质量评审意见
屡见不鲜,空洞无物的官话套话、一眼就能看出是模板拼凑的流水账,甚至张冠李戴、评错论文的乌龙,作者却只能哑巴吃黄连。

更过分的是
恶意评审和利益冲突
。此次泄密揭露出的压分“黑手”和审稿人串通案例,令人不寒而栗。就在去年ICLR 2024大会上,官方还曾通报查实了多起审稿人与作者串通作弊的行为:一些审稿人通过操纵 bidding 系统与特定论文匹配,给出不应有的高分;甚至有个别领域主席利用职权指派自己“熟人”审稿人,
以人情关系抬升论文得分。

ICLR 2024组委会承认这些行为
直接违反学术道德
,已交由道德委员会审查并评估处罚
。可见,
审稿过程缺乏外部监督和问责
,在匿名掩护下,少数人铤而走险牟取私利,破坏了学术公平。

3. 学生审稿与“影子审稿”盛行,问责机制缺位。
 顶会审稿的另一公开秘密是“影子审稿”——教授将分配到的审稿任务交给学生或下属代为完成,却仍以自己的名义提交评审。这种做法在学界相当普遍,但显然
违背评审制度初衷
。学生代审往往缺乏经验,加之责任心主要不在自己身上,更可能导致审稿质量参差。此

4. 同行评议的可信度危机。
 同行评审制度曾被视为科学研究的基石,然而近年来其可信度正面临前所未有的挑战。图灵奖得主 Geoffrey Hinton 就曾直言,顶会审稿正在扼杀真正的创新
:“如果你的论文有全新的想法,年轻的初级审稿人根本无法理解,它几乎没有机会被接受。”他批评现在很多审稿人见识不足又自以为是,对看不懂的创新工作一律判定为“胡说八道”,这无疑对学术发展非常有害

Hinton的担忧代表了相当一部分研究者的心声:
真正有创造性的工作常被埋没于武断的评审意见
之中,而一些平庸跟风的文章却可能因迎合了审稿人口味而蒙混过关。

5. 庞大会务与旧制度的不匹配。
 更深层的矛盾在于,如今AI等热门领域投稿量爆炸式增长,而评审机制的革新却相对迟缓。ICLR 2026 收到近 19,490 篇投稿,却仅靠数千名志愿者审稿人来处理 75,800 份评审意见
。如此
供需失衡
下,评审过程几乎不可能面面俱到。

正如很多人感慨的那样:“顶会审稿已经从学术评鉴沦为体力活儿”,审稿人成了流水线上的螺丝钉,面对海量稿件有心无力。在这种情况下,质量下降、纰漏增多就成了必然。
  • 打卡等级:已臻大成
  • 打卡总天数:411
发表于 2025-11-29 11:36 | 显示全部楼层
实名制并没有完全不好,自己写的文章被谁评分,打了多少分,评语如何,都应该全面向社会公开。必要时可以引入陪审团制度,随机抽几个无关的评委对之前的评定打分。双盲制度对文章的作者并不公平,谁知道审核文章的电脑那一头,是认真负责的专家,抑或是一条狗呢?
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图

GMT+8, 2025-11-30 11:27 , Processed in 0.130788 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表