Bendi新闻
>
ICLR 2024得分888居然被拒?Area Chair的Meta review完全事实性错误?

ICLR 2024得分888居然被拒?Area Chair的Meta review完全事实性错误?

11月前

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【CV技术和求职】交流群

前两天ICLR 2024开奖,有些论文争议还是比较大的,特别是高分被拒的工作。Amusi 就发现了知乎上有位同学的发帖回答,居然是888超高分被拒,看起来相当震惊且离谱。下面看看具体介绍:

作者:虚无@知乎
https://www.zhihu.com/question/639592374/answer/3365302419

ICLR24得分888居然被拒?Area Chair的Meta review完全事实性错误?

TL;DR: AC把我们方法的超参数N=1理解为了攻击次数为1,于是认为我们评测不充分,并引用了autoattack这一大家认为充分的攻击。然而,我们全文(除了特殊的adaptive attack外),全部是使用的AC所引用的autoattack。这样的meta review是不是一种笑话?

文章链接:Robust Classification via a Single Diffusion Model
文章的blog链接:虚无:扩散模型即为鲁棒分类器:Robust Classification via a Single Diffusion Model

888据我所知似乎是iclr历史上被拒稿的最高分了。

我先简单介绍一下这篇论文:我们提出了一种新的分类算法,直接使用diffusion这种生成模型(无需CNN ViT等分类模型)来做鲁棒分类。在对抗攻防的领域下,新的防御算法一旦提出,需要进行各种adaptive attack来进行充分评测,从而确保鲁棒性并不是因为评测不充分造成的。因此,我们也进行了大量的adaptive attacks。同时,攻击步数越多,攻击通常来说就越强。我们使用了大家默认的评测方式AutoAttack(最少100步攻击)进行评测。我们得到了3个审稿人的一致好评,得分888.

AC的意见

Area Chair的核心论点是:one-step attack足以充分评测防御。只有AutoPGD这种multi-step attack才能充分评测防御。

然而,我们全文从未使用过one-step attack。我们全文(除了攻击diffpure的adaptive attack外),全部使用的是Area Chair引用的"AutoPGD"。

这样完全的事实性错误也太搞笑了。我们用的方法就是AC所cite的方法。AC却认为我们用的是one-step attack。AC为什么会这么认为呢?我猜是因为AC把我们方法中的超参数N的 (N=1)直接误认为了是攻击次数为1。把N=5误认为了攻击次数是5次。

AC很可能根本就没有仔细阅读论文,就随意的把“N=1”理解为攻击次数为1。one-step attack显然不是充分的评测。但是给出Meta review之前,是否可以多花一点时间想一想,在整篇文章做了这么多adaptive attack的情况下,难道作者所有攻击要么5步要么1步么?作者有意识做adaptive attack,难道还不知道“one-step attack不充分”么.....三个审稿人给分888,如果真是“作者的攻击次数是1”,难道他们三个看不出来么。。。


下面我来回答一下Meta review的两个comments。

Comments 1: 理论分析部分和实际claim没有联系。并且不知道optimal diffusion classifier是怎么评测的。

我们在本篇文章中提出一个新的理论分析工具,即Diffusion Model和Diffusion Classifier的最优解。因此,我们只需要检验optimal下是否还有类似的问题。如果有,那我们应该改进模型;如果没有,那我们应该去查看empirical solution和optimal solution的区别,从而更好的改进我们的算法。我们发现对于对抗样本,主要区别在于empirical solution的diffusion loss相比optimal solution更小。这有且仅有2个原因。1) empirical情况下likelihood更小 2) ELBO和log likelihood差距大,从而导致diffusion classifier (theorem 1)近似误差过大。为了解决这两个问题,我们提出likelihood maximization,去maximize elbo,同时增大likelihood,减小elbo和likelihood的误差。

至于optimal diffusion classifier的评测,我们在实验部分写的很清楚,除特殊声明和LM这种不可导的外,都是以"AutoAttack"进行评测的,即Area Chair引用的那个评测。我们使用AutoAttack,梯度又是准确的,同时几乎没有随机性,我们有理由相信评测是充分的。

Comments 2: 方法的高时间复杂度让作者无法用SOTA的白盒攻击来评测。作者只进行了one-step gradient attack,而这显然是不充分的。

经过其中一个审稿人的建议,我们已经测了real time cost。对于每张图片,之前的防御DiffPure需要0.60秒(linf)或0.72秒(l2)。而我们最终的方法需要1.43秒。时间复杂度高是我们的limitations,但不影响我们的评测。

最重要的是,"one-step gradient attack"当然是不充分的。但我们也当然知道这是不充分的,我们从头到尾就没用过one-step gradient attack。我们全用的是Area Chair所引用的"AutoAttack"。

--- 我是分割线 --- 

Amusi发现评论区中不少同学反馈这篇工作被拒太离谱了,而且像去年爆火的Mamba工作仍在ICLR 2024 pending中。。。虽然是金子,总会发光,但被拒的原因过于离谱,也只会给作者和审稿人泼恶意的冷水。

点击进入—>【CV技术和求职】交流群

计算机视觉技术交流群成立

扫描下方二维码,或者添加微信:CVer444,即可添加CVer小助手微信,便可申请加入CVer-计算机视觉微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer444,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集近万人!


扫码加入星球学习


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

来源:CVer

相关新闻

​ICLR2024得分888居然被拒?Area Chair的Meta review完全事实性错误?原创文学的原创性在哪里?| 2024第七届宝珀理想国文学奖启动吊打同类产品的夏凉被,价格居然这么低?!申根签证被拒的常见原因有哪些呢?看来我们40多年不战的记录,2024年要被打破了?部分地区递交的TN签证申请,竟更容易被拒?!申请英国旅游签导致十年自动拒签?案例解析:如何避开被拒签的那些“坑”!“历史之外”的海洋空间,如何被媒介技术性地建构?比618的价格居然还低一半?润百颜被我逼疯了!在罗马机场口渴却买不到一瓶水,购物被拒全因她手握这个国家的护照?!迈出历史性一步?欧盟同意扣留被冻结俄资产的利润,用于援助乌克兰17岁体育生左膝长骨瘤被错切右膝!后续来了……医生应如何规避常识性错误?ICLR接收结果出炉!有人提出异议:论文稍微超过9页,就被拒了??2024年的上海,至真园的生意都是被谁抢走的?|商业Friday被海信反超,小米电视的性价比模式失灵?|焦点分析ACL 2024 Oral | 大模型也会被忽悠?揭秘AI的信念之旅渡十娘|“女兒被性侵,母親該怎麼做?”身故後的諾獎得主門羅遭受靈魂拷問被11所美国名校连拒的高考状元,如今怎么样了?被女博士举报性骚扰的人大教授哪来的自信?涉“大规模杀伤性武器扩散”?中国博士生澳洲学签被拒已上诉2024年,最被看好的个人海外投资市场在哪里?无语!美国特斯拉充电站的充电线,居然被偷了!......下一个是井盖吗?ED被拒后,我如何用30天拿到全美TOP20的offer?被写入 2024 政府工作报告的“低空经济”,到底是个什么样的机会?
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。