발표자 | 김누리 |
---|---|
발표일자 | 2021-10-05 |
저자 | Carlini, Nicholas, Ulfar Erlingsson, and Nicolas Papernot |
학회명 | arXiv preprint arXiv:1910.13427 (2019). |
논문지 |
We develop techniques to quantify the degree to which a given (training or testing) example is an outlier in the underlying distribution. We evaluate five methods to score examples in a dataset by how well-represented the examples are, for different plausible definitions of "well-represented", and apply these to four common datasets: MNIST, Fashion-MNIST, CIFAR-10, and ImageNet. Despite being independent approaches, we find all five are highly correlated, suggesting that the notion of being well-represented can be quantified. Among other uses, we find these methods can be combined to identify (a) prototypical examples (that match human expectations); (b) memorized training examples; and, (c) uncommon submodes of the dataset. Further, we show how we can utilize our metrics to determine an improved ordering for curriculum learning, and impact adversarial robustness. We release all metric values on training and test sets we studied.
댓글 5
-
강석규
2021.10.05 18:43
examplar forgettable 논문과 비슷한 경향성을 보이는 MNIST와 다른 경향성을 띄는 Fashion-MNIST, CIFAR-10를 보면서 흥미로웠습니다. representative로만 학습하느냐 outlier로 학습하느냐에 대한 고민을 할 수 있어서 좋았습니다. 다만 압도적인 성능향상이나 효율적인 학습을 위한 명쾌한 해석이나 답을 주길 기대했는데.. 마땅한 결론을 내지 못한 점이 아쉽네요. 누군가가 해결해 주기를 바랐는데.. 너무 dataset에 맞춰서 학습하는건가 싶기도하고, 한동안 생각하지 않고 있었던 주제를 다시금 고민하게 만드는 논문이었습니다. -
이지형
2021.10.05 18:43
어느 sample이 학습에 중요한가를 이해하기 위한 내용으로, 결론 자체는 어느 정도 예상하는 것과 일치함. 이것을 확인하기 위한 실험을 설계하고 해석을 하였음. 흥미로운 논문임. -
노순철
2021.10.05 19:05
sample 단위에서 outlier를 판단할 수 있는 지표를 5가지 metric으로 제시하는 논문이었습니다. 제시된 지표를 활용하여 ood detection Task나 Noisy Label Learning Task를 수행할수도 있지 않을까 하는 생각이 들었습니다. 좋은 발표 감사합니다. -
김사무엘
2021.10.05 19:25
제안한 5가지 metric이 모두 어떠한 model에 의존적인데, 모델에 의존하지 않고 좀 더 근본적으로 representative, outlier를 구분하는 metric도 고안해볼만 하지 않을까? 생각이 듭니다. -
양희윤
2021.10.05 20:03
데이터에 대한 분석을 통해서 well represented와 outlier를 나누고, 이것이 학습이 어떤 영향을 미치는 지 확인할 수 있었던 흥미로운 논문이었던 것 같습니다. 좋은 발표 감사합니다.
2022

AUM: Identifying Mislabeled Data using the Area Under the Margin Ranking
2022.01.16
발표자: 강석규
발표일자: 2022-01-18
저자: Geoff Pleiss, Tianyi Zhang, Ethan R. Elenberg, Kilian Q. Weinberger
학회명: NIPS2022

Collaborative Unsupervised Visual Representation Learning from Decentralized Data
2022.01.18
발표자: 강용훈
발표일자: 2022-01-18
저자: Weiming Zhuang, Xin Gan , Yonggang Wen , Shuai Zhang , Shuai Yi
학회명: ICCV 2021

Can We Gain More from Orthogonality Regularizations in Training Deep CNNs?
2022.01.18
발표자: 안재한
발표일자: 2022-01-18
저자: Nitin Bansal, Xiaohan Chen, Zhangyang Wang
학회명: NeurIPS 2018

Federated Semi-supervised Learning with Inter-client Consistency & Disjoint Learning
2022.01.10
발표자: 홍만수
발표일자: 2022-01-11
저자: Wonyong Jeong, Jaehong Yoon, Eunho Yang, Sung Ju Hwang
학회명: ICLR 2021

CutPaste: Self-Supervised Learning for Anomaly Detection and Localization
2022.01.11
발표자: 박은미
발표일자: 2022-01-11
저자: Chun-Liang Li
논문지: CVPR2021

MUTUAL INFORMATION STATE INTRINSIC CONTROL
2022.01.11
발표자: 길창배
발표일자: 2022-01-11
저자: Rui Zhao, Yang Gao, Pieter Abbeel, Volker Tresp, Wei Xu
학회명: ICLR 2021

Asynchronous Methods for Deep Reinforcement Learning (A3C)
2022.01.11
발표자: 채경훈
발표일자: 2022-01-11
저자: Volodymyr Mnih, Adrià Puigdomènech Badia, Mehdi Mirza, Alex Graves, Tim Harley, Timothy P. Lillicrap, David Silver, Koray Kavukcuoglu
학회명: ICML-2016
2021

Directional Graph Networks
2021.12.28
발표자: 신재민
발표일자: 2022-01-04
저자: Dominique Beaini, Saro Passaro
학회명: ICML 2021

Anomaly detection in multidimensional time series - a graph-based approach
2021.12.28
발표자: 신효정
발표일자: 2022-01-04
저자: Marcus Erz, Jeremy Floyd Kielman, Bahar Selvi Uzun and Gabriele Stefanie Gühring
논문지: Journal of Physics: Complexity 2021

GETAM: Gradient-weighted Element-wise Transformer Attention Map for Weakly-supervised Semantic segmentation
2022.01.04
발표자: 윤수현
발표일자: 2022-01-04
저자: Weixuan Sun, Jing Zhang, Zheyuan Liu, Yiran Zhong, Nick Barnes
학회명: arXiv 2021

SimCSE: Simple Contrastive Learning of Sentence Embeddings
2021.12.20
발표자: 김호승
발표일자: 2021-12-21
저자: Tianyu Gao, Xingcheng Yao, Danqi Chen
학회명: EMNLP2021

Revisiting Skeleton-based Action Recognition
2021.12.21
발표자: 배현재
발표일자: 2021-12-21
저자: Haodong Duan, Yue Zhao, Kai Chen, Dian Shao, Dahua Lin, Bo Dai
학회명: CVPR 2021

On the Transferability of Adversarial Attacks against Neural Text Classifier
2021.12.21
발표자: 나철원
발표일자: 2021-12-21
저자: Liping Yuan et al.
학회명: EMNLP 2021

A2-FPN: Attention Aggregation based Feature Pyramid Network for Instance Segmentation
2021.12.21
발표자: 임지영
발표일자: 2021-12-21
저자: Miao Hu
학회명: CVPR 2021

Unsupervised Out-of-Distribution Detection by Maximum Classifier Discrepancy(cover)
2021.12.15
발표자: 노순철
발표일자: 2021-12-15
저자: Qing Yu, Kiyoharu Aizawa
학회명: ICCV 2019

CMT: Convolutional Neural Networks Meet Vision Transformers
2021.12.15
발표자: 김유성
발표일자: 2021-12-15
저자: Jianyuan Guo, et al.
논문지: arXiv

Proximal Policy Optimization Algorithms
2021.12.15
발표자: 길창배
발표일자: 2021-12-15
저자: John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov
논문지: arxiv 2017

Understanding Dimensional Collapse In Contrastive Self-Supervised Learning
2021.11.30
발표자: 이진섭
발표일자: 2021-11-30
저자: Li Jing , Pascal Vincent, Yann LeCun, Yuandong Tian
학회명: ICLR 2022

Adversarial Robustness Across Representation Spaces
2021.11.30
발표자: 조영성
발표일자: 2021-11-30
저자: Pranjal Awasthi, George Yu, Chun-Sung Ferng, Andrew Tomkins, Da-Cheng Juan
학회명: CVPR 2021

Generating Adversarial Computer Programs using Optimized Obfuscations
2021.11.30
발표자: 김사무엘
발표일자: 2021-11-30
저자: Shashank Srikant, Sijia Liu, Tamara Mitrovska, Shiyu Chang, Quanfu Fan, Gaoyuan Zhang, Una-May O’Reilly
학회명: ICLR 2021