발표자 | 김누리 |
---|---|
발표일자 | 2021-10-05 |
저자 | Carlini, Nicholas, Ulfar Erlingsson, and Nicolas Papernot |
학회명 | arXiv preprint arXiv:1910.13427 (2019). |
논문지 |
We develop techniques to quantify the degree to which a given (training or testing) example is an outlier in the underlying distribution. We evaluate five methods to score examples in a dataset by how well-represented the examples are, for different plausible definitions of "well-represented", and apply these to four common datasets: MNIST, Fashion-MNIST, CIFAR-10, and ImageNet. Despite being independent approaches, we find all five are highly correlated, suggesting that the notion of being well-represented can be quantified. Among other uses, we find these methods can be combined to identify (a) prototypical examples (that match human expectations); (b) memorized training examples; and, (c) uncommon submodes of the dataset. Further, we show how we can utilize our metrics to determine an improved ordering for curriculum learning, and impact adversarial robustness. We release all metric values on training and test sets we studied.
댓글 5
-
강석규
2021.10.05 18:43
examplar forgettable 논문과 비슷한 경향성을 보이는 MNIST와 다른 경향성을 띄는 Fashion-MNIST, CIFAR-10를 보면서 흥미로웠습니다. representative로만 학습하느냐 outlier로 학습하느냐에 대한 고민을 할 수 있어서 좋았습니다. 다만 압도적인 성능향상이나 효율적인 학습을 위한 명쾌한 해석이나 답을 주길 기대했는데.. 마땅한 결론을 내지 못한 점이 아쉽네요. 누군가가 해결해 주기를 바랐는데.. 너무 dataset에 맞춰서 학습하는건가 싶기도하고, 한동안 생각하지 않고 있었던 주제를 다시금 고민하게 만드는 논문이었습니다. -
이지형
2021.10.05 18:43
어느 sample이 학습에 중요한가를 이해하기 위한 내용으로, 결론 자체는 어느 정도 예상하는 것과 일치함. 이것을 확인하기 위한 실험을 설계하고 해석을 하였음. 흥미로운 논문임. -
노순철
2021.10.05 19:05
sample 단위에서 outlier를 판단할 수 있는 지표를 5가지 metric으로 제시하는 논문이었습니다. 제시된 지표를 활용하여 ood detection Task나 Noisy Label Learning Task를 수행할수도 있지 않을까 하는 생각이 들었습니다. 좋은 발표 감사합니다. -
김사무엘
2021.10.05 19:25
제안한 5가지 metric이 모두 어떠한 model에 의존적인데, 모델에 의존하지 않고 좀 더 근본적으로 representative, outlier를 구분하는 metric도 고안해볼만 하지 않을까? 생각이 듭니다. -
양희윤
2021.10.05 20:03
데이터에 대한 분석을 통해서 well represented와 outlier를 나누고, 이것이 학습이 어떤 영향을 미치는 지 확인할 수 있었던 흥미로운 논문이었던 것 같습니다. 좋은 발표 감사합니다.
2022
Input Complexity and Out-of-distribution Detection with Likelihood-based Generative Models
2022.03.04
발표자: 노순철
발표일자: 2022-03-04

FedBABU: Toward Enhanced Representation for Federated Image Classification
2022.03.04
발표자: 홍만수
발표일자: 2022-03-04
저자: Jaehoon Oh, Sangmook Kim, Se-Young Yun
학회명: ICLR 2022

Online Knowledge Distillation for Efficient Pose Estimation
2022.03.03
발표자: 배현재
발표일자: 2022-03-04
저자: Zheng Li¹ , Jingwen Ye², Mingli Song², Ying Huang1, Zhigeng Pan1
학회명: ICCV 2021

Channelized Axial Attention – Considering Channel Relation within Spatial Attention for Semantic Segmentation
2022.03.04
발표자: 윤수현
발표일자: 2022-03-04
저자: Ye Huang, Di Kang, Wenjing Jin, *Xiangjian He, Liu Liu
학회명: AAAI 2022

GPipe: Easy Scaling with Micro-Batch Pipeline Parallelism
2022.02.22
발표자: 조영성
발표일자: 2022-02-22
저자: Yanping Huang, Youlong Cheng, Ankur Bapna, Orhan Firat, Mia Xu Chen, Dehao Chen, HyoukJoong Lee, Jiquan Ngiam, Quoc V. Le, Yonghui Wu, Zhifeng Chen
논문지: https://arxiv.org/abs/1811.06965
Boosting the Performance of Semi-Supervised Learning with Unsupervised Clustering
2022.02.22
발표자: 김누리
발표일자: 2022-02-22
저자: Lerner, Boaz, Guy Shiran, and Daphna Weinshall
학회명: arXiv preprint arXiv:2012.00504 (2020)

Deep Learning for Symbolic Mathematics
2022.02.22
발표자: 고설준
발표일자: 2022-02-22
저자: Guillaume Lample, François Charton
학회명: ICLR2020

Semi-Supervised Learning of Visual Features by Non-Parametrically Predicting View Assignments with Support Samples
2022.02.22
발표자: 김유성
발표일자: 2022-02-22
저자: Mahmoud Assran et al.
학회명: ICCV 2021

Universal Domain Adaptation through Self-Supervision
2022.02.22
발표자: 이진섭
발표일자: 2022-02-22
저자: Kuniaki Saito , Donghyun Kim, Stan Sclaroff, Kate Saenko
학회명: NIPS 2020

Contrastive Code Representation Learning
2022.02.15
발표자: 최윤석
발표일자: 2022-02-15
저자: Paras Jain, Ajay Jain, Tianjun Zhang, Pieter Abbeel, Joseph E. Gonzalez, Ion Stoica
학회명: EMNLP 2021

Do transformers really perform bad for graph representation?
2022.02.15
발표자: 김가형
발표일자: 2022-02-15
저자: Chengxuan Ying, Tianle Cai, Shengjie Luo, Shuxin Zheng, Guolin Ke, Di He, Yanming Shen, Tie-Yan Liu
학회명: NeurIPS 2021

Dual Attention Transfer in Session-based Recommendation with Multi-dimensional Integration
2022.02.15
발표자: 양희윤
발표일자: 2022-02-15
저자: Chen Chen, Jie Guo, Bin Song
학회명: ACM SIGIR 2021

Collaborative Unsupervised Visual Representation Learning from Decentralized Data
2022.01.18
발표자: 강용훈
발표일자: 2022-01-18
저자: Weiming Zhuang, Xin Gan , Yonggang Wen , Shuai Zhang , Shuai Yi
학회명: ICCV 2021

Can We Gain More from Orthogonality Regularizations in Training Deep CNNs?
2022.01.18
발표자: 안재한
발표일자: 2022-01-18
저자: Nitin Bansal, Xiaohan Chen, Zhangyang Wang
학회명: NeurIPS 2018

AUM: Identifying Mislabeled Data using the Area Under the Margin Ranking
2022.01.16
발표자: 강석규
발표일자: 2022-01-18
저자: Geoff Pleiss, Tianyi Zhang, Ethan R. Elenberg, Kilian Q. Weinberger
학회명: NIPS2022

MUTUAL INFORMATION STATE INTRINSIC CONTROL
2022.01.11
발표자: 길창배
발표일자: 2022-01-11
저자: Rui Zhao, Yang Gao, Pieter Abbeel, Volker Tresp, Wei Xu
학회명: ICLR 2021

Asynchronous Methods for Deep Reinforcement Learning (A3C)
2022.01.11
발표자: 채경훈
발표일자: 2022-01-11
저자: Volodymyr Mnih, Adrià Puigdomènech Badia, Mehdi Mirza, Alex Graves, Tim Harley, Timothy P. Lillicrap, David Silver, Koray Kavukcuoglu
학회명: ICML-2016

Federated Semi-supervised Learning with Inter-client Consistency & Disjoint Learning
2022.01.10
발표자: 홍만수
발표일자: 2022-01-11
저자: Wonyong Jeong, Jaehong Yoon, Eunho Yang, Sung Ju Hwang
학회명: ICLR 2021

CutPaste: Self-Supervised Learning for Anomaly Detection and Localization
2022.01.11
발표자: 박은미
발표일자: 2022-01-11
저자: Chun-Liang Li
논문지: CVPR2021
2021

Anomaly detection in multidimensional time series - a graph-based approach
2021.12.28
발표자: 신효정
발표일자: 2022-01-04
저자: Marcus Erz, Jeremy Floyd Kielman, Bahar Selvi Uzun and Gabriele Stefanie Gühring
논문지: Journal of Physics: Complexity 2021