발표자 | 길창배 |
---|---|
발표일자 | 2022-01-11 |
저자 | Rui Zhao, Yang Gao, Pieter Abbeel, Volker Tresp, Wei Xu |
학회명 | ICLR 2021 |
논문지 |
2022
Rep VGG: Making VGG-style ConvNet Again
2022.07.14
발표자: 장성인
발표일자: 2022-07-13
저자: Xiaohan Ding
학회명: CVPR

Perturbed and Strict Mean Teachers for Semi-supervised Semantic Segmentation
2022.07.13
발표자: 윤수현
발표일자: 2022-07-13
저자: Yuyuan Liu, Yu Tian, Yuanhong Chen, Fengbei Liu, Vasileios Belagiannis, Gustavo Carneiro
학회명: CVPR 2022

CodeT5: Identifier-aware Unified Pre-trained Encoder-Decoder Models for Code Understanding and Generation
2022.07.13
발표자: 나철원
발표일자: 2022-07-13
저자: Yue Wang, Weishi Wang, Shafiq Joty, and Steven C.H. Hoi
학회명: EMNLP 2021
On the Evaluation of Neural Code Summarization
2022.06.29
발표자: 최윤석
발표일자: 2022-06-29
저자: Ensheng Shi; Yanlin Wang; Lun Du; Junjie Chen; Shi Han; Hongyu Zhang; Dongmei Zhang; Hongbin Sun
학회명: ICSE 2022
Consistent Explanations by Contrastive Learning
2022.06.29
발표자: 김누리
발표일자: 2022-06-29
저자: Pillai, Vipin, et al.
학회명: CVPR 2022

Large Loss Matters in Weakly Supervised Multi-Label Classification
2022.06.29
발표자: 송경렬
발표일자: 2022-06-29
저자: Youngwook Kim1* , Jae Myung Kim2*, Zeynep Akata2,3,4, Jungwoo Lee1,5
학회명: CVPR 2022

Improved Transformer for High-Resolution GANs
2022.06.22
발표자: 신재민
발표일자: 2022-06-22
저자: Long Zhao
학회명: NeurIPS 2021

Memorizing Normality to Detect Anomaly: Memory-augmented Deep Autoencoder for Unsupervised Anomaly Detection
2022.06.22
발표자: 지혜림
발표일자: 2022-06-22
저자: Dong Gong1 , Lingqiao Liu1 , Vuong Le2 , Budhaditya Saha2 , Moussa Reda Mansour3 , Svetha Venkatesh2 , Anton van den Hengel
학회명: ICCV 2019

Noisy Boundaries: Lemon or Lemonade for Semi-supervised Instance Segmentation?
2022.06.22
발표자: 임지영
발표일자: 2022-06-22
학회명: CVPR 2022

Contrast Learning Visual Attention for Multi Label Classification
2022.06.15
발표자: 이진섭
발표일자: 2022-06-15
저자: Son D.Dao, Ethan Zhao, Dinh Phung, Jianfei Cai
학회명: Arxiv.

C2L: Causally Contrastive Learning for Robust Text Classification
2022.06.15
발표자: 김효준
발표일자: 2022-06-15
저자: Seungtaek Choi, Myeongho Jeong, Hojae Han, Seung won Hwang
학회명: AAAI 2022

Effectively Leveraging Attributes for Visual Similarity
2022.06.14
발표자: 박은미
발표일자: 2022-06-14
저자: Samarth Mishra, Zhongping Zhang, Yuan Shen, Ranjitha Kumar, Venkatesh Saligrama, Bryan Plummer
학회명: ICCV2021

CORE: Simple and Effective Session-based Recommendation within Consistent Representation Space
2022.06.14
발표자: 양희윤
발표일자: 2022-06-14
저자: Yupeng Hou, Binbin Hu, Zhipiang Zhang, Wayne Xin Zhao
학회명: SIGIR 2022

FedPara: Low-rank Hadamard Product for Communication-Efficient Federated Learning
2022.06.09
발표자: 강용훈
발표일자: 2022-06-10
저자: Nam Hyeon-Woo, Moon Ye-Bin, Tae-Hyun Oh
학회명: ICLR 2022

Do Vision Transformers See Like Convolutional Neural Networks?
2022.06.10
발표자: 안재한
발표일자: 2022-06-10
저자: Maithra Raghu, Thomas Unterthiner, Simon Kornblith, Chiyuan Zhang, Alexey Dosovitskiy
학회명: NeurIPS2021

Large Language Models are Zero-Shot Reasoners
2022.06.10
발표자: 홍만수
발표일자: 2022-06-10
저자: Takeshi Kojima, Shixiang Shane Gu, Machel Reid, Yutaka Matsuo, Yusuke Iwasawa
When Chosen Wisely, More Data Is What You Need: A Universal Sample-Efficient Strategy For Data Augmentation
2022.05.09
발표자: 김호승
발표일자: 2022-05-09
학회명: ACL2022
Likelihood Ratios for Out-of-Distribution Detection
2022.05.09
발표자: 노순철
발표일자: 2022-05-09
저자: Jie Ren, et al.
학회명: NeurIPS 2019

Weakly Supervised Semantic Segmentation by Pixel-to-Prototype Contrast
2022.05.09
발표자: 윤수현
발표일자: 2022-05-09
저자: Ye Du, Zehua Fu, Qingjie Liu*, Yunhong Wang
학회명: CVPR 2022

Topological Attention for Time Series Forecasting
2022.05.09
발표자: 신효정
발표일자: 2022-05-09
저자: Sebastian Zeng, Florian Graf, Christoph Hofer, Roland Kwitt
학회명: NeurIPS 2021
기계 팔 같은 경우에 pass fail 로 이루어져, 보상이 희박하여 한번의 성공까지 오래 걸리기 때문에 exploration 이 중요한 태스크로 보이는데, 이를 해결하기 위한 방법으로 이해했습니다.
실험 결과로 3d 시뮬레이션을 하는 강화학습 Gym 환경을 통해 실험 결과를 도출 하였고 이에 대표적인 좋은 성능의 알고리즘인 SAC , DDPG, PER 등과 instrinsic reward 를 결합하여 탐험 장려를 통해 좋은 convergence 를 주는 것으로 보았습니다.
다만, Intrinsic reward 를 설정하는 부분이 주변 환경과 정책의 변수와의 조합을 통해 계산이 되었는데 정확히 어떤 의미로 어느 상황에서 커지고 어느 상황에서 작아지는지 또, 학습이 어떤 의미를 갖는지 그 부분에 대한 이해는 잘 되지 않았습니다.
알고리즘을 몇 가지 사용 하였지만 기계팔 시뮬레이션 외에 일반적인 강화학습 Gym 인 Atari game 이나 Pybullet 과 같은 태스크에도 범용적으로 적용 할 수 있는 기법인지 궁금했습니다.
발표 감사합니다.