본문 바로가기

📑Document/Test-Time Adaptation4

PR-3 / RoTTA : Robust Continual Test-time Adaptation Introduction DA와 DG는 distribution shift 문제를 해결하기 위해 제안되었으나, raw source data에 대한 접근이 필요함 하지만 대부분의 현실 시나리오는 데이터 보호 규정으로 인해 원시 데이터를 공개적으로 사용할 수 없어야함 또한, 기존 방법들은 Backward 계산량이 많아 학습 비용이 감당할 수 없을 만큼 높아짐 TTA는 레이블이 지정되지 않은 테스트 데이터 스트림만 사용하여 테스트 시간에 온라인으로 distribution shift 문제를 해결하고자 함 명백히 말해서 TTA는 Visual Recognition, Multi-modality, Document understanding 등 다양한 분야에서 주목받음 Prior TTA 연구 대부분은 테스트 샘플이 고정된 T.. 2024. 2. 8.
[TRIBE] Ablation study : TTA 모델 성능 관련 Effect of Indivisual Components 단독으로 쓰였을 경우 Balanced BN이 Robust BN보다 성능이 좋게 나옴 ROTTA - Robust BN only : 43.48 / 32.29 ROTTA - Balanced BN only : 29.00 / 26.38 two branch Self-training (teacher & student net)을 적용하면 기존 baseline보다 좋은 성능을 보여줌? ROTTA - BN with Self-Training : 37.67 / 38.94 ROTTA - Balanced BN with Self-Training : 36.58 / 65.88 Computation Cost Measured in Wall-Clock Time 2024. 2. 1.
PR-2 / CoTTA : Continual Test-Time Domain Adaptation Abstract Test-time domain adaptation은 소스 데이터를 사용하지 않고 사전 학습된 소스 모델을 대상 도메인에 적응시키는 것을 목표로 한다. 기존 연구에서는 주로 대상 도메인이 정적인(static) 경우를 주로 고려했습니다. 그러나 현실 세계의 기계 인식 시스템은 대상 도메인 분포가 시간에 따라 변할 수 있는 비정상적이고 지속적으로 변화하는 환경에서 돌아갑니다. 자가 학습 및 엔트로피 정규화를 기반으로 하는 대부분의 기존 방법은 이러한 비정상 환경으로 인해 어려움을 겪을 수 있습니다. 대상 도메인에서 시간에 따른 Distribution shift로 인해 pseudo-labels을 사용할 수 없게되었다. Noisy pseudo-labels가 생기면 오히려 Error accumula.. 2024. 1. 29.
PR-1 / TENT : Fully test-time adaptation with Entropy Minimization Introduction 딥 네트워크는 동일한 분포를 테스트 데이터가 들어올 때 높은 정확도를 보인다. 하지만 기존 데이터와는 다른 새로운 데이터에 대한 일반화 성능은 어느 정도 한계가 있다. 훈련 데이터(Source)와 테스트 데이터(Target)이 많이 다를 수록 그 정확도가 낮아지는데, 이러한 가정 상황을 두고 _Domain Shift / Dataset Shift_라고 합니다. 여기서는 이러한 Shift를 _natural variations or corruptions_라고도 부른다. 테스트 단계에서 적응을 위해 저자는 모델 예측 값에 대한 엔트로피를 최소화하기로 했다. 이때 이 엔트로피에 대한 목적을 Test entropy라고 하고, 여기에 적용된 방법론을 tent라고 한다. 그리고 에러와 Shift.. 2024. 1. 29.