학습 시 사용했다는 의미이다. 제안 방법으로 50% 데이터 필터링 (High UC) 시 (즉, 모델이 잘 모르는 데이터를 반지도 학습에 사용) 정확도는 72.39% mAP로 전체 데이터를 다 사용한 경우 (72.27%
mAP)보다 데이터를 적게 사용했음에도 불구하고 0.12 percent points 정확도가 높다. 반대로 낮은 uncertainty를 갖는 unlabeled 데이터를 학습에 사용한 경우 (Low UC) 71.79% mAP로 정확도가 하락한다.
Random sampling으로 50% 데이터 필터링 시 71.83% mAP로 Low UC보다 정확도가 높다. 이러한 결과를 통해, 제안한 informativeness score는 모델이 잘 모르는 데이터와 잘 알고 있는 데이터를 판단할 수 있으며, 이를 기반으로한 unlabeled 데이터 필터링은 기존보다 적은 학습 데이터로 정확도를 향상시킨다.
그림 5.7은 제안 unlabeled 데이터 필터링 적용 전과 후의 학습 iteration 비교 결과이다. 공정한 비교를 위해, 전체 데이터를 사용한 경우와 제안 방법으로 unlabeled 데이터를 필터링한 경우 모두 230 epoch으로 학습 [10] 하였다. 그림에서 각 수치는 3번의 독립 시행에 대한 평균 값이다. 필터링 없이 전체 unlabeled 데이터를 사용한 경우, 학습 iteration이 총 120,000번 필요하며 정확도는 72.27% mAP를 보였다. 반면에, 제안 방법으로 필터링을 한 경우 학습 iteration이 80,000번 필요하며, 정확도는 기존보다 높은 72.39% mAP를 보였다.
Ablation study로 전체 학습 데이터를 80,000 iteration으로 학습한 경우, 정확도가 71.79% mAP로 감소한다. NVIDIA TITAN Xp GPU 기반 환경에서 10,000 iteration 학습 시 대략 2.7 시간이 소요된다. 즉, 제안 필터링은 기존 대비 학습 iteration을 40,000번 감소시키므로 학습 시간을 대략 10.8 시간 줄인다. 학습 시간이 짧아질수록 resource 및 소비 전력이 감소하므로, 제안 방법은 딥러닝 모델의 학습 효율성을 크게 향상시킨다.
표 5.1. 제안 방법 적용 전과 후의 반지도 학습 정확도 비교.
그림 5.7. 제안 방법 적용 전과 후의 학습 iteration과 정확도 비교.
표 5.2는 다양한 필터링 비율에 따른 정확도와 학습 iteartion 결과를 나타낸다. 25%만 필터링한 경우 50% 필터링한 경우보다 정확도는 거의 유사하지만, 데이터 양이 많기 때문에 학습 iteration이 증가한다. 75%로 필터링한 경우 학습 iteration은 대폭 감소하지만, 정확도가 많이 하락한다. 사용자의 application에 따라 비율을 조절할 필요가 있으며, 본 장에서는 가장 높은 정확도를 보인 50%를 필터링 비율로 사용하여 기존 연구와 비교하였다.
표 5.2. 다양한 필터링 비율에 따른 정확도 비교.
5.5.2 Uncertainty
기반 반지도 능동적 학습표 5.3은 제안 반지도 학습과 제안 능동적 학습을 동시에 적용한 실험 결과이다. 실험에서 능동적 학습을 위한 unlabeled 데이터로는 PASCAL VOC 2007를 사용하고, 반지도 학습을 위한 unlabeled 데이터로는 PASCAL VOC 2012 데이터를 사용한다. 성능은 PASCAL VOC 2007 test로 평가한다. 초기 학습을 위한 1,000개 labeled 데이터는 PASCAL VOC 2007에서 random sampling 한다. 표에서 Proposed는 baseline [10]에 4장에서 제안한 mixture 모델링을 적용한
object detection 모델이다. Random은 random sampling을 의미하며 OursAL은 4장의 능동적 학습 결과이다. OursSSAL은 제안 반지도 학습과 제안 능동적 학습을 결합한 결과이다. 첫번째 iteration에서 baseline (기존)과 proposed (제안) 모델의 random sampling 결과를 통해, 제안 모델의 정확도가 기존 모델보다 우수함을 확인할 수 있다. 제안 모델에서 제안 능동적 학습 (OursAL)과 random sampling과의 비교를 통해, 제안 능동적 학습의 성능이 random sampling보다 우수함을 알 수 있다. 여기에 반지도 학습까지 적용하게 되면 (OursSSAL), 마지막 iteration (3rd iteration)에서 제안 능동적 학습 방법 대비 정확도가 1.81 mAP 향상되며, 제안 방법을 적용하지 않은 baseline 대비 정확도가 3.47 mAP로 대폭 향상된다.
표 5.3. 제안 반지도 능동적 학습의 정확도 결과.