4. 실험결과 및 분석
4.2 분류 결과 분석
4.2.1 각 구역별 분류 결과 분석
분류 결과를 정밀하게 분석하기 위해 [그림 4-2]와 같이 구역별로 정 확도를 계산하였다. 이 그림에서 세로축은 top-1 정확도이며 파란색 점 선은 모든 합성곱 신경망의 평균 top-1 정확도이다. 또한 범례는 (신경 망 종류)-(전이학습 유형)으로 표시하였다.
[그림 4-2] 신경망 종류별, 전이학습 유형별 학습 후 구역별 정확도
[그림 4-2]의 구역별 top-1 정확도는 모든 신경망과 전이학습 유형에 서 비슷한 경향을 보인다. 특히 정확도가 비교적 낮은 구역은 교실인 구 역 1, 구역 7과 복도인 구역 11, 구역 13이고 정확도가 비교적 높은 구역 은 교실인 구역 3, 구역 5와 복도인 구역 12, 구역 15임을 알 수 있다.
구역 1과 구역 7의 정확도가 낮은 이유를 알기 위해 confusion matrix 를 보면 모든 신경망과 전이학습 유형에서 과 이 상대적으로 높음 을 알 수 있다. 이렇게 오분류 된 이유는 구역 1과 구역 7의 차이점은 책상과 의자의 개수뿐이기 때문이다. 그러므로 구역 1과 구역 7의 영상 들 중 책상과 의자의 개수가 소수이거나 혹은 존재하지 않는 영상을 입 력한 경우, 두 장소의 차이점인 책상과 의자의 개수를 분별할 수 없으므
로 정확한 분류가 이루어지지 않았다고 할 수 있다. 그 예시로 다음 [그 림 4-3]은 구역 1영상을 구역 7로, 구역 7영상을 구역 1로 오분류한 영 상의 예시이며 그 영상이 속할 확률이 가장 높은 3개의 구역과 평균 확 률을 표시하였다. 그림과 같이 구역 1과 구역 7의 영상들은 상호간으로 분류한 빈도가 높았기 때문에 분류 정확도가 낮았다.
구역 1
구역 7 : 0.75 구역 1 : 0.20 구역 6 : 0.01
구역 7
구역 1 : 0.52 구역 7 : 0.34 구역 4 : 0.09
(a) (b)
[그림 4-3] 구역 1과 구역 7의 오분류 된 시험 영상과 결과 확률예시 (a) 구역7로 오분류 된 구역 1의 영상
(b) 구역1로 오분류 된 구역 7의 영상
다음으로 confusion matrix에서 복도인 구역 11은 구역 15로 오분류 된 빈도가 높음을 알 수 있다. 그 이유를 알기 위해 구역 11과 구역 15 를 영상을 살펴보면 [그림 4-4]와 같이 구역 11은 소수의 사물함이 존재 하고 구역 15는 사물함으로 가득찬 복도임을 알 수 있다. 이 사물함들은 같은 종류이기 때문에 신경망이 구역 11과 구역 15의 사물함을 구분하지 못한 것으로 해석할 수 있다. 또한 구역 15는 사물함이 모든 구역 중 가 장 많이 존재한다. 그러므로 사물함이 포함된 영상들은 구역 15일 가능 성이 가장 높고 이러한 특징을 가진 영상들로 신경망을 학습시켰기 때문 에 복도와 사물함이 함께 촬영된 영상은 구역 15의 영상으로 분류될 확 률이 증가하였다. 결과적으로 구역 11의 사물함 영상은 구역 15로 분류 되었을 가능성이 크기 때문에 분류 정확도가 낮았다고 할 수 있다.
(a) (b) [그림 4-4] 같은 종류의 사물함이 설치된
구역 11과 구역 15의 전방향 영상 (a) 구역 11 (b) 구역 15
다음은 구역 13에 대한 설명이다. confusion matrix를 보면 구역 13은 구역 12로 오분류 된 빈도가 높다. 그 이유는 [그림 4-4]에서 볼 수 있 듯, 구역 13과 구역 12가 모두 ‘비어있는 복도’라는 공통점을 가지는 장 소이기 때문이다. 앞에서 언급한 구역 11이 정확도가 낮은 이유와 마찬 가지로 구역 12에는 구역 13보다 존재하는 물체가 더 적기 때문에 신경 망이 아무것도 없는 복도의 영상을 구역 12로 분류할 확률이 높게 학습 되었음을 판단할 수 있다. 그러므로 구역 13의 물체가 없는 복도 영상들 은 높은 확률로 구역 12로 오분류가 되어 분류 정확도가 낮음을 추론할 수 있다.
(a) (b)
[그림 4-5] 비어있는 복도라는 공통인 구역 13과 구역 12의 전방향 영상 (a) 구역 13 (b) 구역 12
정확도가 비교적 높은 구역인 구역 3, 구역 7, 구역 12 그리고 구역 15 는 모두 구역 고유의 특징이 강한 장소라고 할 수 있다. 즉, [그림 4-6]
과 같이 구역 3은 교실들 중에서 유일하게 사물함이 존재하는 교실, 구
역 5는 가구가 적은 비어있는 교실, 그리고 구역 12와 구역 15는 각각 물체가 없다는 특성과 사물함이 존재한다는 특성이 가장 잘 나타나는 장 소이다. 이렇게 영상에 잘 나타나는 특성을 가지는 장소에서 학습 영상 을 취득 시, 그 특성이 드러나는 영상이 취득되는 빈도가 높다. 앞에서 언급하였듯, 신경망은 비슷한 특징을 가진 영상들이 학습 영사에 있으면 그 특징이 출현하는 빈도가 가장 높은 장소로 분류되도록 학습된다. 그 러므로 신경망으로 시각적 실내 위치 추정 시, 위의 결과처럼 특징이 강 한 장소들은 분류 정확도가 비교적 높은 결과를 보인다.
(a) (b)
(c) (d)
[그림 4-6] 강한 특징으로 인해 정확도가 높은 구역 (a) 구역 3 (b) 구역 5 (c) 구역 12 (d) 구역 15