4. 중요 장소 추출 알고리즘
4.3.3. 실험 결과
59
구성하였을 시의 결과를 보여주는 것으로 것으로 도서관 구역이 합 쳐진 것을 확인할 수 있다. 단순히 거리상으로 C9은 C44와 더 가까 우나 시간적 동질성으로 인해 C8과 융합하여 도서관 구획 C48이 획
득됨을 알 수 있다. 이 때 RP의 구획은 KDE (kernel density
estimation)을 각 클러스터마다 수행하여 확률분포를 구한 후, 이로
부터 95 퍼센타일 (percentile)을 등고선 (contour) 표시하고 이에 대
한 닫힌 구역을 획득하기 위해 등고선에 대한 볼록 껍질 (convex
hull)을 구한 것을 통해 표현한 것이다.
[그림 16] RP 구성 전 OP(좌) 및 추출 후 RP 구성 결과(우) 예시
60
으로 만약 데이터가 등간격의 시간 데이터로 주어졌을 시 우수한 성능을 보여주는 방법론이다.
비교를 위한 성능 척도로 Precision, Recall그리고 F-measure를 사
용하였다. 문제의 특성상 중요 장소를 레이블링을 통해 선정시 확연 히 구분되는 중요한 장소를 알게 되나 올바른 장소인식이라도 레이 블링 과정에서 확인되지 않은 경우가 존재할 수 있기 때문에 이러 한 문제를 고려하기 위해 다음의 사항들을 본 연구의 실험에서 추 가로 고려하였다. 본래 구분되어 인식되어야 할 장소들이 합쳐져서
하나의 장소로 나타나는 경우가 존재할 수 있으며 이를 merged로
나타내도록 하였고, 반대의 경우로 하나로 표시되어야 할 장소가 필
요 이상으로 분리 되어서 인식 되는 경우를 divided로 나타내도록
하였다. 그리고 레이블링 과정에서 장소로 선정되지 않았으나 추후
확인을 통해 정상적인 장소로 확인된 장소를 recovered로 표시하였
다. 비교대상 알고리즘과 제안하는 알고리즘에 대해 수행한 결과는
다음의 [표 3]과 같다. 제안한 방법론은 CB-SMoT나 Montoliu에 비해
divided와 merged가 발생하지 않음을 확인할 수 있으며, 이는 장소
를 응용의 목적에 맞게 선정하고 추출하고자 함에서 기인한 것이라 고 할 수 있다.
[표 3] 장소 추출 알고리즘별 장소 적중 여부 결과
nClass nLabel Hit Miss Div Mgd Rcvd Err CB-SMoT 160 107 70 15 12 15 29 9
Montoliu 119 107 64 32 3 12 27 13 Proposed 156 107 92 15 0 0 47 17
61
레이블링된 장소에 대한 맞춤을 의미하는 hit과 틀림을 의미하
는 miss 이외에 divided와 merged, 그리고 recovered와 같은 정보들
이 존재하기 때문에 기존의 precision, recall, F-measure와 함께 이들
을 측정할 수 있는 지표가 요구된다. 본 연구에서는 위의 지표와 함 께 추가적으로 recovered를 정답으로 포함하는 경우에 대한 성능 척 도인 , 를 함께 측정하였으며 사용한 성능 척도들을 정리하면 다 음의 수식과 같다.
R =extracted places ∩ labeled places labeled places
P =extracted places ∩ labeled places extracted places
F =2 ⋅ P ⋅ R (P + R)
P =extracted places ∩ labeled&recovered places labeled places
F =2 ⋅ P ⋅ R P + R
아래의 [표 4]는 제안하는 방법론과 비교대상인 알고리즘과의 성능을 비교한 결과이다. 아래의 결과에서 확인할 수 있듯이 제안하 는 방법론이 우수한 성능을 보임을 확인할 수 있다. 데이터의 특성
이 균등 간격을 가지는 위치 데이터가 아니고, GPS와 Wi-Fi를 통한
데이터 획득이 함께 포함되어있는 복합형 데이터에 대해 제안한 알 고리즘이 처리에 강점이 있는 것이 요인 중 하나로 판단된다.
62
[표 4] 장소 추출 알고리즘별 추출 성능
R P F Pα Fα
CB-SMoT 0.654 0.438 0.524 0.619 0.636 Montoliu 0.598 0.538 0.566 0.765 0.671 Proposed 0.860 0.590 0.700 0.891 0.875
제안하는 방법론은 절차형 접근법을 통해 실생활 위치 좌표 데 이터로부터 장소에 대한 사전 정보가 주어지지 않았을 시 장소 단 위가 요구되는 응용에 필요한 장소 RP를 추출하여 주며 위에서 확 인한 바와 같이 기존 대비 우수한 성능을 보여줌을 확인할 수 있다. 또한 실제 측정을 통해 획득하는 관측 장소 OP와 실제 장소 RP를 구분하여 인식함으로써 좀 더 다양한 응용에 유연하게 적용할 수 있는 기반을 마련하였다. 제시한 모형은 이상점이 존재하는 데이터 를 다룰 수 있도록 설계하였으며 실생활 데이터를 기반으로 제시한 알고리즘이 작동함을 확인하였다.
63