• Tidak ada hasil yang ditemukan

실험 환경 설정

Dalam dokumen 비영리 - S-Space - 서울대학교 (Halaman 66-69)

4. 중요 장소 추출 알고리즘

4.3.2. 실험 환경 설정

56

57

노이즈가 적은 정보를 전달하는 것이 뒤의 과정에서 문제가 발생하 는 것을 방지할 수 있다. 본 연구에서 사용한 밀도기반 클러스터링 방법론은 파라미터 수치에 따라 의도치 않은 클러스터 간의 연결이 발생할 수 있기 때문에, 의도한 연결이 클러스터링 과정에서 반영되 지 않더라도 추후 단계에서 융합하는 과정을 수행할 것이디 때문에 가능한 파라미터를 보수적으로 설정하였다. 실제도 주어진 데이터에 대해 사용한 파라미터는 minPts 5, minTime 10분, eps 100m, 그리고 maxSpeed 10km/h을 사용하였으며 그 결과는 아래의 [그 림 14]와 같다.

[그림 14] 사용자 위치 로그로부터 ST 추출 결과 예시

ST로부터 OP를 형성하는 알고리즘에서는 minRad minDist 라미터가 사용되었으며 실험을 통해 minRad 3, minDist 10m로 설정하였다. 이 때 minRad 상대적으로 민감하지 않음을 실험과정

58

에서 확인하였으며 이는 Chebyshev’s 부등식을 도입한 목적에 부합 한다고 할 수 있다. 만약 단순히 상대적 거리 값을 기준으로 임계치 를 정하여 융합하는 방식을 취할 경우, 파라미터에 매우 민감하게 되어 적합한 수치를 찾기 어렵게 되고, 건물이 밀집된 지역이 존재 할 경우에는 적절하게 파라미터를 설정하는 것이 어려울 수 있다. 실험 결과를 통해 추출되는 장소의 상당수가 원형이 아닌 임의 형 태의 중앙 집중형 분포로 확인되는 경우가 다수 존재하기 때문에 의미 있는 접근임을 확인하였다. [그림 15]는 ST에서 추출한 OP들을

보여준다. 왼쪽의 파란색 점들이 SL이며 이들이 오른쪽에 OP 들로

융합된 것을 확인할 수 있다.

[그림 15] OP 구성 ST() 추출 OP 구성 결과() 예시

최종 응용에 맞추는 RP과정은 위에서 언급한 바와 같이 다양한 접근법이 사용될 수 있으며 이번 연구에서는 시간과 공간을 반영하 는 거리 척도를 정의하여 이를 기준으로 계층형 클러스터링을 수행 하는 방법을 사용하였다. 실험에서 사용한 maxDist 값은 100으로 시 간적으로 방문이 유사한 건물 단위로 장소가 획득되기를 기대하였 다. 경우에 따라 이 수치를 크게 설정하면 캠퍼스 단위나 동단위로

의 획득 또한 시도할 수 있다. 아래의 [그림 16]은 OP로부터 RP를

59

구성하였을 시의 결과를 보여주는 것으로 것으로 도서관 구역이 합 쳐진 것을 확인할 수 있다. 단순히 거리상으로 C9은 C44와 더 가까 우나 시간적 동질성으로 인해 C8과 융합하여 도서관 구획 C48이 획

득됨을 알 수 있다. 이 때 RP의 구획은 KDE (kernel density

estimation)을 각 클러스터마다 수행하여 확률분포를 구한 후, 이로

부터 95 퍼센타일 (percentile)을 등고선 (contour) 표시하고 이에 대

한 닫힌 구역을 획득하기 위해 등고선에 대한 볼록 껍질 (convex

hull)을 구한 것을 통해 표현한 것이다.

[그림 16] RP 구성 OP() 추출 RP 구성 결과() 예시

Dalam dokumen 비영리 - S-Space - 서울대학교 (Halaman 66-69)