• Tidak ada hasil yang ditemukan

문제 정의

Dalam dokumen 비영리 - S-Space - 서울대학교 (Halaman 44-48)

4. 중요 장소 추출 알고리즘

4.1. 문제 정의

34

35

기반 방법론을 사용하는 등 다양한 방법론을 통해 사용자의 중요 장소를 추출하는 시도를 하였지만 응용의 관점에서 장소를 해석하 고 반영하는 것을 고려하지 않았다. 이들 연구들은 많은 경우 위치

측위를 위해 제작된 전문 GPS 센서 장비를 기반으로 데이터를 수집

하였거나, 항상 위치 정보를 수집할 수 있는 상황이라는 가정하에서 모형을 설계하였기 때문에, 다수의 이상점 (outlier)나 노이즈 (noise) 가 존재하고, 측정이 되지 않는 구간도 존재하는 실제 데이터에서는 성능이 떨어지게 된다.

스마트 디바이스로부터 수집한 위치 정보는 전문 위치 측위 장 비에서 수집한 데이터와는 달리 고려해야 할 다양한 특성들이 존재 한다. 우선 스마트 디바이스로부터 수집하는 데이터는 GPS와 네트워 크 추정 기반 정보가 혼합되어 있는 복합형 데이터이다. GPS 센서로 부터 획득한 위치 정보는 높은 정확도를 제공하지만, 음영지역이나 실내 등 사용할 수 없는 지역이 존재한다는 점과 배터리 소모가 크 다는 점이 단점이다. 이러한 단점을 보완하기 위해 스마트 디바이스

에서는 Wi-Fi와 셀룰러 망 정보를 이용한 위치 측위를 함께 제공하

여주고 있다. 고려하여야 할 두 번째 특성은 실생활 장비임에 따른 높은 데이터의 소실이나 오류의 발생 가능성을 고려해야 한다는 점 이다. 스마트 디바이스는 위치 측정을 위해 설계된 전용 장비가 아 니기 때문에 외부적 요인에 의해 측정에 이상이 발생할 수 있으므 로 이에 대한 고려 또한 필요하다고 할 수 있다. 아래의 [그림 6]은 실험을 통해 수집한 데이터의 위치 데이터 수집현황을 도식화 한 것이다. 가로 축은 하루 중의 시간을, 세로축은 하루를 의미하며, 회 색은 네트워크를 통해 추정된 정보가 수집되었음을 의미하고, 검은

색은 부분은 GPS를 통해 수집된 것을 의미한다. 그림에서 확인할 수

있듯이 GPS 정보를 획득하지 못하는 구간들이 존재하며, 일부의 경

36

우에는 기기의 오류나 환경적 요인으로 위치 정보가 수집되지 못하 는 경우도 확인할 수 있다.

[그림 6] 사용자별 위치 정보 수집 형태 예시

앞에서 언급한 바와 같이 응용에 따라 요구되는 장소의 단위나 성질이 다양하게 존재하기 때문에 이를 반영할 수 있는 장소 추출 알고리즘이 요구된다. 장소 추출 알고리즘이 현실적인 상황에서 작 동하게 하기 위해서는 스마트 디바이스에서 획득되는 노이즈가 다 수 존재하고, 등간격으로 위치 정보를 제공되지 않고 정보 유실이

37

존재한 데이터에 대하여 적용 가능한 형태로 설계되어야 할 필요성 이 있다. 따라서 본 연구에서는 이러한 이슈들을 다룰 수 있는 절차 형 중요 장소 추출 알고리즘은 제안하고자 한다.

38

Dalam dokumen 비영리 - S-Space - 서울대학교 (Halaman 44-48)