3.1 조사 대상자 및 데이터 개괄 3.1.1 조사 데이터의 속성
본 연구에서는 65세 이상 노인의 실제 보행경로를 활용하여 조사에 이용하였다. 여기에서 활용한 데이터는 <그림 2>의 보행어플리케이 션 “WalkOn”을 통해 수집한 것이다. “WalkOn”은 ㈜Swallaby가 제공 하는 인센티브 기반의 헬스 트래킹 서비스로 서울시 건강증진과 및 각 행정구의 보건소 등 유수의 기관과 파트너십을 이루고 있어 서울 시를 대상으로 한 보행데이터의 양이 풍부하다.
기존에는 본 연구와 같은 실제 보행경로를 수집하는 데에 있어서, GPS기기 및 통행일지를 활용하였다. 그것과 비교하여 차별적으로 얻 을 수 있는 장점은, 보다 표본의 수가 많고 서울시 전역에 고르게 분 포한다는 점이다. 기존의 방식에 소요되는 비용과 시간의 한계를 넘 어서, 사용자가 자발적으로 설치하고 기록한 데이터를 활용하는 것이 다. 또한 어플리케이션의 특성상 <그림 3>8)에서처럼 데이터가 서버 에 기록되기 때문에 편집과정이 보다 간소화되었다.
그림 2 WalkOn APP의 실행화면
그림 3 WalkOn 어플리케이션–클라우드 간의 데이터 수집 예시
실제 연구에 필요한 수준으로 정밀하게 보행데이터를 얻기 위해서는 이동 경로 저장의 메커니즘이 잘 구축되어야 한다. 따라서 “WalkON
“은 GPS, 모바일 네트워크, wi-fi를 모두 활용하여 정확한 위치 값을 도출하고 있다. 또한, 실제 보행데이터만을 수집하기 위하여 <그림 4>9)와 같이 실내 진입이나 차량 이동의 경우 자체 알고리즘을 구현 하여 이동 중일 때만 위치를 측정하도록 하고 있다. 이렇게 수집된
8) ㈜Swallaby 제공
데이터를 기록하여 이동경로를 저장하는 것이다.
이렇게 저장되는 보행데이터는 <그림 5>10)과 같이 시작시간, 종료 시간, 걸음 수, 위도, 경도로 기록된다. 20초의 간격으로 위치가 기록 되는데, 30초 이상 걸음 수 변동이 없을 경우 수집이 중단된다. 이렇 게 측정이 일어나는 포인트별로 위도와 경도가 기록되어, 이것을 이 으면 이동경로로 나타난다. 또한, 짧은 생활보행을 전부 기록하지 않 기 위해서 300보 이상인 경우에 한해서 보행데이터가 저장된다.
각 개인이 기록하는 데이터는 단순히 보행경로만을 나타내는 것이 아니라 개인의 속성을 포함한다. 사용자가 입력한 자신의 헬스 프로 필은 성별, 키, 몸무게, 나이, 사회적 정보 등에 기반을 두어 전체 사 용자와의 비교로 그룹으로 분류된다. 또한 다차원 활동 데이터는 신 체활동 유형, 시간, 위치, 요일 등에 따라 기록되는데, 이렇게 모인 데 이터는 <그림 6>11)과 같이 개인별 활동 데이터로 나타난다. 이러한
10) ㈜Swallaby 제공
그림 4 보행 위치데이터 수집 알고리즘 및 실내 진입, 차량 이동 버퍼 예시
개인의 헬스 프로필 및 다차원 활동 데이터에서 전체 사용자의 데이 터와의 비교를 통하면 개별 사용자의 위치, 시간에 따른 활동 트렌드 를 도출할 수 있게 된다.
그림 5 실제 보행데이터를 기반으로 한 보행행위 수집 샘플
그림 6 사용자 개인별 활동 데이터 분석(걷기, 비활동, 수면) 예시
3.1.2 조사 데이터의 한계
조사 데이터를 수집하기 위하여 활용한 “WalkOn”은 기본적으로 헬 스 트래킹 서비스이기 때문에, 건강에 관심이 많고 활동적인 층에서 쓰고 있을 가능성이 높다. 또한 스마트폰 어플리케이션이기 때문에, 노인세대의 경우에는 어느 정도는 지적수준이나 사회경제적으로 여유 가 있는 군집에서 주로 활용할 것이라 볼 수 있다. 따라서 여기에서 나온 수치 값을 그대로 노인의 일반적인 특성이라고 대응하기에는 무 리가 있다.
또한, 본 연구의 조사 방법으로 만들어진 어플리케이션이 아니기 때 문에 기존에 관련 연구에서 행하던 방식인 ‘통행일지’가 없다는 단점 이 있다. 보통 통행일지에 시간과 장소, 목적 등을 기입하여 보조자료 로 활용하면서 구체적인 속성을 파악하는데, 본 연구에는 해당하는 자료가 없기 때문에 다룰 수 있는 범위에 한계가 있다. 따라서 복합 건물이나 시설구분이 명확하지 않은 장소의 경우에는 목적지가 어디 인지 알 수 없다.
따라서 위의 두 가지 한계를 고려하여 본 데이터를 활용할 수 있는 방안을 구상하였다. 먼저 첫 번째 한계의 경우는 본 어플리케이션을 사용하는 노인세대 집단의 특성을 파악하고, 분석에 있어서 얻어낸 절대적인 수치(걸음 수, 보행시간, 보행횟수) 등을 활용하기 보다는 수집한 데이터 사이의 상대적인 경향성을 비교하여 분석하는 방향으 로 접근하였다.
두 번째 한계의 경우에는 분석 대상이 되는 시설을 보다 목적이 확 실한 것으로 선정하여 보완하였다. 공공시설의 경우나 한 건물에 하 나의 기능만이 담긴 시설의 경우에는 목적지와 목적이 뚜렷한데 그러 한 시설로 한정하여 분석을 실시하였다. 또한 연구의 주제에서 경로 의 출발로 삼는 시설이 지하철역인데, 지하철역의 경우 그 목적과 범 위가 뚜렷하여 본 연구의 조사에 해당 데이터를 활용할 수 있었다.
3.1.3 조사 대상자 개요
분석 대상이 되는 조사 대상자에 대해서는 앞선 3.2.2장에서 밝힌 것 과 같이 별도로 정의할 필요가 있다. 본 연구의 대상이 되는 노인의 경우, 일반적인 노인의 기준에 따라 65세 이상으로 한정하였다. 특히 이중에서 본 연구의 조사 데이터로 수집된 보행 어플리케이션
“WalkOn”을 활용하기 위해서는 스마트폰을 사용하는 노인군으로 한 정할 수 있다.
한국정보화진흥원의 조사에 따르면, 2015년 3월 기준으로 65세 이상 의 스마트폰 보급률은 25.3%에 불과하다. 또한 2011년에 같은 기관이 발표한 정보격차 실태조사에 따르면 비용 부담 때문에 스마트폰을 사 용하지 않는다고 답한 대상은 29.7%인 반면, 용도를 모르거나 사용법 이 어려워서 사용하지 않는다고 답한 비율이 45.4%로 나타났다. 따라 서 본 연구의 대상이 되는 노인의 경우, 지적 수준이 높고 건강에 관 련된 어플리케이션을 설치할 정도로 건강에 관심이 많은 노인이라는 것을 알 수 있다.
“WalkOn”에서 수집한 유저의 경우 10대부터 70대까지 약 70,000명 의 다양한 세대를 포함하고 있다. 하지만 모든 유저가 위치데이터를 보유하는 것은 아니기 때문에12), 본 연구에서는 서울특별시에 거주하 는 65세 이상의 유저 중 위치데이터를 보유한 275명에 의해 나타난 경로를 활용하였다. 조사 기간은 2016년 5월 1일부터 9월 3일까지 18 주에 해당하고, 해당 기간 동안 기록된 약 70,000여 경로를 분석의 대 상으로 하였다. 이렇게 수집된 경로에서 앞서 3.1에서 구한 연구대상 지 주변에서 벌어지는 보행경로를 추출하여 역세권을 중심으로 시설 이용양태를 점검하였다.
12) “WalkOn” 어플리케이션의 경우, 위치데이터를 기록하지 않아도 이용할 수 있다. 단
3.2 조사 결과 분석 방법
본 연구는 노인들이 도시 내에서 “언제 얼마나 걷는가”, “어디서 나 와서 어디로 가는가”, “편하게 걷는 곳은 어디인가”라는 물음의 답을 구하는 것을 목적으로 한다. 따라서 수집한 경로 중심의 빅데이터를 목적에 맞게 가공하는 과정이 필요하다.
3.2.1 데이터 프로세싱
먼저 “언제 얼마나 걷는가”라는 질문에 대답하기 위해서는 시간대별 경로 수와 보행량이 도출되어야 한다. “어디서 나와서 어디로 가는가”
에 대해서는 출발점과 목적점에 대한 정보가 필요하다. “편하게 걷는 곳은 어디인가”의 경우에는 보행량 및 보행횟수에 대한 데이터가 있 어야 한다.
보다 구체적으로 변형된 형태를 보자면, <그림 7>는 개인이 걸은 보 행경로를 표현하는 방식의 기존의 경로정보를 보여주고 있다. 본 연 구에서는 이렇게 생성된 경로를 <그림 8>과 같이 출발점과 도착점과 그 두 지점을 잇는 경로로 단순화하고, 해당 경로는 보행량 정보를 포함하도록 하였다. 이렇게 가공한 데이터는 원하는 영역을 선택하면 담기는 각각의 항목을 레이어별로 정보를 취합할 수 있다.
그림 7 위치데이터를 기반으로 보행경 로를 표시한 예시
그림 8 출발점과 도착점으로 단순화하 여 가공한 데이터를 표시한 예시
이러한 방식으로 가공한 데이터를 활용하여 “언제 얼마나 걷는가”라 는 질문에 답을 하기 위해서 분석의 틀을 작성하였다. <그림 9>과 같이 만든 툴을 활용하여 분석을 원하는 요일 및 시간대를 선택하면 해당하는 데이터가 지도에 표시하였다. 먼저 요일과 시간대를 선택하 고, 대상이 되는 영역을 선택하면, 해당 영역에 담긴 경로의 정보가 도출된다. 이러한 셀은 복수 선택이 가능하기 때문에, 정보의 합계를 구할 수 있다. 따라서 원하는 영역(예를 들면, 지하철역, 생활권 등)을 선택하여 지역 단위로 분석할 수 있다.
<그림 9>의 경우는 5월 25일부터 31일까지의 1주일간을 대상으로 한 파일럿 스터디의 결과였다. 이렇게 만들어진 분석의 틀로는 “언제 얼마나 걷는가”라는 질문에 대해서는 답을 내릴 수 있었지만 7일간의 경로의 수인 4475개의 경로로는 원하는 특정 지역에 대해서 분석하기 에 표본의 양이 부족했다. 분석하고자 했던 시설의 경우에는 경로가 10개미만으로 나타났기 때문이다.
따라서 분석의 대상을 늘리고자 <그림 10>와 같이 18주간의 경로를 하루 단위로 볼 수 있는 틀을 새롭게 제작하였다. 이미 “언제 얼마나 걷는가”라는 질문에 대해서 답을 내릴 수 있었기 때문에 새롭게 제작 한 틀의 경우에는 하루 단위로 데이터를 표시하고 분석할 수 있도록 하였다. 기존의 1주일에 비해서 18배가 되는 기간에 대해 데이터를 취합하였기 때문에, 표본이 부족했던 영역에 대해서도 분석이 가능할 만큼의 충분한 데이터를 얻을 수 있었다.
또한 때때로 데이터에 오차가 발생하기도 하였다. 이것은 기기의 특 성상 정확한 GPS의 값이 아닌 오류가 나타난 경우와 데이터 수집 알 고리즘을 빗겨간 방식으로 인해 생겨날 수 있다. 따라서 1시간을 쉬 지 않고 걸었을 때의 걸음 수에 근거하여13) 임계점을 설정하고 경로 를 확인하여 오차를 제거하였다.
13) 선행연구(손호희 외, 2014)를 이용하여 1시간의 걸음수를 계산하면 6,142걸음이