5. 행위 추론
5.3. 기존 방법론 적용 테스트
본 연구에서는 행위 추론에 적합한 방법론을 탐색하기 위해 다 양한 기존 방법론을 적용하고 그 성능을 확인하였다. 시험한 첫번째
방법론은 나이브 베이즈 (Naive Bayes) 방법론으로 위의 과정에서 추
출한 다양한 센서 정보와 앱 사용정보, 그리고 시간 정보를 피쳐로 사용하여 학습한 후 교차검증을 수행하였다. 그 결과 일부의 대상에
대해서는 65%의 결과를 보여주었지만 전체적으로 보았을 때는 23%
라는 매우 낮은 성능을 보여주었다. 두 번째로 사용한 방법론은
SVM으로 RBF (Radial Basis Function) 커널을 사용하여 같은 데이터로
학습한 후 수면, 학습, 이동, 휴식, 수업에 대한 이진 분류를 수행하
였으며 그 결과는 다음의 [표 11]과 같다. 표에서 확인할 수 있듯이
수면과 학습의 경우에는 90% 이상의 높은 성능을 보여주지만 나머
지 세 경우에 대해서는 낮은 성능을 보여줌을 확인할 수 있다. 특히
수면의 경우를 제외하면 recall이 낮은 것을 확인할 수 있다.
[표 11] RBF 커널 사용한 SVM 사용시 행위 추론 성능
수면 학습 이동 휴식 수업 precision 0.910 0.930 0.520 0.610 0.440
recall 0.633 0.280 0.070 0.240 0.310 share
ratio 0.275 0.109 0.081 0.079 0.073
다음을 시도한 방법론은 시퀀스 정보를 반영할 수 있는 HMM
모형을 적용하는 것이었다. 대상 레이블은 위와 동일하게 수면, 이동, 학습, 수업, 휴식에 대해 수행하였으며, 관측 노드를 PCA (Principal
82
Component Analysis)를 이용해 차원 축소를 수행 하였으며, 관측 노
드는 다변량 가우시안 혼합 모형 (multivariate Gaussian mixture)으로
가정하고 학습을 수행하였다. 해당 모형은 결과 예측의 정확도는 50
에서 65%로 도출됨을 확인할 수 있었다. 하지만 대상에 따라 HMM
모형의 파라미터에 민감하게 반응하여 안정적인 결과를 제공해주지 모하는 한계점을 확인할 수 있었다.
[표 12] 개인별 PrefixSpan 수행 결과
유저 From è To Support
(T=29) Confidence 연속 발생여부
전체 특이사항 없음
8 수면 è 화장 21 80.80% Y
9 수면 è 데이트 22 81.50% Y
11 외식 è 수업 11 73.30% N
수면,수업 è 외식 10 71.40% Y
17 수면 è 집밥 20 74.10% Y
수면,목욕 è 집밥 14 82.40% Y
18
수면 è 학습 25 86.20% Y
수면 è 집밥 21 72.40% Y
집밥 è 학습 16 76.20% Y
수면,집밥 è 학습 16 76.20% Y
19
휴식 è 독서 15 75.00% Y
수면,집밥 è 독서 14 73.70% Y
집밥,목욕 è 독서 13 81.30% Y
수면,집밥,목욕 è 독서 12 80.00% N
20
수면 è 휴식 24 82.80% Y
수면 è 학습 22 75.90% Y
수업 è 학습 15 88.20% Y
수면,수업 è 학습 15 88.20% Y
83
마지막으로 행위간에 시퀀스적 선후관계가 존재하는지 확인하기 위해 시퀀스 룰 마이닝 기법을 적용하여 이를 확인하였다. 규칙을
추출하기 위해 PrefixSpan 방법론[88]을 사용하였으며, 규칙을 추출
한 결과는 위의 [표 12]와 같다. 아래의 표에서 확인할 수 있듯이
일부의 규칙이 존재함을 확인할 수 있었다. 하지만 규칙이 일부의 경우에만 존재하기 때문에 규칙만으로 행위를 예측할 수는 없기 때 문에 보조 정보로의 가치가 있을 수 있지만, 행위의 다양성과 수집 기간의 한계로 인해 다양한 규칙들을 안정적으로 획득에 한계가 있 음을 확인하였다.
84