연구 목적: 다량의 굴절검사 데이터를 활용한 머신러닝 기법을 통해 어린이 근시 예측 모델을 개발한다. 결론: 기계 학습을 사용하면 어린이의 근시 진행에 대한 예측 모델을 만들 수 있습니다. 근시 진행 예측 모델을 만들 때 초진 연령과 구면렌즈 등가물이 가장 중요한 요소로 간주됩니다.
어린이의 근시 진행은 신체적 성장을 동반하는 점진적인 변화입니다. 최근에는 근시를 억제하기 위한 다양한 치료법이 제안되고 있다.7-9 이러한 치료법은 이미 발생한 근시를 감소시킬 수 있는 치료법이 아니라, 앞으로 발생할 근시를 지연시키는 방법이다. 어린이 근시의 위험 요인은 잘 알려져 있습니다.
비지도학습(Unsupervised Learning)은 입력변수의 상호관계를 알려주지 않고 컴퓨터가 변수의 상호관계를 직접 설정할 수 있도록 하는 방법으로, 비정형 데이터(예: 이미지 데이터)에 많이 사용된다.17. 소아 근시는 다양한 요인이 작용하는 다인성 질환입니다. 따라서 어린이 근시의 예후를 예측하는 과정에서는 방대한 양의 데이터를 다각적으로 분석하는 것이 필요하다.
이러한 점을 바탕으로 본 연구에서는 10년간 축적된 다량의 굴절검사 데이터를 활용하여 머신러닝 지도학습 방법 중 하나인 회귀기법을 활용하여 어린이 근시 진행 예측 모델 개발을 시도하였다.
대상환자 및 데이터 수집 방법
회귀 모델 기법
정규화 회귀는 단순 선형 회귀의 개선 모델로 Ridge 회귀18, Lasso 회귀19, ElasticNet20 회귀 모델이 있습니다. 위 방정식은 규제 회귀의 비용 함수를 나타냅니다. 비선형 회귀모델 중 예측모델로는 다차원 다항함수회귀모델을 사용하였다.
항별로 계수를 별도로 계산하기 때문에 다항함수 모델의 차원이 클수록 계산 시간이 기하급수적으로 길어지고 과적합 문제가 발생할 수 있으므로, 모델을 생성하였고, 가장 높은 값을 갖는 최소 차수 회귀 모델을 생성하였다. 정확성이 확인되었습니다. 앙상블 모델은 서로 다른 예측 모델을 결합하여 예측하는 모델입니다. 해당 방법으로는 GBM(Gradient Boosting Machine), XGB(23 Extreme Gradient Boosting), LGBM(24 Light Gradient Boosting Machine)25 회귀 모델을 사용하였다.
모든 회귀 모델에서 훈련 세트와 검증 세트의 비율은 9:1로 지정되었습니다. 예측모델의 정확성을 검증하기 위해 표본 추출 과정을 무작위로 10회 수행하였다.
사용 프로그램
성별도 ElasticNet 회귀 모델에 미치는 영향이 적은 것으로 분석되었습니다. 전체적으로 단순선형회귀모형이나 규제모형에 비해 예측력이 향상된 것을 확인할 수 있었다. 앙상블 회귀모델의 분류깊이별 RMSE 값은 아래 표와 같다(표 7).
다차원 다항식 함수 모델에서는 4차 다항식 함수 모델에서 예측력이 가장 좋은 것으로 확인되었다. 본 연구에서는 머신러닝 기법 중 지도학습 모델 중 하나인 회귀모델을 이용하여 다량의 조절검사 데이터를 통해 어린이의 근시 진행을 예측하는 모델을 개발하였고, 실제로 측정한 굴절을 이용하였다. 기계학습 기법을 활용하여 어린이의 굴절 이상 변화를 예측하는 모델은 아직 널리 연구되지 않았습니다.
본 연구에서는 기계학습 기법 간의 회귀모델을 이용하여 어린이의 근시 진행을 예측하였다. 본 연구에서는 머신러닝 기법이 제공하는 다양한 회귀모델 중 어린이의 근시 진행을 예측하는데 가장 적합한 모델을 식별하여 제시하였다. 일반적으로 규제모형은 단순선형회귀모형에 비해 독립변수의 영향을 보다 간단한 형태로 예측한다.
대부분의 앙상블 회귀 모델은 다른 선형 및 비선형 모델에 비해 예측력이 좋은 것으로 보고되었습니다. 이러한 분류 결과, 대부분의 앙상블 회귀모델에서 사용된 주요 변수는 첫 번째 테스트의 구면렌즈의 응답값이었다. LGBM 모델의 고유한 특징은 첫 번째 테스트 연령과 마지막 테스트 연령입니다.
첫 번째 테스트에서는 구면렌즈 환산치보다 연령을 더 중요한 요소로 하여 회귀모델을 생성하였다(Fig. 3). 상대적으로 회귀모형에서는 성별, 구면렌즈 값, 원주렌즈 값 자체의 영향이 덜 중요한 것으로 나타났다. 셋째, 본 연구에서는 굴절값, 성별, 검사 연령만을 이용하여 근시 진행 예측 모델을 생성하였다.
본 연구에 포함되지 않은 다양한 요인들을 포함하여 예측 모델을 구축한다면 예측 모델의 개선에 도움이 될 것으로 사료된다. 앞으로는 예측 모델에서 반복 측정이 적은 데이터를 활용하는 것이 보다 정확한 예측 모델을 만드는 데 도움이 될 것으로 추정된다. 본 연구에서는 다양한 머신러닝 회귀 기법을 활용하여 소아 근시 진행 예측 모델을 구축했습니다.
나이와 구면렌즈 등가물은 근시 진행 예측 모델을 만드는 데 가장 중요한 요소인 것으로 추정됩니다.