3. 기계학습을 이용한 스텔스 함형 설계
3.2 기계학습 기술
3.2.1 기계학습 개념의 정의
최근 기계학습을 기반으로 하는 인공 지능 기술이 많은 주목을 받으 며 학계와 산업계뿐만 아니라 다양한 매체에서 사용되고 있다. 기계학습 은 인공지능(AI)의 하위 집합으로 컴퓨터가 사람처럼 생각하고 자체적으 로 수행하는 것으로, 데이터의 수학적 모델을 이용하여 사람이 직접 명 령 하지 않고 컴퓨터가 학습하도록 하는 기술이다. 기계학습은 알고리즘 을 사용하여 데이터 내의 패턴을 식별하여 예측을 할 수 있는 데이터 모 델을 생성한다. 인간이 연급을 통하여 학습하는 방식과 흡사하게, 기계 학습 역시 데이터와 환경이 향상되면서 결과도 더욱 정확해진다. 기계학 습은 적응성을 가지고 있으므로, 작업의 성격이 변하여 데이터가 변경되 거나, 최적화 솔루션 개발이 실질적으로 불가능한 시나리오에 적합하다. 인간의 추론 과정을 모방하도록 컴퓨터를 학습시키는 한가지 방법은 인 간 두뇌를 따라 모델링된 일련의 알고리즘인 신경망을 사용하는 것이다. 기계학습은 예측 분석의 한 유형이지만 기계학습이 더 많은 데이터를 획 득할 수 있기 때문에 실시간 업데이트를 통해 최적화된 학습모델을 구현 할 수 있다. 예측 분석은 일반적으로 정적 데이터 세트를 사용하며 업데 이트를 통해 학습을 수행한다.
기계학습은 그림 40과 같이 학습의 종류에 따라 비지도학습, 지도학 습, 강화학습으로 구분할 수 있다. 비지도 학습은 학습 데이터에서 여러 특성을 추출하는 것을 목표로 한다. 복잡한 데이터의 차원을 낮춰 특성
을 추출하는 차원 축소, 서로 같은 데이터의 특징을 군집화시키는
clustering 등을 이용하여 고차원 데이터의 복잡성을 낮출 수 있다. 지
도학습은 특성 데이터와 레이블 데이터로 이루어진 학습 데이터로 학습 을 수행한다. 자동차의 사진을 자동차, 배의 사진을 배로 분류하는 Classification이나 x가 주어지면 y를 예측하는 Regression이 대표적인 예이다. 강화학습은 지도학습과 비지도학습과 다르게 고정된 데이터로 학습을 수행하지 않는다. 기계가 특정 상태에서 행동을 취하면 환경으로 부터 보상을 받는데 이 때 기계의 경험으로 만들어진 상태, 행동 보상으 로 구성된 학습 데이터를 통해 학습을 수행하기 때문이다. 즉 환경에서 주어지는 보상과 기계 자신이 환경을 탐험하는 방법에 따라 학습 결과가 달라질 수 있다. 이 문제들은 환경에서 주어지는 보상과 그 보상에 대한 처리를 설계하고 정의한느 것이 어려울 때 발생한다. 이러한 문제가 지 도학습과 비지도학습보다 어렵게 하는 요인이다. 다만 설계를 잘 할 수 있다면 방대한 학습 데이터를 구하지 않고도 기계 스스로의 경험으로 학 습이 가능하다는 장점이 있다.
기계학습 프로세스는 먼저 데이터의 수집, 모델의 교육, 모델의 유효 성 검사, 결과해석 순으로 작동한다. 데이터의 수집에는 데이터의 원본 을 파악하여 사용 가능한 데이터를 컴파일 한다. 보유한 데이터 형식에 따라 사용할 수 있는 기계학습 알고리즘을 선택한다. 모델 교육은 학습 데이터와 검증 데이터 두 개의 그룹으로 분할하여, 학습 데이터를 이용 해 모델의 학습을 수행하고 테스트 데이터를 이용하여 성능 및 정확도를 평가한다.
본 논문에서 사용한 기계학습의 학습 방법은 특성 데이터와 레이블 데이터로 이루어진 학습 데이터를 이용한 지도학습을 사용하였다.
Figure 40 Types of machine learning