• Tidak ada hasil yang ditemukan

오토인코더의 경우 출력 결과가 입력 데이터와 동일하도록 학습시키는데 이 과정 은 학습 데이터의 패턴을 학습하는 것을 의미한다. 테스트 데이터가 학습 데이터와 동일한 패턴을 보일 경우 복원이 제대로 이루어져 입력 데이터와 출력 데이터의 차 이가 거의 없다. 반면에 학습되지 않은 새로운 데이터에 대해서는 복원이 제대로 이루어지지 않아 입출력 간의 차이가 크고 그 만큼 정보를 잃어버리게 된다. 따라 서 오토인코더는 특징 추출 이외에도 이러한 복원 값의 차이를 이용하여 비정상 신 호 탐지 분야에 사용될 수 있다[21].

그림 4.2. 컨볼루셔널 오토인코더 기반의 특징 추출과 SVM을 사용한 센서

고장진단 순서도

Fig 4.2. Flowchart of sensor fault diagnosis using convolutional auto-encoder based feature extraction and SVM

그림 4.2에서는 컨볼루셔널 오토인코더 기반의 특징 추출과 SVM을 사용한 센서

고장진단 순서도를 보여주고 있다. 그림 4.2에서 센서 데이터는 정상 신호로 학습된

CAE의 입력으로 들어가고 출력으로 복원된 데이터를 얻게 된다. 그리고 입력 센서

데이터()와 출력 데이터()의 차이 값에 절대 값을 취한다. 만약 입력 데이터가

정상 신호일 경우 값의 변화가 거의 없을 것이다. 하지만 고장 신호일 경우 큰 차 이를 가지며, 고장신호의 유형에 따라 결과가 달라진다. 따라서 이 변화하는 값을 통해 statistical features를 구하고 이 특징들을 기반으로 SVM 모델을 학습하여 센서 고장을 진단한다.

(a) Convolutional auto-encoder operation process

(b) Proposed structure of convolutional auto-encoder

그림 4.3. 제안된 컨볼루셔널 오토인코더 동작과정 및 구조

Fig 4.3. Proposed convolutional auto-encoder operation and structure

본 논문에서 SVM 분류기의 학습 데이터로 사용될 특징을 추출하기 위한 컨볼루 셔널 오토인코더(Convolutional Auto-Encoder, CAE)는 기존 오토인코더의 성능을 높 이기 위해 인코더와 디코더에 convolution 연산을 적용시켜 구현하였다.

그림 4.3은 센서 데이터 특징 추출을 위해 제안된 컨볼루션 오토인코더의 구조를

보여준다. 위의 그림에서 나타낸 것처럼 제안된 컨볼루셔널 오토인코더는 인코더와 디코더의 구조를 가지며, convolution layer와 transposed convolution layer로 구성된다.

입력 데이터의 경우 하나의 샘플 당 1,000포인트의 데이터가 있으며, convolution 계 산을 위해 50×20의 2차원 데이터 형태로 재구성한다. 인코더는 세 개의 convolution layer로 이루어져 있으며, 각 convolution layer를 통과할 경우 150, 100, 50개의

feature maps를 생성한다. 디코더는 인코더와 대칭구조를 가지도록 연산되며, 압축된

데이터를 복원한다. 사용된 필터의 크기는 3×3, stride는 첫 번째와 마지막 layer의 경우 2, 나머지는 1을 사용하였고 zero padding을 사용하여 convoltuion 연산 후에도

feature map의 크기를 동일하게 유지하였다. 활성화 함수로는 ReLU가 사용되었다.

손실함수는 MSE로 설정하였으며, 학습을 위한 역전파 과정에서는 Adam

Optimization이 사용되었다. 학습 데이터로는 정상 상태의 신호만을 사용하였다. 구

현에는 Python 기반의 TensorFlow 라이브러리가 사용되었다.

그림 4.4. 컨볼루셔널 오토인코더 기반의 특징 추출 과정

Fig 4.4. Feature extraction process based on convolutional auto-encoder

그림 4.4에서는 센서 유형별로 입출력 차이의 절대값을 취한 loss를 나타낸다. 특 징 추출 결과에서 정상 신호의 loss의 크기는 다른 고장 유형에 비해 상당히 작아 차이가 거의 나지 않지만 다른 데이터는 고장 패턴에 따라서 입출력 차이의 크기나 위치가 다른 것을 확인할 수 있다.