• Tidak ada hasil yang ditemukan

케모메트릭 분석기법을 활용한 유류 물성․화학적 조성 예측

Dalam dokumen 유지문감식 선진화기법 개발 (Halaman 104-121)

2.2 케모메트릭 활용 유류 물리․화학적 특성 예측모델 보완

2.2.1 케모메트릭 분석기법을 활용한 유류 물성․화학적 조성 예측

가. 예측 모델 개발

PLS-DA(partial least squares-discriminant analysis)는 종속변수 로 연속적인 값 대신 판별하고자 하는 그룹들을 가상 변수로 설정 하여 이를 판별하는 회귀모델이다. PLS-DA 분석법은 주성분분석법 (Principal Component Analysis, PCA)을 보완한 방법으로 스펙트럼 (독립변수) 데이터의 주성분을 구하고 그 주성분을 이용하여 회귀 식을 구하는 주성분분석과는 다르게 스펙트럼뿐만 아니라 실제 측 정된 종속변수 값을 동시에 고려하여 새로운 변수를 찾고 이를 이 용하여 회귀식을 구하는 방법이다. 이처럼 독립변수와 종속변수 모 두를 고려하기 때문에 독립변수만을 고려하는 주성분분석 모델에 비해 안정적인 장점이 있다. PLS 모델은 그림 2.2.1과 같이 설명된 다. 여기서 변수 T와 P는 실측한 자료 X의 scores와 loadings를 의 미하며, 변수 T와 Q는 각각 –1,1을 가지는 예측치의 scores와 loadings를 의미한다. PLS 분석법은 정량적 분석 외에 정성적 분석 법도 활용이 되는데 대표적인 방법이 PLS-DA방법이다.

그림 2.2.1 PLS-DA 개념 및 수식도

주성분분석(PCA)은 다변량 데이터가 갖고 있는 정보들을 최대 한 확보하면서 서로 독립적이고 적은 수의 새로운 변수들을 생성 하고 다차원의 자료를 2차원 또는 3차원의 주성분 공간으로 추출 하는 통계기법이라고 할 수 있다. PLS-DA는 classification을 통해 집합이라는 종속변수를 부여하여 판별에 기여하는 각 데이터의 시 각화를 극대화하고 분류군 간 차이가 있는 시료를 찾을 수 있게 도와주는 통계 기법으로서, 예측모델의 확립과 판별에 기여하는 변 수 탐색에 가장 적합한 방법이다. PCA분석법은 그룹간의 표본의 유사성 또는 차이를 스크리닝하는 목적으로는 유용하지만, 그룹 내 표본간의 정보를 제공하기는 유용하지 않을 수 있다(그림 2.2.2).

Group 1

Group 2 Group 1

Group 2

그림 2.2.2 PCA와 PLS-DA 분석법에 따른 차이

나. 통합 모델(Global Model)

모델에 적용하기 위해 총 109개의 기름 시료를 6개 분류로 구 분지어 사용하였다. 통합모델(Global model)을 통해 사용자는 유형 별로 전체 기름 시료에 대한 유의한 차이를 구별할 수 있다. 기름 시료는 (1) 수입원유(crude), (2) 휘발유계열(gasoline), (3) 경유계열 (diesel), (4) 벙커계열(bunker), (5) 선박연료유(marine fuel oil, MFO), (6) 윤활유계열(lubricant)로 6개 각기 다른 특성으로 분류하 여 모델을 실행시켰다(표 2.2.1).

Classes Oil Type No. of Samples

1 Crude 50

2 Gasoline 15

3 Diesel 9

4 Bunker 7

5 MFO 15

6 Lubricant 13

Total 109

표 2.2.1 통합 모델을 위한 기름 종류에 따른 분류

그룹 1(crude), 그룹 5(MFO), 그룹 6(lubricant)은 다른 그룹과 명확하게 구분할 수 있었으나, 그룹 2(gasoline), 그룹 3(diesel), 그 룹 4(bunker)는 다른 그룹과 차이를 보이지 않았다(그림 2.2.3). 그 룹 1, 5, 6은 FT-IR 스펙트럼에서 물리・화학적인 특성이 다른 그 룹과 차이를 보이기 때문에 잘 구분지어졌다. FT-IR의 스펙트럼에 서 차이를 보이는 것은 기름이 함유하고 있는 SARA와 황 함량에 따른 차이로 해석된다. 통합 모델은 109개 기름 시료에 대해 그룹 별로 분류되어 83%의 정확도를 보였다. PLS-DA는 각 시료 및 집 단 간의 분포 범위가 명확하게 구분될 수 있는 방법이다.

그룹 2, 3, 4는 휘발유, 경유, 벙커계열의 기름 그룹으로 명확한 차이를 보이지 않았다. 이러한 원인은 휘발유와 경유 계열이 SARA 함량 중 포화탄화수소(saturate)와 방향족탄화수소(aromatic) 계열이 유의한 차이가 없고 유사하기 때문이고, 벙커계열의 그룹은 벙커유

을 제조시에 중질유와 휘발유를 혼합하여 제조하기 때문에 물리・

화학적인 조성이 유사한 결과로 차이를 보이지 않았다.

0 50 100 150 samples

-1 -0.5 0 0.5 1

cross validated response Class 1

sample plot

class 1 class 2 class 3 class 4 class 5 class 6

그림 2.2.3 전체 기름에 대한 통합 판별 분석

0 50 100 150 samples

-0.2 -0.1 0 0.1 0.2 0.3

cross validated response Class 3

sample plot

class 1 class 2 class 3 class 4 class 5 class 6

그림 2.2.3 (계속)

0 50 100 150 samples

-0.2 0 0.2 0.4 0.6 0.8 1 1.2

cross validated response Class 5

sample plot

class 1 class 2 class 3 class 4 class 5 class 6

그림 2.2.3 (계속)

다. 휘발유와 경유 그룹

통합 모델(Global model)을 통해서는 전체 그룹 중 그룹 2와 3 이 뚜렷하게 구별되지 않았으나, 그룹 2와 3만을 이용한 하위모델 (sub-model) 분석법에서는 개별적 판별로 통해 명확하게 구분할 수 있다(그림 2.2.4). 하위 모델에서 PLS-DA 분석법은 두 그룹간의 차 이를 반영하여 좀 더 명확하게 분류되어졌다.

0 5 10 15 20 samples

-0.2 0 0.2 0.4 0.6 0.8 1

calculated response Class 1

sample plot

class 1 class 2

그림 2.2.4 휘발유와 경유 그룹 간 판별 분석

라. 수입 원유 50종

수입 원유 50종에 대해 하위모델(sub-model)을 이용하여 분류하 였다. 수입원유의 특성은 제품유에 비해 유사한 특성을 보이지만, 전체 원유를 API(American Petroleum Institute) 지수에 의해 분류가 되어 진다. 수입 원유 50종을 API 지수에 따라 4그룹으로 분류하였 다. 그룹1은 API지수가 45이상, 그룹 2; API 35~45, 그룹 3; API 17.5~35, 그룹 4; API <17.5이다(표 2.2.2). 수입 원유 50종을 API지 수로 4그룹으로 분류하고 하위모델을 이용하여 판별한 결과 85%의 정확도로 명확하게 구분지어 졌다(그림 2.2.5).

Classes Oil Type No. of Samples

1 API > 45 3

2 API 35 ~ 45 22

3 API 17.5 ~ 35 22

4 API <17.5 3

표 2.2.2 API지수를 이용한 수입 원유 50종 분류

0 10 20 30 40 50 60 70 80 90 samples

-0.2 0 0.2 0.4 0.6 0.8

calculated response Class 1

sample plot

class 1 class 2 class 3 class 4

그림 2.2.5 API지수로 분류된 수입원유 50종 간 판별 분석

0 10 20 30 40 50 60 70 80 90 samples

-0.4 -0.2 0 0.2 0.4 0.6 0.8 1

calculated response Class 3

sample plot

class 1 class 2 class 3 class 4

그림 2.2.5 (계속)

마. MFO sub-model

선박연료유(MFO) 15종에 대해 하위모델(sub-model)을 이용하여 분류하였다. 선박연료유의 물리 화학적인 특성은 유사하지만, 50℃

에서 측정한 점도결과 2그룹으로 분류되었다. 그룹 1은 MFO 180 그룹이고, 그룹 2는 MFO 380그룹으로 점도에 의해 구분되어졌다 (표 2.2.3). 선박연료유 15종을 점도에 의해 2그룹으로 분류하고 하 위모델을 이용하여 판별한 결과 80%의 정확도로 명확하게 구분지 어 졌다(그림 2.2.6).

Classes Oil Type No. of Samples

1 MFO 180 10

2 MFO 380 5

표 2.2.3 점도(50℃)를 이용하여 선박연료유(MFO) 분류

2 4 6 8 10 12 14 samples

-0.5 0 0.5 1 1.5

cross validated response Class 1

sample plot

class 1 class 2

그림 2.2.6 점도(50℃)로 분류된 MFO 15종 간 판별 분석

바. 예측 모델 요약

예측모델은 크게 Classification과 Prediction로 구분되고, Classification은 통합모델(Global Model)과 하위모델(Sub-Model)로 분류된다. 기름 예측 모델은 전체적으로 3단계로 구분지어 설명되 어 진다(그림 2.2.7). 미지 시료의 경우 3단계 예측모델을 통해 판별 할 수 있으며, 모델링 과정에서 물리 화학적 성질을 예측하기 전에 유종을 확인하는 것이 중요하다. 휘발유 및 디젤과 같은 일부 유종 은 각 유종별 특성이 유의한 차이를 보이지 않기 때문에 예측 모 델 정확도가 떨어진다. 따라서 여러 종류의 기름을 의미 있게 분류 함으로써 SARA, 밀도, 점도, 황 함량 및 탄화수소 비율과 같은 특 성을 보다 정확하게 예측할 수 있다.

Global Model

Crude Oil MFO Gasoline and Diesel Lubricant Oil

Crude_1 Crude_2 Crude_3 Crude_4

MFO_180 MFO_380

Gasoline Diesel

Classification Error Average: 15%

Classification Error Average: 20%

Classification Error Average: 14%

Classification Error Average: 17%

Tier 1

Tier 2

Tier 3

ClassificationPrediction PLS Model

SARA Density Viscosity Sulfur Content Hydrocarbon ratio

그림 2.2.7 예측모델을 위한 3단계 과정

Dalam dokumen 유지문감식 선진화기법 개발 (Halaman 104-121)