2.4 스마트폰 센서 기반 현장용 장비 개발
2.4.2. 래즈베리 파이를 이용한 종이 마이크로플루이딕 분석법
라. 개선점 및 2차년도 계획
PC-2: 비록 PC-2가 1%만의 데이타를 설명하고 있지만, PC-2도 PC-1 못지 않은 분류(classification)을 보여주고 있다. 원유의 경우 를 보더라도, Pyreness는 양의 값이 반면, Iranian Heavy와 Basrah Light는 음의 값이고, MFO의 경우 SK-MDO 및 B-A는 양의 값, GS-180 및 GS-380은 음의 값이다. 윤활유와 용매는 모두 양의 값 이었다. 이 부분은 좀 더 많은 데이터를 얻은 후, KIOST의 유류 분 석 결과(특히 GC-MS)와 비교하여 PC-2가 나타내는 물성이 무엇인 지를 알아내는 연구가 필요하다.
PCA 이외의 패턴분석법: PCA는 선형 패턴분석법으로 머신 러 닝에 기반한 비선형 패턴분석법을 적용할 필요가 있다. 이를 위해 Support Vector Machine (SVM) 및 t-distributed Stochastic Neighbor Embedding (t-SNE) 방법을 도입할 필요가 있다. 아래에 기술될 프 로토타입-B는 SVM과 t-SNE 방법에 따라 분석되었다.
2.4.2 래즈베리 파이를 이용한 종이 마이크로플루이딕 분석법
에 (기본적으로 리눅스 기반의 컴퓨터), 소형-저가를 유지하면서 한 장치로 두 가지 분석이 가능할 수 있을 것으로 기대된다.
가. 래즈베리 파이 기반 프로토타입-B 설계
종이 마이크로플루이딕 분석을 위한 래즈베리 파이 기반 프로 토타입 장치는 프로토타입-B라 칭하겠다. 종이 마이크로플루이딕 칩은 트레이에 올려져 장치 내부로 삽입된다. 전면에 있는 작은 문 을 통해 유류 샘플을 도입시킨다. 유류 샘플은 모세관 현상에 따라 채널을 통해 빠른 속도로 흘러가게 되며 (수 초 이내), 실시간 동영 상을 장치 상부에 있는 파이 카메라가 촬영한다(그림 2.4.6). 일반적 인 다른 페이퍼 마이크로플루이딕 칩과 달리 채널 내부는 소수성 이고, 채널 외부를 친수성으로 하여, 유류 흐름이 원활하도록 도모 한다. 또한 혹시라도 존재할 수 있는 해수는 친수성 영역으로 빠져 나감으로써 샘플 정제 효과를 기대할 수 있다. 장치 내부에는 별도 의 LED 광원이 있다(그림 2.4.7).
그림 2.4.6 종이 마이크로플루이딕 분석 개념도
그림 2.4.7 프로토타입-B: 래즈베리 파이 기반 종이 마이크로플루이딕 분석 장치 사진 및 설계도
기본적으로 유류 샘플이 혼합물이기 때문에 종이 마이크로플루 이딕 칩을 통과할 때 크로마토그래피 분리가 이루어지며, 따라서 시간에 따른 유속 변화 또한 단조롭게 감소하기 보다는 좀 더 복 잡한 패턴을 보이게 된다. 그림 2.4.8에 프로토타입-B로 얻어진 3가
지 원유 샘플들의 셀룰로오스 종이 마이크로플루이딕 칩 위에서의 실시간 유속 변화를 나타내었다. 그림 2.4.8b에는 동영상으로부터 얻어진 정지 이미지로 (셀룰로오스) 크로마토그래피 분리를 쉽게 확인할 수 있다.
a. 3가지 유류의 유속변화
b. 유속 변화 촬영 이미지
그림 2.4.8 프로토타입-B로 얻어진 3가지 유류 샘플들의 셀룰로오스 종이 마이크로플루이딕 칩 위에서의 실시간 유속 변화
현재 프로토타입-B는 실험의 편의를 위해 소형 LCD 패널이 아 닌 PC용 모니터에 연결되어 있다. 래즈베리 파이는 외부 모니터 연결을 위한 HDMI 단자를 기본으로 갖추고 있기 때문에 가능하다.
머신 러닝에 기반한 파이썬 코드가 완성되는 대로 GUI를 갖춘 LCD 패널을 추후 추가할 예정이다.
나. 프로토타입-B를 사용한 유류 샘플의 종이 마이크로플루이딕 분 석 결과
KIOST에서 올해 6월에 새로 제공한 10개의 유류 샘플들에 대해 종이 마이크로플루이딕(셀룰로오스, 니트로 셀룰로오스) 칩 분석을 시행하였다. 형광 분광분석법과 마찬가지로 용매(heptane)에 희석하 였다. 정지 이미지들부터 얻은 흐름 길이를 시간으로 나누어 유속 을 구하였으며, 이렇게 얻어진 유속-시간 플롯을 그림 2.4.9 (셀룰 로오스)와 그림 2.4.10 (니트로셀룰로오스)에 보였다. 유의미한 유속 변화는 최초 1초 이내에 관찰되었으며, 샘플이 채널 끝까지 도달하 는 데에는 5초 이내가 소요되었다. 각 유류 샘플 및 종이 타입 마 다 3번 이상 다른 실험을 반복하였다. 종이 마이크로플루이딕 칩은 일회용으로 한 번 사용 후 폐기하였다.
그림 2.4.9 프로토타입-B로 얻어진 10가지 유류 샘플들의 종이 마이크로플루이딕(셀룰로오스 그레이드) 칩 위에서의 유속 프로파 일. 위: 최초 0.1초 동안의 유속 프로파일. 아래: 0.1초 - 0.4초 동안의 유속 프로파일
그림 2.4.10 프로토타입-B로 얻어진 10가지 유류 샘플들의 종이 마이크로플루이딕(니트로셀룰로오스) 칩 위에서의 유속 프로파일, 위: 최초 0.1초 동안의 유속 프로파일. 아래: 0.1초 - 0.4초 동안 의 유속 프로파일
다. PCA 분석 결과
얻어진 유속 프로파일의 모든 데이터 포인트들을 PCA의 입력 데이타로 사용하여 분석하였으며, 그 결과를 그림 2.4.11 (셀룰로오 스)와 그림 2.4.12 (니트로셀룰로오스)에 보였다.
셀룰로오스 종이 마이크로플루이딕 칩 데이타를 먼저 보면, 10 가지 모든 유류 샘플들에 대해 PC-1이 95%의 데이타, PC-2가 4%
로, 전체적으로 보면 99%의 데이타가 두 개의 principal component 로 설명됨을 알 수 있다. 형광 스펙트럼 PCA 분석 결과와 마찬가 지로, Iranian Heavy 및 Basrah Light가 비슷한 경향을 보이고 Pyreness가 매우 다른 경향을 보인다. 원유 이외의 시료를 보면, 첫 그룹에는 MFO 중 GS-180 및 GS-380이, 두 번째 그룹에는 MFO 중 GS-MGO, SK-MDO 및 B-A가, 세 번째 그룹에는 윤활유들이 속 한다. 형광 스펙트럼 PCA 분석에 의한 classification과 매우 유사한 경향을 보임을 알 수 있다.
니트로셀룰로오스 종이 마이크로플루이딕 칩 데이타의 경우, 10 가지 모든 유류 샘플들에 대해 PC-1이 71%의 데이타, PC-2가 16%
로, 전체적으로 87%의 데이타가 두 개의 principal component로 설 명된다. 주목할 만한 점은 PC-2의 기여도가 크게 증가하였다는 점 이다. 전반적은 경향은 셀룰로오스와 비슷하지만, PC-2 기여도의 증가로 인해 각 그룹 내의 개별 샘플들까지도 구별이 가능하졌음 을 알 수 있다. 예를 들어, 셀룰로오스 데이타의 경우 GS-MGO, SK-MDO 및 B-A가 하나의 그룹으로 뭉쳐져 있어 개별적 구별이 어려웠던 반면, 니트로셀룰로오스는 이 세 가지가 구별이 가능하
다.
그림 2.4.11 프로토타입-B로 얻어진 10가지 유류 샘플들의 종이 마이크로플루이딕(셀룰로오스) 칩 위에서의 유속 프로파일 PCA 분 석 결과
그림 2.4.12 프로토타입-B로 얻어진 10가지 유류 샘플들의 종이 마이크로플루이딕(니트로셀룰로오스) 칩 위에서의 유속 프로파일 PCA 분석 결과
PCA로 얻어진 PC-1과 PC-2 값들을 KIOST에서 제공한 유류 샘 플들의 물성 분석표와 비교하였다. 결론부터 말하자면 PC-1은 셀 룰로오스 및 니트로셀룰로오스 종이 마이크로플루이딕 칩 모두 resin content와 강한 상관관계가 있고, PC-2는 니트로셀룰로오스에 한정하여 asphaltene content와 강한 상관관계가 있다. 이를 표 2.4.2와 표 2.4.3에 정리하였다. 셀룰로오스 데이타를 보면 resin content와 PC-1의 상관관계는 매우 명확하다. 따라서 PC-1은 유류 샘플의 resin content를 나타내는 인자임을 알 수 있다. 다만 PC-2 는 제공된 물성 분석표의 어떤 데이타와도 통계적으로 유의미한 상관관계를 찾을 수 없었는데, 이는 셀룰로오스의 PC-2 데이타가 4%만의 데이타를 설명한다는 점을 고려하면 납득할 수 있다. 니트 로셀룰로오스 데이타를 보면 셀룰로오스 데이타와 마찬가지로 PC-1은 resin content와 강한 상관관계가 있다. PC-2는 제공된 물 성 분석표의 인자들 중 asphaltene content와 강한 상관관계가 있 다. 이는 니트로셀룰로오스 종이 마이크로플루이딕 칩 실험으로부 터 얻어진 PC-2 데이타가 16%의 데이타를 설명한다는 점과도 부 합한다. 결론적으로 말하자면, 셀룰로오스보다는 니트로셀룰로오스 가 유류 샘플 분석에 있어 더 많은 정보를 제공한다는 점을 알 수 있는데, 이는 니트로셀룰로오스가 가지고 있는 더 강한 negative polarity에 기인하였을 가능성이 가장 높다. 기공 크기는 셀룰로오 스와 니트로셀룰로오스 모두 10 ㎛ 내외로 (왁스 프린팅 이전 기 준) 유의미한 차이는 없었다.
Sample Resin Content PC-1
MFO: GS-380 25.3 -0.388
MFO: GS-180 19.9 -0.349
Crude: Basrah Light 15.4 -0.226
Crude: Iranian Heavy 12.9 -0.177
LO: SAE-40 (Fresh) 1.6 0.058
MFO: B-A 3.8 0.114
MFO: MGO 1.3 0.178
Crude: Pyreness 8.5 0.234
LO: SAE-40 (Used) 2.9 0.267
MFO: SK-MDO 3.6 0.289
표 2.4.2 PC-1 및 PC-2의 resin content 및 밀도와의 상관관계(셀룰로오스)
Sample Resin
Content PC-1 Sample Asphaltene
Content PC-2 MFO: GS-180 19.9 -30.4 MFO: MGO no data -6.92 MFO: GS-380 25.3 -30.1 Crude:
Basrah Light 13 -5.07 Crude:
Iranian
Heavy 12.9 -29.8 MFO: GS-380 16.6 -4.77 Crude:
Basrah Light 15.4 -22.2 Crude:
Iranian
Heavy 14.7 -3.85
MFO:
SK-MDO 3.6 9.1 MFO: GS-180 18.1 -2.70
MFO: B-A 3.8 11.1 Crude:
Pyreness 0.8 -1.48
MFO: MGO 1.3 12.7 LO: SAE-40
(Fresh) 2.1 -0.37
LO: SAE-40
(Used) 2.9 17.7 MFO: B-A 0.9 5.52
LO: SAE-40
(Fresh) 1.6 18.1 LO: SAE-40
(Used) 6.5 7.33
Crude:
Pyreness 8.5 43.8 MFO:
SK-MDO 0.8 12.30
표 2.4.3 PC-1 및 PC-2의 resin content 및 밀도의 상관관계(셀룰로오스)
라. SVM 및 t-SNE 분석 결과
PCA 분석으로 상당히 성공적인 결과를 얻을 수 있었지만, PCA
는 기본적으로 선형 패턴분석법이며 최근의 머신 러닝 기술에 기 반한 패턴 분석과는 거리가 있다. 따라서 좀 더 발전된 방법인 Support Vector Machine (SVM) 및 t-distributed Stochastic Neighbor Embedding (t-SNE) 방법을 도입하여 프로토타입-B 실험 결과를 다 시 분석하였다.
t-SNE는 PCA와 마찬가지로 dimensionality reduction method이 지만, PCA와 달리 비선형 패턴 분석이고, 확률 분포에 기반하고 있 다 (PCA는 수학적 방법). SVM은 supervised machine learning 방법 으로, 데이타를 주고 반복적인 학습을 통해 패턴을 찾아가는 방법 이다. 그림 2.4.13에 SVM 방법을 도식적으로 보였다. 데이타를 분 류할 수 있는 초평면을 찾고, 이 평면을 나타내는 벡터를 도출시키 는데, 이것이 바로 support vector이다. t-SNE와 SVM 분석 결과를 그림 2.4.14와 그림 2.4.15에 보였다.
그림 2.4.13. Support Vector Machine 방법 개요도 (http://www.slideshare.net/ankitksharma/svm~37753690)
그림 2.4.14 프로토타입-B t-SNE & SVM 분석 결과 (셀룰로오스)
그림 2.4.15 프로토타입-B t-SNE & SVM 분석 결과 (니트로셀룰로오스)
PCR 결과와 비슷한 경향을 보이면서도 에러 바의 크기가 현저 히 감소했음을 알 수 있는데, 이는 PCA와 달리 supervised