저작자표시-비영리-변경금지 2.0 대한민국 이용자는 아래의 조건을 따르는 경우에 한하여 자유롭게
l 이 저작물을 복제, 배포, 전송, 전시, 공연 및 방송할 수 있습니다. 다음과 같은 조건을 따라야 합니다:
l 귀하는, 이 저작물의 재이용이나 배포의 경우, 이 저작물에 적용된 이용허락조건 을 명확하게 나타내어야 합니다.
l 저작권자로부터 별도의 허가를 받으면 이러한 조건들은 적용되지 않습니다.
저작권법에 따른 이용자의 권리는 위의 내용에 의하여 영향을 받지 않습니다. 이것은 이용허락규약(Legal Code)을 이해하기 쉽게 요약한 것입니다.
Disclaimer
저작자표시. 귀하는 원저작자를 표시하여야 합니다.
비영리. 귀하는 이 저작물을 영리 목적으로 이용할 수 없습니다.
변경금지. 귀하는 이 저작물을 개작, 변형 또는 가공할 수 없습니다.
공학전문석사학위 연구보고서
정유공장의 공정 분석기에 대한 소프트 센서 모델 연구
Data-Driven Soft Sensor Modeling for Process Analyzer in Refinery
2021년 2월
서울대학교 공학전문대학원
응용공학과 응용공학전공
노 동 주
초 록
정유공장에서는고부가제품의생산량증대,환경규제에대한준수와안전한 작업환경을 유지하기위해다양한공정분석기를사용하고있다.공정분석기는 분석대상의 물성, 성분함량등을측정하고있으며, 측정된 값을참조하여제품 생산에필요한기준값을 유지하기위해공정변수들을조절하고있다.일반적으로 공정분석기는화재,폭발등의대형사고로이어지는경우가드물어이중화구성 을하지않는다. 그결과, 설비이상발생시공정분석기의측정값을모니터링할 수없어생산손실,환경규제미준수사례가 간헐적으로발생하고있는실정이다.
본연구에서는온도,압력,유량등의공정변수데이터를기반으로머신러닝 알고리즘을활용하여공정 분석기에 대한소프트 센서모델을 구현하였다. 공정
분석기별소프트센서모델의예측성능은R2, RMSE, MAE등의평가지표로검
증하였으며,분석기별로우수한성능을발휘한알고리즘을확인하였다.이번연구 로머신러닝알고리즘기반의소프트센서모델은공정분석기와의 이중화구성을 통해현장에서활용할수있는수준임을확인하였다.
주요어: 머신러닝,소프트센서,공정분석기,정유공장 학번: 2019-23311
목 차
I. 서론 . . . 1
1.1 연구배경 . . . 1
1.2 연구목적 . . . 2
1.3 연구보고서구성 . . . 3
II. 이론적배경 . . . 5
2.1 정유공장프로세스 . . . 5
2.1.1 상압증류공정 . . . 6
2.1.2 액화가스회수공정 . . . 6
2.1.3 수첨탈황공정 . . . 7
2.1.4 접촉개질공정 . . . 7
2.1.5 감압증류공정 . . . 7
2.1.6 중질유분해공정. . . 7
2.1.7 유동상촉매분해공정 . . . 8
2.2 공정분석기 . . . 8
2.2.1 물성분석기 . . . 10
2.2.2 전기화학분석기 . . . 10
2.2.3 광학분석기 . . . 10
2.2.4 조성분석기 . . . 11
2.3 머신러닝알고리즘 . . . 11
2.3.1 Random Forest . . . 11
2.3.4 LASSO (Least Absolute Shrinkage and Selection Operator) 13
2.3.5 SVR (Support Vector Regression) . . . 13
2.3.6 mRMR (Minimum Redundancy Maximum Relevance) . . . 14
III. 연구방법 . . . 15
3.1 연구대상선정 . . . 15
3.2 연구방안 . . . 16
3.3 성능평가지표 . . . 17
3.3.1 R2(R square) . . . 17
3.3.2 RMSE (Root Mean Squared Error) . . . 18
3.3.3 MAE (Mean Absolute Error) . . . 18
IV. 소프트센서모델구현결과및분석 . . . 19
4.1 소프트센서모델구현결과 . . . 19
4.1.1 물성분석기 . . . 19
4.1.2 전기화학분석기 . . . 27
4.1.3 광학분석기 . . . 31
4.1.4 조성분석기 . . . 33
4.2 결과분석및고찰. . . 36
V. 결론 . . . 38
5.1 요약및결론 . . . 38
5.2 고찰 . . . 39
5.3 향후계획 . . . 40
참고문헌 . . . 41
Abstract. . . 43
그 림 목 차
그림1. 소프트센서모델활용방안 . . . 3
그림2. 정유공장공정개요. . . 6
그림3. 공정분석기운영현황 . . . 9
그림4. 랜덤포레스트다이어그램 . . . 12
그림5. 연구방안 . . . 16
그림6. 데이터의실제값,예측값,평균값 . . . 17
그림7. 어는점분석기모델학습결과 . . . 20
그림8. 어는점분석기모델검증결과 . . . 21
그림9. 점도분석기모델학습결과 . . . 22
그림10. 점도분석기모델검증결과 . . . 23
그림11. 인화점분석기모델학습결과 . . . 24
그림12. 인화점분석기모델검증결과 . . . 25
그림13. 담점분석기모델학습결과 . . . 26
그림14. 담점분석기모델검증결과 . . . 27
그림15. 산도분석기모델학습결과 . . . 28
그림16. 산도분석기모델검증결과 . . . 29
그림17. 전도도분석기모델학습결과 . . . 30
그림18. 전도도분석기모델검증결과 . . . 31
그림19. 황화수소분석기모델학습결과 . . . 32
그림20. 황화수소분석기모델검증결과 . . . 33
그림21. 가스크로마토그라프분석기모델학습결과 . . . 34
표 목 차
표1. 공정분석기종류 . . . 9
표2. 소프트센서모델 대상선정결과 . . . 15
표3. 어는점분석기모델학습결과 . . . 19
표4. 어는점분석기모델검증결과 . . . 20
표5. 점도분석기모델학습결과 . . . 21
표6. 점도분석기모델검증결과 . . . 22
표7. 인화점분석기모델학습결과 . . . 23
표8. 인화점분석기모델검증결과 . . . 24
표9. 담점분석기모델학습결과 . . . 25
표10. 담점분석기모델검증결과 . . . 26
표11. 산도분석기모델학습결과 . . . 28
표12. 산도분석기모델검증결과 . . . 29
표13. 전도도분석기모델학습결과 . . . 30
표14. 전도도분석기모델검증결과 . . . 31
표15. 황화수소분석기모델학습결과 . . . 32
표16. 황화수소분석기모델검증결과 . . . 33
표17. 가스크로마토그라프분석기모델학습결과 . . . 34
표18. 가스크로마토그라프분석기모델검증결과 . . . 35
제 1 장
서론
1.1 연구 배경
최근 4차 산업혁명의 영향으로 새로운 기술들이 생산 현장에 적용되고 있 으며,또적용하기위해노력하고있다. 4차산업혁명은2016년다보스포럼에서
Klaus Schwab이처음주장[1]하였으며,그핵심은여러가지새로운기술들을통해
현실세계와가상세계를연결할수있다는것이다.즉,가상세계에서인공지능, 빅데이터등의기술을활용하여결과를예측하고,시물레이션을통해현실세계에 적용하기전에충분히검증할수있는것이다.산업현장에서는디지털트윈을구 축하여현장을온라인상에투영하여 여러가지테스트를수행할수있는기술들에 주목하고 있으며, 정유공장에서도이러한기술들을 도입하기 위해 검토 중이다. 또한,공정운전중수집되는데이터를기반으로여러가지분석기법들을활용하 여공정, 설비의 이상징후를미리인지하고신속한조치를수행함으로써사고를 예방할수있는기술들을시험적용하고있다.
정유공장에서사용중인하드웨어분석기를공정분석기(Process Analyzer)라 고하며,공정내에설치되어실시간으로샘플을분석하고측정값을전송하고있다.
공정분석기는고부가제품의생산량증대,환경규제준수,공정과사람의안전을 확보하기위한용도로 사용되고있다.여러가지종류의공정분석기를활용하여 해당유체의물성,조성,화학적특성등을분석하고그측정값을기준치이내로유 지하기위해공정변수들을조절하면서공정을제어하고있는것이다.일반적으로 정유공장에서가동되고있는기계,장치설비중이상발생시화재,폭발등의대형
가동하고있는반면에,공정분석기의경우에는그중요성은 인식하고있으나설비 이상발생시화재,폭발등의대형사고이어지지않는점을 이유로이중화설계 를고려하고있지않다.이러한결과로가동중인공정분석기에문제가발생하면 고부가제품생산을담당하는시스템의제어변수로활용하고있는공정분석기측 정값을사용할수없어생산손실을 유발하는사례가 간헐적으로발생하고있다.
또한,공정분석기의 자체이상발생시에는측정값이급격하게변동되는경우도 있지만,공정분석기센서에이물질이고착되면서측정값이서서히상승또는감소 하는경우에는측정값의 이상여부를즉시인지하기어려워공정분석기측정값에 대한비교대상도필요한실정이다.이에,공정분석기의 이상발생시에도모델의 예측값을모니터링하면서정유공장을안정적으로가동하기 위해공정분석기에 대한소프트센서모델구현에관한연구를진행하고자한다.
1.2 연구 목적
정유공장에서가동중인공정분석기와이중화구성을할수있는소프트센 서모델을구현함으로써공정분석기의갑작스러운이상발생시에도안정적으로 공정운전이 가능할수있도록 할계획이다. 이를 통해,고부가제품의생산량을 지속적으로증대하고환경규제에대한법적사항을준수하며공정과사람의안전 확보에기여하고자한다.
그림1:소프트센서모델활용방안
이에,온도,압력,유량등의공정변수데이터를활용하여기존공정분석기의 측정값을예측하는머신러닝기반의소프트센서모델을구현하여예측성능을검 증하고,검증된소프트센서모델에대해서는공정분석기의측정값과소프트센서 모델의예측값을실시간으로비교하여정상값을선택할수있도록그림1과 같이 구성할계획이다.
1.3 연구 보고서 구성
본연구보고서는총5장으로구성되어있으며,각장에는 다음과 같은내용을 포함하고있다.
제1장은서론으로연구배경과그목적에대해설명하고,연구보고서의전체 적인구성에대해간략하게기술하였다.
제2장은 이론적배경으로정유공장에서제품을생산하는프로세스와정유공
장에서가동중인공정분석기종류에대해설명하였다.또한,본연구에서활용한
제3장은연구방법으로본연구에적합한공정분석기를선정하는과정과구 체적인연구방안에대해설명하였으며,소프트센서모델의성능을평가할지표에 대해기술하였다.
제4장에서는공정분석기종류별소프트센서모델구현결과에대한분석결 과를상세하게기술하고,공정특성,측정원리에따른공정분석기별소프트센서 모델의예측성능차이에대해설명하였다.
제5장은결론으로본연구에대한과정과성과를요약하고,향후연구방향에 대해기술하였다.
제 2 장
이론적 배경
2.1 정유공장 프로세스
정유공장은원유선에서하역된원유를증류,정제하는과정을거쳐여러가지 석유제품과반제품을생산하여출하하는공정과그에필요한유틸리티(Utility)시 설들을포함하고있다.정유공장은크게증류와정제과정으로구분할수있다.증 류는원유를가열한후상압증류탑에투입하여원유를구성하고있는탄화수소의 끓는점차이를이용하여 액화프로판가스,납사,등유,경우,잔사유등으로분리하 는과정을말하며,정제는증류과정에서분리된성분에포함된황등의불순물을 제거하여제품의품질을향상시키는과정이라고볼수있다.정유공장은규격에적 합한다양한제품들을생산하기위해그림2와같이상압증류공정,액화가스회수 공정,수첨탈황공정,접촉개질공정,감압증류공정, 중질유분해공정,중질유 유동상촉매분해공정등여러가지단위공정들로구성되어있다.각단위공정에
서는현장에설치된센서로부터전송되는온도,압력,유량등약2,000개∼3,000
개의공정변수들을모니터링하고제어하면서규격에적합한제품들을생산하고 있다.
그림2:정유공장공정개요
2.1.1 상압 증류 공정
상압증류공정은정유공장의첫번째공정으로여러가지제품을생산하기위 해원유에포함된각기다른성분의물질을끓는점의차이에의해분리하는공정 이다.원유에포함된염분을제거하여부식을감소시키는장치와 원유를가열하는 히터,가열된원유를여러가지반제품으로분리해내는상압증류탑,폐열을회수 하여 에너지효율을향상시키는열교환기등으로구성되어있다.
2.1.2 액화가스 회수 공정
액화가스회수공정은상압증류공정에서생성된가스성분이나접촉개질 공정에서반응후생성된가스성분을처리하여프로판과부탄으로분리하는공정
이다.
2.1.3 수 첨 탈황 공정
수첨탈황공정은촉매와수소를이용하여납사,등유,경유속에포함되어있 는황,질소등의불순물을제거하고,불포화탄화수소를포화시키는공정이다.
2.1.4 접촉 개질 공정
접촉개질공정은수첨탈황공정에서생산된납사에백금촉매와수소를첨가 하여고옥탄가를가지는휘발유의원료유를생산하고,벤젠,톨루엔,자일렌등의 고부가 가치의석유화학제품으로전환시키는공정이다.
2.1.5 감압 증류 공정
감압증류공정은대기압이하의압력조건에서증류하여상압잔사유로부터 가스오일과 감압잔사유를분리시키는공정이다.
2.1.6 중질유 분해 공정
중질유분해공정은감압증류공정에서생산된반제품을촉매존재하에수 소를첨가하여분해하고탈황시켜등유,경유를생산하는공정이다.
2.1.7 유동상 촉매 분해 공정
유동상촉매분해공정은상압잔사유를유동상촉매존재하에 열분해하여 가솔린과질소산화물, 일산화탄소등의발생을감소시키기 위해가솔린 혼합에 사용하는MTBE(Methyl Tertiary Butyl Ether)를생산하는공정이다.
2.2 공정 분석기
다양한 산업 분야에서공장을 안정적으로가동하기 위해 여러 종류의분석 기를활용하고있으며,일반적으로공정분석기(Process Analyzer)라고칭하고있 다[2][3]. 공정 분석기는 실험실에서 수행하는실험의결과값이 아니라, 생산 현 장에설치되어실시간으로 공정샘플을분석하는 설비이다. 공정에서운전중인 유체를별도의배관을통해공정분석기에투입하고,분석기종류별로고유한측 정방식에 따라 분석하고있다. 그림3과 같이그 값을 분산 제어시스템1 (DCS:
Distributed Control System)에 전송하여운전원이모터링할수있도록구성하고 있다.이러한분산제어시스템을활용하여공정분석기측정값을기반으로공정 변수를조절하면서공정을제어하고있다.또한,공정분석기의측정값을 입력변 수로활용하는고급공정 제어2 (APC: Advanced Process Control)시스템[4]은다 변수제어를통해고부가제품의생산량을증대시키기위한연산을수행하고그 결과값을운전원에게제공하여공정변수를제어할수있도록돕고있다.
1분산제어시스템:변수제어,공정감시,데이터처리등각각의다른기능을수행하는산업용
프로세서를네트워크로구성하여공정을제어하는시스템
2고급공정 제어:공정운전변수들간의동특성관계를동시에고려한모델로안정적이고 경제 적인최적운전조건을 유지하도록제어하는 다변수예측제어
그림3:공정분석기운영현황
공정분석기는측정방식에따라물성분석기,전기화학분석기,광학분석기, 조성분석기등4가지로구분하고있으며,분석기별측정항목과종류에대해서는 표1에간략하게정리하였다.
표1:공정분석기종류
구분 측정항목 분석기종류
물성분석기 샘플의물리적특성 점도,인화점,어는점등 전기화학분석기 전압/전류인가시이온반응 산도,전도도,용존산소등 광학분석기 샘플의고유한광학적특성 황화수소,일산화탄소등 조성분석기 샘플내개별성분의함량 가스크로마토그라프등
2.2.1 물성 분석기
물성분석기(Physical Property Analyzer)는샘플의 물리적특성을측정하는 설비이다.대표적인물성분석기로점도(Viscosity)분석기,인화점(Flash Point)분 석기,어는점(Freezing Point)분석기,담점(Cloud Point)분석기등이 있다.물리적 특성 중점도는 유동성을 나타내는 중요한성질 중 하나로중력하에서 어떤 유 체의흐름에대한내부저항을나타내는척도이며,담점은시료를설정된온도로 냉각했을때파라핀성분의결정체가안개와같은형태로나타나기시작하는온도 를 말한다.또한,어는점은시료를냉각했을때생성된탄화수소의결정이시료의 온도를상승시켰을때없어지는온도이며,인화점은시료를가열하여작은불꽃을 유면에접근시켰을때기름증기와공기의혼합기체에인화하는최저의시험온 도를 말한다.
2.2.2 전기화학 분석기
전기화학분석기(Electrochemical Analyzer)는샘플내이온성분과전압, 전 류를가하였을때이온의반응을측정하는설비이다.대표적인전기화학분석기로 산도(pH)분석기,전도도(Conductivity)분석기등이 있다. 산도는용액의수소이 온농도를지수로나타낸것이며,전도도는전류를전도할수있는물질의능력을 말한다.
2.2.3 광학 분석기
광학분석기(Spectroscopic Analyzer)는샘플내특정분자의고유한광학적특 성을측정하는설비이다.광학적특성은측정하고자하는성분이전자기스펙트럼 의 일정영역에서흡수하거나방출하는복사에너지양에의해결정된다.대표적인
광학분석기로황화수소(H2S)분석기,일산화탄소(CO)분석기등이 있다.
2.2.4 조성 분석기
조성분석기(Compositional Analyzer)는샘플내개별성분의함량을측정하는 설비이며,가스크로마토그라프분석기가대표적이다.가스크로마토그라프분석 기는적절한고정상과이동상을 이용하여혼합물내개별성분들이컬럼(Column) 을통과하는이동속도의차이를이용하여분리하고 검출함으로써성분함량을측 정하고있다.
2.3 머신러닝 알고리즘
2.3.1 Random Forest
Random Forest는2001년Leo Breiman에의해소개된알고리즘으로[5],랜덤 노드최적화(Randomized Node Optimization)와배깅(Bagging)을통해상관관계가 없는트리들로포레스트를구성하는방법이다[6] [7].그림4와같이여러개의 의사 결정트리를구성하고데이터는트리를거치면서각트리가분류한결과에서가장 많은점수를 획득한결과가선택되는방식이다. 일부트리에서는과적합이발생 할수있지만수많은트리들을거치면서과적합된예측결과가최종결과에영향을 미치지못하도록예방하고있다. 즉, 과적합될가능성이높은 의사결정 트리의 약점을보완하기위해여러개의 의사결정트리들을학습하는앙상블머신러닝모
델인것이다.선행연구사례를통해측정된공정변수데이터를활용하여Random
Forest를 소프트센서 모델의 예측 알고리즘으로 활용하였다. 또한, 데이터세트 에서분석대상과의상관관계를파악하여변수의중요성에우선순위를부여하는 알고리즘으로도사용하였다.
그림4:랜덤포레스트다이어그램
2.3.2 MARS (Multivariate Adaptive Regression Splines)
MARS는1991년Jerome H. Friedman이도입한회귀분석방법으로파라메타 가없는비모수회귀기법이다[9].비모수회귀는미리결정된형식의예측변수를 선택하지않고데이터로부터파생된정보를활용하는회귀분석방법으로변수간 비선형성과상호작용을 자동적으로모형화하는선형모델이라고할 수있다. 본 연구에서는MARS를소프트센서모델의예측알고리즘으로활용하였다.
2.3.3 OLS (Ordinary Least Squares)
OLS는 가장 기본적인 결정론적 선형 회귀 방법으로 잔차의 제곱합 (RSS:
Residual Sum of Squares)을최소화하는알고리즘이다[10].즉,각각의실제데이터 에서추세선까지의거리를잔차라고하며, 이 잔차의제곱인넓이의합이최소가
되는추세선을찾는모델이다[11].본연구에서는OLS를소프트센서모델의예측 알고리즘으로활용하였다.
2.3.4 LASSO (Least Absolute Shrinkage and Selection Oper- ator)
LASSO는구현하고자하는모델의예측정확도와해석가능성을높이기위해
변수를선택하고정규화과정을수행하는회귀분석기법이다.즉, 선형 회귀에서 가중치에대한절대값의합이최소가되도록하는제약조건을추가한알고리즘이 며, 1986년지구물리학문헌[12]에게시된이후1996년에Robert Tibshirani에의해 소개되면서대중화되었다[13][14].본연구에서는LASSO를소프트센서 모델의 예측알고리즘으로활용하였다.
2.3.5 SVR (Support Vector Regression)
SVM(Support Vector Machine)은분류를 위한기준선을정의하는지도학습 머신러닝모델로분류되지않은새로운점이나타나면경계의어느쪽에속하는지 확인해서분류하는알고리즘이다[14][15]. SVR은SVM의회귀버전으로1996년 H. Drucker, C. J. Burges, L. Kaufman, A. Smola, and V. Vapnik에의해소개되었으
며[16],회귀계수의차수를최소화하면서실제값과예측값의차가적은회귀선을
찾는 알고리즘이다[17]. 선행 연구 사례를 통해 바이오 프로세스에서 공정변수 데이터를활용하여SVR알고리즘기반의소프트센서모델을구현함으로써측정 하지않는변수를실시간으로예측하는데성공한것을확인할수있었다[18]. 본 연구에서도SVR을소프트센서모델의예측알고리즘으로활용하였다.
2.3.6 mRMR (Minimum Redundancy Maximum Relevance)
mRMR은모델이실제값을예측하는데전혀상관없는변수들이 있으면과적 합이발생하고학습시간이증가하게되는문제점을해결하기위해2005년Hanchuan Peng, Fuhui Long, Chris Ding에의해소개된알고리즘이다[19].즉, mRMR은독립 변수중에서중복되거나종속변수와연관성이없는변수를제거하여종속변수를 가장 잘예측할수있는변수들을찾아내는기법이다.본연구에서는2,000∼3,000 개의공정변수중에서공정분석기의측정값과관련성이높은변수를찾아내기위 해병렬화된mRMR앙상블알고리즘을선택하여활용하였다[20].
제 3 장
연구 방법
3.1 연구대상 선정
정유공장에서가동중인공정분석기중에는그측정값을공정운전을 위한 모니터링용도로사용되는분석기와해당측정값을제어변수로사용하여제품규 격에영향을미치거나고부가제품생산에기여하는중요한분석기로구분할수 있다.모니터링용도의공정분석기보다는 측정값을제어변수로사용하고있는 공정분석기가소프트센서개발시활용도가높을것으로판단되어,제어변수로 사용하면서고부가제품생산량증대를위해 사용하고있는공정 분석기를연구 대상으로선정하였다.그중에서데이터의건전성을확보하기위해공정분석기의 가동을정지하는정기보수일정을고려하고,공장에서가용성이높은공정분석기 에우선순위를부여하여최종적으로소프트센서모델연구를위한대상을표2와 같이선정하였다.
표2:소프트센서모델 대상선정결과
구분 공정분석기
물성분석기 점도분석기,인화점분석기,어는점분석기,담점분석기 전기화학분석기 산도분석기,전도도분석기
광학분석기 황화수소분석기
조성분석기 가스크로마토그라프
3.2 연구 방안
공정분석기에대한소프트센서모델을구현하고자그림5와같은방법으로 연구를진행하였다.공정운전중현장센서로부터전송되는아날로그운전변수는 2,000∼3,000개정도이며,소프트센서모델연구를위해 필요한온도,유량,압력
등의운전변수에대해시간당데이터(1개월∼1년)를확보하였다.확보한데이터
중공정사고와 공정 분석기이상으로그 값을 사용할수 없는 기간의데이터를 제거하고,확정된데이터에서모델학습을 위한트레인세트에80%,모델검증을 위한테스트세트에20%를할당하였다. Random Forest, mRMR알고리즘을활용 하여공정변수중공정분석기의측정값과상관관계가높은변수를찾아10개∼20 개이내로선정하였다.선택된변수들은MARS(earth), OLS, SVR, Random Forest,
LASSO등5가지머신러닝알고리즘을활용하여분석기별로소프트센서모델을
구현하고, R2, RMSE, MAE등의평가지표를통해소프트센서모델의예측정확
도를검증하였다.
그림5:연구방안
3.3 성능 평가 지표
모델의 성능을평가하기위해 모델의예측력을나타내는R2와 오차와편차
의크기를나타내는RMSE, MAE등의지표를활용하여소프트센서모델의예측
정확도를검증하였다. 3가지 성능평가지표에대해그림6을참조하여차례대로 설명하였다.
그림6:데이터의실제값,예측값,평균값
3.3.1 R
2(R square)
결정계수인R2는모델의예측력으로모델의예측값이실제값을얼마나잘설 명할수있는지를나타낸다. 0에서1사이의값을가지며, 1에가까울수록예측력이 좋은모델임을 의미한다.
R2=1− Pn
i=1(yi−yˆi)2 Pn
(y −yi)¯ 2 (3.1)
3.3.2 RMSE (Root Mean Squared Error)
RMSE는평균제곱근오차로오차의제곱을모두더한다음데이터크기로
나눈값의제곱근으로나타낼수있으며,입력변수가여러개일때오차를가장최 소화하는예측선을찾을수있다.데이터세트가클경우MSE(Mean Squared Error) 의값이너무커져연산속도를저하시키는것을보완하기위해주로사용하여, 0 에가까울수록예측오차가적은모델임을 의미한다.
RMSE= v u u t 1 N
n
X
i=1
(yi−yˆi)2 (3.2)
3.3.3 MAE (Mean Absolute Error)
MAE는 평균 절대 오차로 오차의 절대값을 모두 더한 다음 데이터 크기로
나눈 값으로나타낼수 있다. 실제값과 예측값이떨어진정도를 쉽게 파악할 수 있으며, 0에가까울수록예측오차가적은모델임을 의미한다.
MAE= v u u t 1 n
n
X
i=1
(yi−yˆi)2 (3.3)
제 4 장
소프트 센서 모델 구현 결과 및 분석
4.1 소프트 센서 모델 구현 결과
4.1.1 물성 분석기
운전변수데이터중 Random Forest, mRMR 알고리즘을 활용하여 공정 분
석기의측정값과 상관관계가 높은변수 13개∼18개를선정하고, Random Forest,
OLS, SVR, LASSO, MARS(earth)등5개머신러닝알고리즘을활용하여소프트
센서모델을구현하였다. 4가지물성분석기에대한소프트센서모델구현결과,
R2기준으로0.694∼0.846수준의예측정확도가나타나는것을확인하였다.
4.1.1.1 어는점 분석기 (Freezing Point Analyzer)
어는점분석기의소프트센서모델에대한 학습결과, Random Forest, MARS(earth), OLS알고리즘의순서로예측정확도가높게나타났다.그중Random Forest의R2
가0.956으로가장높은것을확인할수있었다.
표3:어는점분석기모델학습결과
Algorithm R
2RMSE MAE
Random Forest 0.9563 0.1711 0.1266
MARS(earth) 0.8153 0.3519 0.2775
OLS 0.7567 0.4039 0.3150
LASSO 0.7560 0.4046 0.3148
그림7:어는점분석기모델학습결과
어는점분석기의소프트센서모델에대한검증결과,학습결과와달리LASSO,
OLS, SVR알고리즘순서로예측정확도가높게나타났다.모든알고리즘에서R2
가0.829∼0.884수준으로높은예측정확도를유지하였다.이는,분석대상유체
가반제품으로대부분일관된물성을지니고있으며,공정의온도,압력등의운전 변수와의상관관계가높아서나타난결과로해석된다.
표4:어는점분석기모델검증결과
Algorithm R
2RMSE MAE
LASSO 0.8841 0.5333 0.4098
OLS 0.8837 0.5341 0.4113
SVR 0.8777 0.4576 0.4228
MARS(earth) 0.8440 0.6187 0.4957
Random Forest 0.8288 0.6481 0.4951
그림8:어는점분석기모델검증결과
4.1.1.2 점도 분석기 (Viscosity Analyzer)
점도분석기의소프트센서모델에대한 학습결과, Random Forest, MARS(earth), OLS알고리즘의순서로예측정확도가높게나타났다.그중Random Forest의R2
가0.957로가장높은것을확인할수있었다.
표5:점도분석기모델학습결과
Algorithm R
2RMSE MAE
Random Forest 0.9573 0.0083 0.0060
MARS(earth) 0.7422 0.0203 0.0158
OLS 0.6950 0.0221 0.0158
LASSO 0.6947 0.0221 0.0169
SVR 0.6837 0.0225 0.0167
그림9:점도분석기모델학습결과
점도분석기의소프트센서모델에대한검증결과, Random Forest, MARS(earth),
LASSO알고리즘의순서로예측정확도가높게나타났다.그러나모든알고리즘
의R2가0.694이하로예측정확도가낮게나타나는것을확인할수있었다.점도는
온도,압력의변화에매우민감하고비선형적인데이터특성을가지고있어해당 모델이예측하기에는한계가있었다.
표6:점도분석기모델검증결과
Algorithm R
2RMSE MAE
Random Forest 0.6935 0.0164 0.0137
MARS(earth) 0.5863 0.0191 0.0151
LASSO 0.4361 0.0223 0.0194
OLS 0.4132 0.0228 0.0199
SVR 0.3829 0.0233 0.0202
그림10:점도분석기모델검증결과
4.1.1.3 인화점 분석기 (Flash Point Analyzer)
인화점분석기의소프트센서모델에대한 학습결과, Random Forest, MARS(earth), OLS알고리즘의순서로예측정확도가높게나타났다.그중Random Forest알고 리즘의R2가0.984로가장높은것을확인할수있었다.
표7:인화점분석기모델학습결과
Algorithm R
2RMSE MAE
Random Forest 0.9839 0.1347 0.0922
MARS(earth) 0.8495 0.4118 0.3184
OLS 0.7565 0.5237 0.4098
SVR 0.7511 0.5295 0.4094
LASSO - - -
그림11:인화점분석기모델학습결과
인화점 분석기의 소프트 센서 모델에 대한검증 결과, SVR, OLS, Random
Forest알고리즘의순서로예측정확도가높았으며, SVR 알고리즘의R2가0.788
로가장 잘예측한것으로나타났다.이는,어는점분석기와마찬가지로분석대상 유체가반제품으로대부분일관된물성을지니고있으며,공정의온도,압력등의 운전변수와의상관관계가높아서나타난결과로해석된다.
표8:인화점분석기모델검증결과
Algorithm R
2RMSE MAE
SVR 0.7881 0.6526 0.5053
OLS 0.7638 0.6890 0.5437
Random Forest 0.6372 0.8540 0.6321
MARS(earth) 0.5471 0.9541 0.7286
LASSO - - -
그림12:인화점분석기모델검증결과
4.1.1.4 담점 분석기 (Cloud Point Analyzer)
담점분석기의소프트센서모델에대한 학습결과, Random Forest, MARS(earth), OLS알고리즘의순서로예측정확도가높게나타났다.그중Random Forest알고 리즘의R2가0.997로가장높은것을확인할수있었다.
표9:담점분석기모델학습결과
Algorithm R
2RMSE MAE
Random Forest 0.9967 0.1629 0.1047
MARS(earth) 0.9847 0.3525 0.2703
OLS 0.9728 0.4707 0.3631
SVR - - -
LASSO - - -
그림13:담점분석기모델학습결과
담점분석기의소프트센서모델에대한검증결과, Random Forest알고리즘의
R2가0.846으로가장높게나타났다.특정시점이후공정운전 조건변경으로인해
다른알고리즘의예측정확도가낮아지는경향을보였음에도불구하고Random
Forest의예측정확도는지속적으로유지되는것을확인할수있었다.
표10:담점분석기모델검증결과
Algorithm R
2RMSE MAE
Random Forest 0.8461 0.6442 0.5175
OLS 0.1790 1.7830 1.3197
MARS(earth) - - -
SVR - - -
LASSO - - -
그림14:담점분석기모델검증결과
4.1.2 전기화학 분석기
운전변수데이터중 Random Forest, mRMR 알고리즘을 활용하여 공정 분
석기의측정값과 상관관계가 높은 변수 19개를선정하고, Random Forest, OLS,
SVR, LASSO, MARS(earth) 등5개머신러닝알고리즘을활용하여소프트센서
모델을구현하였다. 2가지전기화학분석기에대한소프트센서모델구현결과,
R2가0.567이하로예측정확도가낮게나타나는것을확인하였다.
4.1.2.1 산도 분석기 (pH Analyzer)
산도분석기의소프트센서모델에대한 학습결과, Random Forest, OLS알고 리즘의순서로예측정확도가높게나타났다.그중Random Forest알고리즘의R2
표11:산도분석기모델학습결과
Algorithm R
2RMSE MAE
Random Forest 0.9900 0.0145 0.0089
OLS 0.9205 0.0407 0.0303
SVR - - -
LASSO - - -
MARS(earth) - - -
그림15:산도분석기모델학습결과
산도분석기의소프트센서모델에대한검증결과,학습결과와마찬가지로
Random Forest, OLS알고리즘의순서로예측정확도가높게나타났다.그러나모
든알고리즘에서R2가0.464이하로예측정확도가낮게나타나는것을확인할수 있었다.이는,해당공정특성상 상시발생하고있는외란의영향으로인해실제pH 값이수시로변동하고있기때문이며,외란의영향에대한정보없이해당모델이 이러한변동까지예측하기에는한계가있었다.
표12:산도분석기모델검증결과
Algorithm R
2RMSE MAE
Random Forest 0.4635 0.0262 0.0204
OLS 0.3601 0.0286 0.0223
MARS(earth) - - -
SVR - - -
LASSO - - -
그림16:산도분석기모델검증결과
4.1.2.2 전도도 분석기 (Conductivity Analyzer)
전도도분석기의소프트센서모델에대한 학습결과, Random Forest, MARS(earth), OLS알고리즘의순서로예측정확도가높게나타났다.그중Random Forest알고 리즘의R2가0.997로가장높은것을확인할수있었다.
표13:전도도분석기모델학습결과
Algorithm R
2RMSE MAE
Random Forest 0.9974 0.0396 0.0237
MARS(earth) 0.7943 0.3509 0.2536
OLS 0.7106 0.4163 0.2961
LASSO 0.7106 0.4163 0.2961
SVR 0.6745 0.4415 0.2843
그림17:전도도분석기모델학습결과
전도도분석기의소프트센서모델에대한검증결과,학습결과와달리SVR,
LASSO, OLS알고리즘의순서로예측정확도가높게나타났다.그러나모든알고
리즘에서R2가0.567이하로예측정확도가낮게나타나는것을확인할수있었다.
이는,해당공정특성상 상시다양한유체가유입되고있어해당유체의전도도 값이수시로변동하고있기때문이며,해당모델이 이러한변동까지예측하기에는 한계가있었다.
표14:전도도분석기모델검증결과
Algorithm R
2RMSE MAE
SVR 0.5674 1.6675 1.3656
LASSO 0.5470 1.7063 1.3735
OLS 0.5459 1.7084 1.3747
Random Forest 0.2161 2.2446 1.7963
MARS(earth) - - -
그림18:전도도분석기모델검증결과
4.1.3 광학 분석기
운전변수데이터중Random Forest, mRMR알고리즘을활용하여공정분석
기의측정값과상관관계가높은변수20개를선정하고, Random Forest, OLS, SVR,
LASSO, MARS(earth)등5개머신러닝알고리즘을활용하여소프트센서모델을
구현하였다.광학분석기에대한소프트센서모델구현결과,모든알고리즘에서
4.1.3.1 황화수소 분석기 (H
2S Analyzer)
황화수소분석기의소프트센서모델에대한 학습결과, Random Forest, MARS(earth), OLS알고리즘의순서로예측정확도가높게나타났다.그중Random Forest알고
리즘의R2가0.991로가장높은것을확인할수있었다.
표15:황화수소분석기모델학습결과
Algorithm R
2RMSE MAE
Random Forest 0.9910 0.2306 0.1149
MARS(earth) 0.8974 0.7780 0.5228
OLS 0.8681 0.8820 0.5712
LASSO 0.8584 0.9141 0.5981
SVR 0.8497 0.9427 0.5532
그림19:황화수소분석기모델학습결과
황화수소분석기의소프트센서모델에대한검증결과,모든알고리즘에서
R2가0.207이하로예측정확도가낮게나타나는것을확인할수있었다.이는,원
료변화,운전 조건변경등외란의영향으로인해실제황화수소의값이수시로
변동하고있기때문이며,해당모델이 이러한변화까지도예측하기에는한계가있 었다.
표16:황화수소분석기모델검증결과
Algorithm R
2RMSE MAE
OLS 0.2072 3.7069 2.7004
SVR 0.1311 4.6190 3.6139
Random Forest - - -
MARS(earth) - - -
LASSO - - -
그림20:황화수소분석기모델검증결과
4.1.4 조성 분석기
운전변수데이터중Random Forest, mRMR알고리즘을활용하여공정분석
구현하였다.조성분석기에대한소프트센서모델구현결과, R2가0.954로예측 정확도가 가장높게나타나는것을확인하였다.
4.1.4.1 가스 크로마토그라프 분석기 (Gas Chromatograph An- alyzer)
가스크로마토그라프분석기의소프트센서모델에대한 학습결과, MARS(earth),
OLS, LASSO알고리즘의순서로정확도가높게나타났다. 그중MARS(earth)의
R2가0.985로가장높은것을확인할수있었다.
표17:가스크로마토그라프분석기모델학습결과
Algorithm R
2RMSE MAE
MARS(earth) 0.9854 0.0006 0.0004
OLS 0.9735 0.0008 0.0006
LASSO 0.9733 0.0008 0.0006
SVR 0.9727 0.0008 0.0006
Random Forest - - -
그림21:가스크로마토그라프분석기모델학습결과
가스크로마토그라프분석기의소프트센서모델에대한검증결과OLS, LASSO, SVR알고리즘의순서로예측정확도가높게나타났다.모든알고리즘에서R2가
0.945∼0.954수준으로높은예측정확도를유지하였다.이는,특정배관의 유체
가증가하면그유체에포함된해당성분함량이증가하면서특정유체의증가량과 성분함량과의상관관계가높아서나타난결과로해석된다.
표18:가스크로마토그라프분석기모델검증결과
Algorithm R
2RMSE MAE
OLS 0.9544 0.0007 0.0005
LASSO 0.9540 0.0007 0.0005
SVR 0.9493 0.0007 0.0006
MARS(earth) 0.9450 0.0007 0.0006
Random Forest - - -
그림22:가스크로마토그라프분석기모델검증결과
4.2 결과 분석 및 고찰
소프트센서모델구현결과,물성분석기와조성분석기에대한모델의예측 정확도가높게나타났으며, 전기화학 분석기와광학분석기에대한모델의예측 정확도가낮게나타나는것을확인할수있었다.
물성분석기에대한소프트센서모델은R2가0.694∼0.846으로비교적높은 예측정확도를나타냈다.이는,물성분석기의분석대상이제품또는반제품으로 일관된물성을지니고 오염원도거의없으며, 물성분석기의측정값은열역학적 으로공정의온도,압력등공정 운전변수와의상관 관계가 높기때문에나타난 결과이다.석유화학공장설계시에도물성치와 운전변수와의상관관계를고려한 시뮬레이션을통해공정운전 조건을최적화하고있는것을확인하였다[21].이에, 인화점,어는점,담점분석기에대한소프트센서모델은R2가0.788∼0.846으로 해당공정분석기의측정값과의비교함으로써경향성을파악하고,공정분석기의 이상여부를진단할수있을것으로판단된다.
조성분석기에대한소프트센서모델은R2가0.954로가장높은예측정확도
를나타냈다. 특정유체의 유입이조성변화에민감하게반응하는것을공정에서 확인하였으며,이러한변수와의높은상관관계로인해모델의예측정확도가높게 나타날수있었다. 이에,해당소프트 센서모델은 기존공정분석기와의 이중화 구성을통해공정분석기의측정값과실시간으로비교함으로써공정분석기의 이 상여부를감지하고, 공정가동중공정분석기이상발생시에는공정분석기를 대체할수도있을것으로판단된다.
전기화학분석기에대한소프트센서모델은R2가0.567이하로낮은예측정
확도를나타냈다.해당분석기의분석대상은대부분폐수,냉각수,응축수등으로 공정외부영향을많이받고있다.폐수의경우에는여러공정에서유입되기때문 에 어떤 수준의오염도를가지고폐수장으로 유입되는지예측하기어렵고, 냉각 수와응축수의경우에는케미컬이현장에서자동으로제어되고있어주입시점과
주입량이공정변수에반영되지않고있다.또한,이온화경향이 있는유체특성상 이온화된물질의농도정보가필요하나운전변수에는해당정보가없었다.따라서, 전기화학분석기의경우에는공정외란과데이터의부족으로인해 해당분석기의 측정값을예측하기에는한계가있었다.
광학분석기에대한소프트센서모델은R2가0.207로가장낮은예측정확도
를나타냈다. 대부분의광학분석기는배출량의법규충족을 위해굴뚝에설치되 어있으며,배기가스의성분,먼지농도등을측정함에따라공정운전변수보다는 연료에함유된황이나질소의함량에더욱민감하게반응하는경향이 있었다.따라 서,불균일혼합물인분석대상은공정변수와의상관관계가미흡하여소프트센서 모델로측정값을예측하기에는한계가있었다.
이번연구에서제시한소프트센서 모델은모든공정분석기에서우수한성 능을발휘하지는못했다. 대부분의공정분석기는 공정변수와의열역학적상관 관계가높고,특정유체의함량등에민감한선형데이터특성으로알고리즘별로 비슷한예측정확도를나타냈다. 그러나, 담점분석기,점도분석기,산도분석기
에서는Random Forest 알고리즘의예측정확도가특별하게높게나타나는것을
확인하였다.이에,담점분석기,점도분석기,산도분석기에대한데이터분석결 과,측정값이원유의성상변화에따라변하고있었으며,다양한유체가혼합되는 곳에설치되는특성으로인해분석대상과 공정변수가비선형데이터특성을가 지고있는것을확인할수있었다.기본적으로결정트리에기반한Random Forest 알고리즘은비선형데이터의분류와 예측에우수한성능을 유지하는장점을가지 고있는데,이러한데이터특성으로인해담점분석기,점도분석기,산도분석기에
대한소프트센서모델에서Random Forest알고리즘이가장높은예측정확도를
나타낼수있었다.
제 5 장
결론
5.1 요약 및 결론
정유공장에서고부가제품의생산량증대,환경규제에대한법적준수,설비 와사람의안전을확보하기위해사용중인공정분석기는화재, 폭발 등의대형 사고로이어지는경우가드물어이중화설계를고려하지않고있다.그결과,설비 이상발생시고부가제품생산량저하또는환경규제미준수사례가 간헐적으 로발생하고있어공정분석기를이중화로구성하고자소프트센서 모델에대한 연구를진행하하였다.가동중인공정분석기중측정값을제어변수로활용하고 있는공정분석기를대상으로소프트센서 모델구현에필요한온도,유량, 압력 등의운전변수데이터를확보하고,공정사고와공정분석기이상으로그값을사 용할수없는기간의데이터는제거하였다. 2,000∼3,000개의공정변수데이터중
Random Forest, mRMR알고리즘을활용하여공정분석기의측정값과상관관계가
높은변수를찾아내고, MARS(earth), OLS, SVR, Random Forest, LASSO등5가 지머신러닝알고리즘을활용하여소프트센서모델을구현하였다.구현한모델에
대해서는R2, RMSE, MAE등의평가지표를통해예측정확도를검증하였다.그
결과,물성분석기와조성분석기에대한소프트센서모델의예측정확도는현장 적용이가능한수준으로나타났으며,전기화학분석기와광학분석기에대한소프 트센서모델의예측정확도는낮게나타나추가연구가필요할것으로판단된다.
5.2 고찰
본연구를통해정유공장에서사용하고있는공정분석기에대한소프트센서 모델구현이가능하고,일부공정분석기에대해서는현장적용도가능한것을확 인하였다.특히,물성분석기와조성분석기에대한소프트센서모델의경우에는 해당분석대상이최종 제품또는반제품으로일관된물성을지니고있으며,열역학 적으로공정의온도,압력등의운전변수와의상관관계가높아모델의예측성능이 우수하게나타나는것을확인할수있었다.공정설계시에도이를고려하여공정 운전 조건을설정하고있었다[21].이에,기존공정분석기측정값과소프트센서예 측값의 이중화구성을통해두값을동시에모니터링함으로써,공정분석기의 이상 여부를인지할수있을것으로판단된다.이온화경향이 있는전기화학분석기와광 학분석기의분석대상은대부분 불균일혼합물로운전변수와의상관관계가낮아 예측성능도저조하게나타나는것을확인하였다.이번연구에서활용한운전변수 만으로는정보가부족하고, 해당공정분석기가설치된공정특성으로발생하는 외란의영향을변수화하기는어려웠다.물성분석기와조성분석기에대한소프트 센서모델은향후공정에적용하여효과 검증이필요하며,전기화학분석기와광학 분석기에대한소프트센서모델은공정특성으로인한외란의영향과물질의농도 정보를포함한추가연구가필요할것으로판단된다.
5.3 향후 계획
이번연구로물성분석기와조성분석기에대한소프트센서모델의예측성 능은검증되었으며,기존공정분석기와의 이중화구성을통해산업현장에적용할 수있을것으로기대한다. 반면에전기화학분석기와광학분석기에대한소프트 센서모델에대해서는공정에서발생하는외란의영향과부족한정보로인해모델 구현에한계가있었다.향후에는기존연구에서부족했던정보를추가하여변수화 함으로써 전기화학분석기와 광학분석기에 대한소프트 센서 모델구현이가능 한지확인하고자한다.또한,딥러닝을활용한소프트센서모델을구현하여공정 분석기별소프트센서모델을최적화하는연구를진행할계획이다.
참고 문헌
[1] K. Schwab, “The fourth industrial revolution: what it means, how to respond.
2016,” inWorld Economic Forum, 2017.
[2] P. E. Mix,The design and application of process analyzer systems, vol. 70. John Wiley & Sons, 1984.
[3] K. J. Clevett,Process analyzer technology. Wiley-Interscience, 1986.
[4] M. J. Willis and M. T. Tham, “Advanced process control,”Department of Chem- ical and Process Engineering, University of Newcastle Upon Tyne, UK, 1994.
[5] L. Breiman, “Random forests,”Machine learning, vol. 45, no. 1, pp. 5–32, 2001.
[6] L. Breiman, “Bagging predictors,”Machine learning, vol. 24, no. 2, pp. 123–
140, 1996.
[7] T. K. Ho, “The random subspace method for constructing decision forests,”
IEEE transactions on pattern analysis and machine intelligence, vol. 20, no. 8, pp. 832–844, 1998.
[8] L. F. Napier and C. Aldrich, “An isamill™ soft sensor based on random forests and principal component analysis,”IFAC-PapersOnLine, vol. 50, no. 1, pp. 1175–1180, 2017.
[9] J. H. Friedman, “Multivariate adaptive regression splines,”The annals of statis- tics, pp. 1–67, 1991.
[10] J. M. Andrade-Garda, A. Carlosena-Zubieta, R. M. Soto-Ferreiro, J. Teran- Baamonde, and M. Thompson, “Classical linear regression by the least squares method,”Basic Chemometric Techniques in Atomic Spectroscopy, pp. 52–122, 2013.
[11] C. Dismuke and R. Lindrooth, “Ordinary least squares,”Methods and Designs
[12] F. Santosa and W. W. Symes, “Linear inversion of band-limited reflection seis- mograms,”SIAM Journal on Scientific and Statistical Computing, vol. 7, no. 4, pp. 1307–1330, 1986.
[13] R. Tibshirani, “Regression shrinkage and selection via the lasso,”Journal of the Royal Statistical Society: Series B (Methodological), vol. 58, no. 1, pp. 267–
288, 1996.
[14] R. Tibshirani, “The lasso method for variable selection in the cox model,”Statis- tics in medicine, vol. 16, no. 4, pp. 385–395, 1997.
[15] C. Cortes and V. Vapnik, “Support-vector networks,”Machine learning, vol. 20, no. 3, pp. 273–297, 1995.
[16] H. Drucker, C. J. Burges, L. Kaufman, A. Smola, and V. Vapnik, “Support vec- tor regression machines,”Advances in neural information processing systems, vol. 9, pp. 155–161, 1996.
[17] A. J. Smola and B. Sch¨olkopf, “A tutorial on support vector regression,”Statis- tics and computing, vol. 14, no. 3, pp. 199–222, 2004.
[18] K. Desai, Y. Badhe, S. S. Tambe, and B. D. Kulkarni, “Soft-sensor develop- ment for fed-batch bioreactors using support vector regression,” Biochemical Engineering Journal, vol. 27, no. 3, pp. 225–239, 2006.
[19] H. Peng, F. Long, and C. Ding, “Feature selection based on mutual information criteria of max-dependency, max-relevance, and min-redundancy,”IEEE Trans- actions on pattern analysis and machine intelligence, vol. 27, no. 8, pp. 1226–
1238, 2005.
[20] N. De Jay, S. Papillon-Cavanagh, C. Olsen, N. El-Hachem, G. Bontempi, and B. Haibe-Kains, “mrmre: an r package for parallelized mrmr ensemble feature selection,”Bioinformatics, vol. 29, no. 18, pp. 2365–2368, 2013.
[21] A.-F. Chang, K. Pashikanti, and Y. A. Liu, Refinery engineering: Integrated process modeling and optimization. John Wiley & Sons, 2013.
Abstract
Data-Driven Soft Sensor Modeling for Process Analyzer in Refinery
Dongjoo Noh Graduate School of Engineering Practice Seoul National University
A variety of process analyzers are used in refineries to increase the production of high value-added products, comply with environmental regulations, and maintain a safe working environment. The process analyzer measures the physical properties and ingredients of the analysis target. It controls process variables to keep the mea- sured values within the standard required for product production. In general, process analyzers rarely lead to large-scale accidents such as fires and explosions, so they are not in a redundant configuration. Therefore, as it is impossible to monitor the process analyzer’s measuring values in the event of an abnormality, the loss of production and non-compliance with environmental regulations intermittently occur.
This study attempted to develop a soft sensor model for process analyzers us- ing machine learning algorithms based on process variables data, including temper- ature, pressure and flow rate. It examined the soft sensor model performance with R2, RMSE, and MAE. It also found the best-fit algorithm for each process analyzer.
The results clearly indicated that the machine learning-based soft sensor model can
be used in fields through a redundant configuration with process analyzers.
Keywords : Machine Learning, Soft Sensor, Process Analyzer, Refinery Student Number : 2019-23311