통계기반 정삼투 모듈 모델의 적용성 검토

목적:실규모 정삼투(FO) 공정 설계는 막모듈의 배열을 통해 이루어지므로, 막모듈의 성능을 예측할 수 있는 FO 모듈 모델의 역할은 필수적이다. 기존 연구를 통해 정확도가 90%가 넘는 FO 모듈 모델을 이론적 배경 및 모듈 형상을 반영하는 fitting process를 거쳐 만들었지만 계산 속도가 최대 수백초까지 걸리는 단점이 있어서, 이를 개선하기 위한 통계 기반 FO 모듈 모델을 개발하고 적용성을 평가하였다. 방법:FO 공정 관련 이론적 배경을 전혀 고려하지 않고 모델 개발에 사용된 데이터(train data)의 예측력을 최대...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Daehan hwan'gyeong gonghag hoeji 2019, 41(11), , pp.611-618
Hauptverfasser: 전종민(Jongmin Jeon), 김누리(Noori Kim), 최준영(Joon Young Choi), 김수한(Suhan Kim)
Format: Artikel
Sprache:kor
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:목적:실규모 정삼투(FO) 공정 설계는 막모듈의 배열을 통해 이루어지므로, 막모듈의 성능을 예측할 수 있는 FO 모듈 모델의 역할은 필수적이다. 기존 연구를 통해 정확도가 90%가 넘는 FO 모듈 모델을 이론적 배경 및 모듈 형상을 반영하는 fitting process를 거쳐 만들었지만 계산 속도가 최대 수백초까지 걸리는 단점이 있어서, 이를 개선하기 위한 통계 기반 FO 모듈 모델을 개발하고 적용성을 평가하였다. 방법:FO 공정 관련 이론적 배경을 전혀 고려하지 않고 모델 개발에 사용된 데이터(train data)의 예측력을 최대로 하도록 하는 통계 기반 모델의 단점은 외부 데이터(test data)에 대한 예측력이 떨어지는 과적합이므로, 본 연구에서는 이론적 배경을 무시하고 만들어진 4개의 회귀 모델에 대해 예측정확도를 분석한 후, FO 공정의 유입수와 유출수의 유량, 압력, 농도값으로 각각 구성된 116개의 데이터셋에서 train data의 수를 10개, 30개, 50개, 70개로 하였을 때 train data와 test data의 오차를 비교하는 방법으로 과적합도를 분석하였다. 결과 및 토의:회귀 모델의 예측력이 증가함에 따라 test data의 오차는 10.16%에서 8.43%로 감소했는데(train data의 수가 70인 경우), 이론적 모델의 경우(10.13%)와 비슷하거나 낮은 값을 보였다. 예측력이 가장 좋은 모델을 사용한 경우, train data 수가 10에서 70까지 증가하는 동안 test data의 오차가 12.99%에서 8.43%로 줄어들었고, train data의 오차(6.38-7.72%)와 비슷해지는 경향을 보였다. 결론:통계 기반 FO 모듈 모델의 적용성을 평가했을 때, train data의 수가 많고 모델의 예측력이 높을수록 과적합도가 낮다는 결론을 얻었다. 특히, 기존 연구에서 도출된 이론 기반 모델과 비교했을 때도 test data의 오차율이 낮았기 때문에, 과적합도로 인한 적용성 문제는 전혀 없다고 볼 수 있다. Objectives:Since full-scale forward osmosis (FO) process designs are based on the arrangement of membrane FO modules, the FO module model to predict the performance of the modules is necessary. Through a previous study, a FO module model based on the fundamentals of FO process accompanied by a fitting process to reflect the module geometry was developed, but it has a drawback of long calculation time. Thus, a statistics-based model was developed to shorten the calculation time. Methods:The drawback of statistical-based models is a ‘overfitting problem’, which means the accuracy of the model becomes poor if it is applied to the data not used to train the model. In this study, four regression models without considering the fundamentals of FO process were developed and trained with the datasets of 10, 30, 50, and 70 randomly selected from the total 116 datasets which consisted of the flow, pressure, and concentration ​​of influent and effluent from the FO module. The model prediction errors with the datasets used and not used to develop the model (train data and test data, respectively) were compared to estimate overfitting tendency. Results and Discussion:When 70 data were selected as test data, the model prediction error with test data decreases from 10.16 to 8.43% as the model accuracy increases. These errors are similar to or less than the error (10.13%) of the theoretical model. When the most accurate model is tested, the prediction error with test data decreases from 12.99 to 8
ISSN:1225-5025
2383-7810
DOI:10.4491/KSEE.2019.41.11.611