DataFlow
구매 안내
DataFlow
머신러닝 데이터 모델링 소프트웨어
DataFlow는 현장에서 수집된 계측 데이터를 기반으로 한 모델 생성 및 학습을 위해 개발된 머신러닝 알고리즘 데이터 모델링 소프트웨어입니다. DataFlow를 이용하여 플랜트 유입 및 처리수질 예측, 분리막 오염 분석 등 다양한 계측기반 환경분야에 활용할 수 있습니다.
손쉬운 시작
DataFlow는 스프레드시트에서 데이터 조회 및 편집이 가능하며,
간단한 설정만으로 손쉽게 데이터를 분석할 수 있습니다.
엑셀 (xls, xlsx) 또는 텍스트 (csv) 파일 데이터 불러오기
학습 알고리즘 파라미터 기본값 제공을 통한 간편한 모델 학습 수행
학습된 모델 및 예측 결과 저장 / 불러오기
모델별 학습 설정 기본값 최적화
사용자 필요에 따라 알고리즘 파라미터 수정 가능
데이터 전처리 기능 (입 · 출력 항목 중 데이터 변동이 없는 항목, 이상치 제거 등)
학습 및 테스트 데이터 선택 기능 (순차, 무작위, 지정)
다수 모델 동시 학습, 학습 결과 요약 지원
한글 메뉴 및 사용자 지침서 지원
온라인 업데이트 지원
입력항목 선택 최적화
DataFlow는 학습 모델의 다양한 입력항목 조합에 따른 모델 학습결과를 비교하여 최적 모델을 선정합니다.
모델의 입력항목 개수 범위 지정
입력항목의 조합별 모델링 전체 수행
학습결과 성능이 우수한 순으로 결과 표시
성능이 우수한 모델이 많이 포함된 변수 추출
분석결과 복사 및 내보내기
기초 통계 분석
DataFlow는 엑셀형태로 구성된 사용자 데이터의 평균, 분산, 표준편차 등 단변량 통계량 연산과 주성분분석, 상관관계분석 등 다변량 데이터 분석기능을 제공하며, 예측 / 분류 모델의 입력항목을 선정하는데 도움이 되는 사전 분석을 수행할 수 있습니다.
기초통계량 (평균, 분산, 표준편차, 최대값, 최소값, 중간값 등)
주성분 분석 (PCA : Principal Component Analysis) 및 Score 변수 추가
상관관계 분석 (CA : Correlation Analysis)
데이터 변환 (Log, Power, Lead, Lag 등) 변수 추가
다양한 분석 기능 제공
DataFlow는 모델링 목적에 맞게 사용할 수 있도록 다양한 회귀분석, 분류분석, 군집분석 알고리즘을 제공합니다.
각 알고리즘의 설정값은 다양한 사례로부터 도출된 최적값을 사용합니다.
회귀분석 (Regression Analysis)
PLS (Partial Least Squares)
SVM (Support Vector Machine)
MLP (Multi-Layer Perceptron)
MLR (Multivariate Linear Regression)
RANSAC (Random Sample Consensus)
분류분석 (Classification Analysis)
PLS-DA (PLS – Discriminant Analysis)
DT (Decision Tree)
Neural Network
KNN (K-Nearest Neighbor)
Kernel-SVM
군집분석 (Clustering Analysis)
K-Means
Balanced K-Means