AndrewNA

AI 적용 프로세스 - 4. AI 모델링 본문

■ Communications /AI

AI 적용 프로세스 - 4. AI 모델링

N's Story 2025. 4. 16. 23:31
728x90
반응형

AI 적용 프로세스
문제 정의 → 데이터 수집 → 데이터 분석 및 전처리 → AI 모델링 → AI 적용

 

 

AI 모델링

데이터를 이용해 AI가 스스로 패턴을 학습하고 예측, 분류, 추천 등을 할 수 있도록 함

 

 

AI 모델링 절차

1. 문제 유형에 맞는 알고리즘 선택

분류(Classification) 데이터를 클래스(라벨)로 분류 Decision Tree, Random Forest, SVM, XGBoost, Neural Networks
회귀(Regression) 숫자(연속값) 예측 Linear Regression, Ridge, Lasso, Gradient Boosting
군집화(Clustering) 비슷한 데이터를 그룹으로 묶음 K-Means, DBSCAN, GMM
시계열 예측 시간에 따른 값 예측 ARIMA, LSTM, Prophet
자연어 처리(NLP) 텍스트 분석 및 처리 BERT, GPT, RNN, Transformer
이미지 처리 이미지 인식, 분류 CNN, ResNet, YOLO


2. 훈련 데이터로 모델 학습

- 모델이 입력 데이터(X)와 정답(y)을 비교하며 오차(Error) 를 줄여나가는 과정
- 반복적으로 가중치(weight) 를 조정하며 학습
- 학습 시간, 반복 횟수, 최적화 방법(optimizer) 등을 설정


3. 검증 데이터로 성능 측정 및 하이퍼파라미터 튜닝


4. 최종 모델 테스트

정확도(Accuracy) 분류 전체 예측 중 정답 비율
정밀도(Precision) 분류 긍정 예측 중 실제 정답 비율
재현율(Recall) 분류 실제 정답 중 모델이 잡아낸 비율
F1 Score 분류 정밀도와 재현율의 조화 평균
RMSE, MAE 회귀 예측 값과 실제 값의 차이
AUC-ROC 불균형 분류 예측의 민감도와 특이도 평가

5. 모델 저장 및 배포 준비

 

 

AI 모델링 전체 흐름

1. 문제 유형 파악 → 분류? 회귀? 군집?
2. 알고리즘 선택 → SVM, Random Forest, CNN 등
3. 데이터 분할 → 훈련/검증/테스트
4. 모델 학습 → loss 줄이기, 반복 학습
5. 하이퍼파라미터 조정 → 성능 개선
6. 성능 평가 → 정확도, F1 score 등
7. 모델 저장 → 실제 적용 준비

 

 

AI 모델링시 주의사항

과적합 방지 훈련 데이터에만 잘 맞고 새로운 데이터엔 잘 못 맞추는 현상
학습 데이터 품질 잘못된 전처리나 라벨 오류가 학습에 치명적
성능 vs 해석력 딥러닝은 성능은 좋지만 설명력이 떨어질 수 있음
모델 비교 여러 모델을 시도해보고 최적의 모델을 선택해야 함
728x90
반응형
Comments