본문 바로가기
AI&ML/데이터 분석 개념

머신러닝 프로세스

by ornni 2022. 6. 17.
728x90
반응형

 

머신러닝을 진행하기 전에 전체적인 과정이 어떻게 진행되는지 알아야 계획을 수립하기 좋다

 

1. 문제파악(Problem)

  • 배경 이해
  • 분석 목표 확인
  • 분석 일정 수립
  • 데이터 다운로드

2. 데이터 탑색(EDA)

  • 데이터 탐색(외부 데이터도 탐색 필요)
  • 데이터 이상 유무 확인

- 결측값 파악, 이상치 파악 등

  • 데이터 구조 및 특성 파악

- 데이터 분포, 상관관계 등

 

3. 데이터 전처리(Preprocessing)

  • 모델 학습이 가능한 형태로 데이터를 정리

- 데이터 결합, 결측값 처리, 이상치 처리, 데이터 변환, 범주형 변수 인코딩, 속성 추가 제거 등

 

4. 모델 학습(Modeling)

  • 모델 학습을 위한 훈련 데이터/모델 성능평가를 위한 검증 데이터 분할
  • 알고리즘 선택
  • 모델링
  • hyperparameter 튜닝
  • 성능평가

5. 예측(Solution)

  • 테스트
  • 예측 모델
  • 예측값
  • 제출 파일로 변환
  • 모델의 일반화 성능 확인

 

반응형

'AI&ML > 데이터 분석 개념' 카테고리의 다른 글

이상치 제거 방법  (0) 2024.03.22
결측값의 종류  (0) 2022.09.16
주성분분석  (0) 2022.08.08
지도학습 vs 비지도학습  (0) 2022.07.11
분류성능평가 지표  (0) 2022.07.01