Machine Learning & Deep Learning

머신러닝 모델 선택

유방울 2023. 9. 10. 21:03

모델 선택시 데이터셋에 대한 이해를 바탕으로 모델을 선택할 수 있습니다.
먼저 문제 정의에 따라서 가지치기를 할 수 있습니다. 말한 것 처럼 출력 대상이 범주형이면 분류, 연속형이면 회귀 알고리즘을 선택합니다.
예를 들어서, 생존했는지 생존하지 않았는지 예측하는 것이 해결하고자 하는 문제라면 분류 알고리즘을 사용해야 합니다. Logistic regression, Decision tree, random forest 등 을 사용할 수 있습니다. 이 때 생존과 생존하지 않음은 2가지로 이진 분류 문제이기 때문에 Logistic regression를 선택할 수 있습니다.

 

이런 과정을 통해 모델 선택을 할지라도 사실 모델 성능이 100% 좋다고 장담할 수 없습니다ㅜㅠ. 따라서 여러 알고리즘으로 모델을 학습한 후 성능을 비교한 후 최종 모델을 선택해야 합니다. 

 

또한, 말처럼 데이터셋에 대한 이해를 한 것을 바탕으로 모델을 선택하는 것은 쉬운 일은 아닙니다. 알고리즘에 대한 이해도 필요하기 때문입니다ㅎ.. 그래서 성능이 좋다고 유명한 알고리즘을 학습 하기도 합니다.
 
앙상블 알고리즘으로 회귀교육세션 때 배울 내용이지만 간략하게만 설명하자면, 성능이 좋은 여러 모델을 합치는 것입니다. 대표적으로 random forest가 있습니다. 또한 최근에 캐글 경연대회에서 우승으로 많이 쓰인 모델인 XGBoost와 LightGBM 도 있습니다. 

그리고 부차적인건데 autoML로 자동으로 모델링을 해주고 성능을 한 번에 비교할 수 있습니다. 이를 통해서 초반에 어떤 모델을 선택하면 좋을지 필터링 할 수 있습니다. 혹은 autoML을 통해 모델을 생성할 수도 있습니다. 여유가 있으면 한 번 찾아보고 사용해봐도 될 거 같습니다!
아래는 실습 할 수 있는 코드가 있는 티스토리 링크입니다.

 

 

https://gem1n1.tistory.com/13

 

[쉽게 설명하는 머신러닝] 머신러닝 문제 정의, 알고리즘 선택 방법

이전 포스팅 2019/05/25 - [[IT] 공부하는 개발자/Machine Learning] - [쉽게 설명하는 머신러닝] 개념 정리 [쉽게 설명하는 머신러닝] 개념 정리 머신러닝 개념정리 1. 기계학습이란 2. 인간의 경험학습 3.

gem1n1.tistory.com

 

https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=dnjswns2280&logNo=221605634614 

 

변수 타입별 머신러닝 모델 선택

모델/변수타입 추천 1. 다중회귀모델 이진형, 정수형, 연속형(매우적합), 정수형+연속형 2. 다항회귀모델 ...

blog.naver.com

 

https://m.blog.naver.com/bootpay/221177720632

 

당신이 알아두어야 할 10가지 머신러닝 알고리즘

우리는 빠르게 변하는 세상에 살고 있습니다. 이런 빠른 혁신을 이뤄낼 수 있었던 것은 컴퓨터와 그 활용에...

blog.naver.com

 

https://second.kyeonblog.co.kr/%EB%A7%A4%ED%98%B9%EC%A0%81%EC%9D%B8-%EB%A8%B8%EC%8B%A0-%EB%9F%AC%EB%8B%9D-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98/#13_%EB%AA%A8%EB%8D%B8_%EC%84%A0%ED%83%9D

 

매혹적인 머신 러닝 알고리즘 - 후타쯔노 블로그

머신 러닝은 데이터를 기반으로 패턴을 학습하고 예측하는 인공 지능 분야입니다. 이를 위해 다양한 개념과 알고리즘이 사용됩니다. 이번 포스트에서는 머신 러닝의 관련 개념들에 대해 소개하

second.kyeonblog.co.kr

 

https://ds1222.tistory.com/entry/AutoML-%EC%82%AC%EC%9A%A9%EB%B2%95-PYTHON

 

파이썬을 이용한 AutoML 사용법

오늘은 파이썬에서 편리하게 사용할 수 있는 머신러닝 기법인 AutoML에 대해서 알아보자!!!! AutoML은 한마디로 정의하면, 머신러닝 기법들의 성능을 한번에 비교하고 최적의 기법을 선택할 수 있다

ds1222.tistory.com