본문 바로가기

[파이썬]/머신러닝11

[머신러닝] 특성공학을 활용한 다중회귀모델 성능 향상(+예제, 해석, 개념) HTML 삽입 미리보기할 수 없는 소스 이번 글에서는 "다중회귀모델에 특성공학을 적용하여 성능 향상을 도모하는 과정"에 대해 다루어 보고자 한다. 새로운 특성을 도출해 내는 특성공학을 통해 독립변수를 생성하고, 이를 다중회귀모델에 학습시킴으로써 모델 성능의 향상을 확인해 보고자 한다. 차례와 사용 툴 및 라이브러리는 아래와 같다. [차례] 첫 번째: 다중회귀모델과 특성공학 두 번째: (예제) 농어의 길이, 두께, 높이 값을 이용해서, 무게 예측하기 (단, 예제 내부는 크게 다중회귀모델 - 특성공학 - 다중회귀모델 순으로 구성) 세 번째: 다중회귀모델 추가 학습 - 특성공학 적용 후 다중회귀모델 성능 검증 [순서] 1. 데이터 불러오기 2. 데이터 전처리 - (독립변수로 사용할) 원본 데이터를 numpy .. 2023. 12. 24.
[머신러닝] 선형회귀와 다항회귀 모델링의 이론과 실제 적용 방법(+예제) HTML 삽입 미리보기할 수 없는 소스 회귀모델은 다양한 종류가 있지만, 이번 글에서는 "선형회귀모델(LR; Liner Regression Model)"과 "다항회귀모델(PR; Polynomial Regression Model)"에 대해 다루어보려 한다. 선형회귀모델은 단일 독립변수를 기반으로 한 직선을 이용하여 데이터의 선형 관계를 모델링하는 간결한 방법이다. 반면, 다항회귀모델은 독립변수의 거듭제곱을 활용한 곡선을 이용하여 데이터의 비선형 관계를 보다 정교하게 모델링하는 방법이다. 이외에도 다중회귀, 릿지, 라쏘 등과 같은 다양한 회귀모델이 존재하며, 각각의 특성에 따라 적합한 상황에서 활용된다. 또한, 랜덤포레스트나 그레디언트부스트, XGBoost 등의 모델들은 회귀와 분류 문제 모두 적용이 가능하.. 2023. 12. 23.
[머신러닝] K최근접이웃모델(KNN) - 회귀분석의 기초(+ 예제) HTML 삽입 미리보기할 수 없는 소스 본 글에서는 "K최근접이웃모델 - 회귀분석의 기초"에 대한 내용을 다루고자 한다. 'K최근접이웃 모델(KNN)'과 '머신러닝'의 기본적인 내용은 아래를 참조하시라. 2023.12.20 - [[파이썬]/머신러닝] - [머신러닝] K최근접이웃모델(KNN) - 분류분석의 기초 2023.12.20 - [[파이썬]/머신러닝] - [머신러닝] 머신러닝이란? (Machine Learning, 기계학습) 차례와 사용 툴 및 라이브러리는 아래와 같다. [차례] 예제: 생선구분하기 - K최근접이웃모델(회귀) [순서] 데이터 불러오기 데이터 전처리 - 원본 데이터를 numpy 배열로 변환 - 원본 데이터를 훈련 및 테스트 데이터 세트로 분리 - 훈련 및 테스트 데이터의 독립변수를 2차.. 2023. 12. 22.
[머신러닝] K최근접이웃모델(KNN) - 분류분석의 기초 HTML 삽입 미리보기할 수 없는 소스 본 글에서는 "K최근접이웃모델(KNN) - 분류분석의 기초"에 대한 내용을 다룰 것이다. 차례와 사용 툴 및 라이브러리는 아래와 같다. [차례] 첫 번째, K최근접이웃 모델(KNN)의 개념 두 번째, KNN의 작동 원리 세 번째, KNN의 파라메터 네 번째, KNN의 특징 다섯 번째, 예제: 생선구분하기 - K최근접이웃모델(분류) [순서] 데이터 불러오기 데이터 전처리 - 데이터 분포 확인 - 데이터 통합 - 독립변수 및 종속변수 생성 KNN 분류모델 구축 모델 훈련(학습) 모델 성능 평가 - 훈련 데이터 세트의 정확도 확인 모델 예측 및 결과 시각화 - 임의 데이터의 전달을 통한 종속변수 예측 - 산점도 그래프 생성 하이퍼파라메터 튜닝 - (과대적합 해소를 위한).. 2023. 12. 20.
[머신러닝] 머신러닝이란? (Machine Learning, 기계학습) 본 글에서는 머신러닝이 무엇인지 대해 알아보고자 한다. 차례는 아래와 같다. [차례] 첫 번째, 머신러닝이란? 두 번째, 머신러닝을 사용하는 이유는? 세 번째, 머신러닝의 종류(주도학습 - 회귀, 분류 / 비주도학습 - 군집) 네 번째, 머신러닝의 학습 프로세스 다섯 번째, 머신러닝의 학습과정 여섯 번째, 머신러닝의 장점과 단점 · 머신러닝이란? 머신러닝은 컴퓨터가 프로그래밍되지 않아도 학습할 수 있는 능력을 갖추게 하는 인공지능(AI)의 하위 분야이다. 이는 컴퓨터가 데이터를 통해 패턴과 규칙을 학습하고, 이를 바탕으로 미래의 데이터를 예측하거나 분류하는 인공지능(AI)의 한 분야이다. 즉, 학습을 통해 판단을 내리는 능력을 부여하는 기술이다. · 머신러닝을 사용하는 이유는? 머신러닝은 대량의 데이터를.. 2023. 12. 20.