망망대해

  • 홈
  • 태그
  • 방명록

2025/03/11 2

모델 성능 평가와 다중 분류 / 결정 트리의 기본 개념 / 랜덤 포레스트 개념과 구현

로지스틱 회귀 모델을 활용하여 고객 재구매를 예측하는 보고서 쓰기  import pandas as pdimport matplotlib.pyplot as pltimport koreanize_matplotlibimport seaborn as snsfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressionfrom sklearn.metrics import accuracy_score, classification_report, confusion_matrix# 데이터 로드df = pd.read_csv("customer_repurchase.csv")# 할인쿠폰사용여부 재구매여부 관계 시각화pl..

데이터 분석 part 2025.03.11

데이터 전처리, 특징 엔지니어링, 선형회귀, 로지스틱회귀

- 데이터를 머신러닝 모델에 적합한 형태로 변환1) 데이터 정리 및 탐색데이터 로드: pandas, NumPy 등을 활용하여 데이터를 불러옴기초 통계 확인: df.describe(), df.info() 등을 이용하여 데이터 타입과 분포 확인데이터 시각화: matplotlib, seaborn을 사용해 변수 간 관계 파악2) 결측값(Missing Values) 처리(1) 결측값 확인import pandas as pddf.isnull().sum() # 결측값 개수 확인 (2) 결측값 처리 방법 # 삭제(Dropping): 결측값이 적은 경우 해당 행 또는 열 제거df.dropna(inplace=True) # 대체(Imputation): 평균, 중앙값, 최빈값 또는 예측값으로 결측값을 채움df.fillna(d..

데이터 분석 part 2025.03.11
이전
1
다음
더보기
프로필사진

망망대해

  • - 그로스 마케팅 (39)
    • 데이터 분석 part (33)
    • 마케팅(심화) part (6)
    • B (0)
    • 특강 (0)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/03   »
일 월 화 수 목 금 토
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바