2025/02/25 2

상관관계의 이해, 상관분석 / 웹시스템 이용한 마케팅 데이터 획득 이해

상관관계란?- 한 변수의 변화가 다른 변수의 변화와 어떤 관계가 있는지 나타냄- 한 변수가 증가할 때 다른 변수가 증가하거나 감소하는 패턴이 있는지 분석 상관계수- 상관관계의 정도는 상관계수로 표현- 가장 많이 사용되는 상관계수는 피어슨 상관계수(기타 스피어만 상관계수, 켄달의 타우 가 있음)- 독립변수가 많을 때 추리는 용도로 좋음 상관계수 해석r = 1 : 완전한 양의 상관관계 (한 변수가 증가할 때 다른변수도 완전히 비례하여 증가)0.7 ≤ r 0.3 ≤ r r = 0 : 상관관계 없음 (두 변수 간 관계가 없음)- 0.3 ≤  r - 0.7 ≤  r r = - 1 : 완전한 음의 상관관계 (한 변수가 증가할 때 다른변수는 완전히 반비례하여 감소)  상관계수 사용시 주의사항- 반드시 인과관계가 있는..

회귀분석 (단순회귀분석과 다중회귀분석)

지난 수업 예제 코드 ( 광고비와 판매량 사이의 관계를 선형회귀분석으로 분석)# statsmodels - 통계분석 라이브러리# numpy - 숫자를 다루기 위한 라이브러리import statsmodels.api as smimport numpy as np# 독립변수(광고비)와 종속변수(판매량) 예제 데이터# np.array()를 써서 데이터를 숫자로 다루기 쉽게 한다.X = np.array([1, 2, 3, 4, 5]) # 광고비(독립변수)Y = np.array([3, 6, 7, 8, 11]) # 판매량(종속변수)# 상수항 추가# 상수항(절편)(b)을 추가하는 코드# sm.OLS() 같은 함수는 절편을 따로 수동으로 추가해줘야 함.X = sm.add_constant(X)# 선형 회귀 모델 학습# sm...