전체 글 39

mariaDB에서 여러테이블 다루기(JOIN,UNION), 집계 함수와 그룹화

JOIN, UNION을 쓰는 이유? 하나의 테이블에 데이터를 다 담기란 어렵기 때문. 데이터베이스에서는 데이터를 보다 효율적으로 관리하기 위해 테이블을 분리하여 저장하는 경우가 많다.   JOIN - 여러 테이블의 데이터를 조합하여 원하는 정보를 조회 JOIN 유형포함되는 데이터 설명INNER JOIN두 테이블에서 일치하는 데이터만 반환(공통된 데이터만 표시)교집합을 반환하며, 일치하지 않는 데이터는 제외LEFT JOIN왼쪽 테이블의 모든 데이터 + 오른쪽 테이블에서 일치하는 데이터왼쪽 테이블을 기준으로, 일치하는 데이터가 없으면 NULL 반환RIGHT JOIN오른쪽 테이블의 모든 데이터 + 왼쪽 테이블에서 일치하는 데이터오른쪽 테이블을 기준으로, 일치하는 데이터가 없으면 NULL 반환FULL OUTER..

MariaDB로 SQL 다뤄보기

터미널 접속시 항상 해야 하는일cd /    → 루트 디렉토리로 들어가야 유저 명령을 줄 수 있다. cd var → var 디렉토리로 들어가기그 다음에 mysql -u user1 -p → 기존 계정으로 접속하기  ※ "Access denied for user 'user1'@'localhost'" 뜰때 해결방안1) 해당 디렉토리 들어갔는지 확인 (나의 경우 루트 디렉토리에서는 로그인이 안되고 var 디렉토리 가야 로그인이 되는경우가 있었다. 하지만 루트 디렉토리에서도 될때 있다는게 함정. (뭐지..))2) ALTER USER 'user1'@'localhost' IDENTIFIED BY '새로운_비밀번호';    FLUSH PRIVILEGES;     - 루트계정에서 비밀번호 변경해서 들어가자.3) GRAN..

GCP VM 설정 및 Maria DB설치, SQL 기본 문법

1. GCP 가입 (구글 클라우드 플랫폼) 2. VM Set up (버추얼 머신 셋업)- VM 인스턴스 생성 이름 규칙은 소문자, 숫자, - 만 사용가능이름과 지역은 asia- seoulO/S는 우분투 (20.04LTS)로 설치한다. 네트워킹 탭에서 HTTP 트래픽 허용 / HTTPS 트래픽 허용 클릭. 3. 서버 연결을 위한 SSH 키 생성(KeyGen)- Putty gen을 이용 (window만 지원)SSH Public키와 SSH Private키 받을 수 있음. 4. GCP에 SSH Key 등록- GCP에는 SSH public 키를 등록한다. (복붙)(경로 : Compute Engine > 메타데이터 > SSH키 > SSH키 추가) 5. Filezila 설정 (FTP 클라이언트 (FTP → 서버에 데..

Pandas 데이터 정렬, 필터링, 그룹화, 집계

Pandas 데이터 정렬 (sorting) sort_values() 를 활용한 단일 열(컬럼) 정렬 ascending=True → 오름차순(작은 값부터 큰 값 순서)ascending=False → 내림차순(큰 값부터 작은 값 순서)df_sorted_asc = df.sort_values(by="매출액", ascending=True)print(df_sorted_asc)위의 예시는 sort_values()를 이용하여 '매출액'을 기준으로 오름차순으로 정렬한 것이다.  여러 열 기준 정렬by=["매출액", "클릭수"] → 두 개의 열을 기준으로 정렬ascending=[False, True] → 첫 번째 기준(매출액)은 내림차순, 두 번째 기준(클릭수)은 오름차순 정렬# 먼저 매출액을 내림차순 정렬한 후, 동일한..

Pandas 기초

Pandas 란?Python에서 데이터 분석과 조작을 쉽게 할 수 있도록 하는 오픈소스 라이브러리엑셀과 유사한 데이터 구조 제공. 표 형태의 데이터를 효율적으로 다룰 수 있음.Numpy 기반(C언어로 작성한 라이브러리)이라 고속 연산 가능.데이터 정리, 변환, 분석, 시각화 등의 기능 제공.CSV(DB의 공통 표준), Excel, JSON, SQL, 등 다양한 형식의 데이터 처리 가능.누락된 데이터인 결측값(NaN) 처리 기능 제공. (NaN = Not a Number)다른 라이브러리와 호환성 매우 좋음. Pandas 불러오기import pandas as pd # 일반적으로 'pd'라는 별칭으로 사용  Pandas의 데이터 구조Series : 1차원 데이터 구조 (엑셀의 한 열과 유사)리스트와 유사하지..

함수, 클래스, 모듈과 패키지

함수는 특정작업을 수행하는 코드 블록 기본 구조def 함수이름(매개변수1, 매개변수2, ...): 실행할 코드 return 반환값함수를 정의하는 부분이 있고 사용하는 부분이 따로 있다.def 뒤에 함수이름을 써준다.함수 이름은 함수를 만드는 사람이 임의로 만들 수 있다.함수이름 뒤 괄호안의 매개변수는 이 함수에 입력으로 전달되는 값을 받는 변수이다.return은 함수의 결과값을 리턴하는 명령어.프로그램에서 함수는 입력, 출력이 없을 수 있다.  매개변수와 인수def add(a,b): # a, b는 매개 변수 return a+bprint(add(3,4)) # 3, 4는 인수a,b는 매개변수이며, 3,4는 인수이다.매개변수 - 함수에서 정의되어 사용되는 변수 (=인자, ..

if문(조건문), for문, while문(반복문)

주어진 조건을 판단하여 해당 조건에 맞는 상황을 수행할 때 쓴다.if 조건문에서 '조건문'이란 참과 거짓을 판단하는 문장이다. 비교연산자 x == yx와 y가 같다.x != yx와 y가 같지 않다.x >= yx가 y보다 크거나 같다.x x가 y보다 작거나 같다. x or yx와 y 둘 중 하나만 참이어도 참이다.x and yx와 y 모두 참이어야 참이다.not xx가 거짓이면 참이다.※ x앞에 not이 붙으면 x의 반대  if문 예시mbti = input(f"mbti: ")if mbti == "INTJ": print("전략가.")elif mbti == "INTP": print("발명가.")elif mbti == "ENTJ": print("지도자")elif mbti == "ENTP": ..

파이썬 개념 이해

파이썬 기본 문법 이해코드가 모이면 함수함수가 모이면 라이브러리라이브러리와 라이브러리가 모이면 프레임워크변수 = 메모리 공간파이썬은 메모리 공간의 길이를 명시적으로 표현하지 않아도 컴파일러가 자동으로 부여여러 변수에 한번에 값 할당 가능 (ex. x, y, z = 1, 2, 3)  * 변수변수타입 정수형 - 0을 포함한 +, - 있는 숫자실수형 - 소숫점이 있는 숫자문자열 불리언 - True or False 변수 이름 규칙 영문자(대소문자 구분) , 숫자, 밑줄(_) 로 구성숫자로 시작할 수 없음공백을 포함할 수 없음  f 문자열 포매팅 (가장 쉬운 포매팅 방법)문자열 앞에 f 붙이기name = '홍길동'age = 30f"나의 이름은 {name}입니다. 나이는 {age}입니다."'나의 이름은 홍길동입니다..

그로스 마케팅 개념

그로스 마케팅 개념장기적인 성장과 고객유지를 포함하는 개념기존 마케팅은 경험과 직관을 기반으로 한 반면, 그로스 마케팅은 데이터 분석을 통해 최적의 전략을 도출데이터 수집 > DB에 담고 > 컬럼과의 상관관계 확인 > 시각화 > 자동화 (AI, 머신러닝)자동화 과정에서 마케팅 비용을 줄일 수 있음끊임없는 실험과 최적화  (ex. A/B테스트). 지속적인 테스트와 최적화를 통해 성과 개선 그로스 마케팅 핵심데이터 기반 의사 결정 →  객관적인 사실을 도출시키자.비용 대비 높은 효과고객 유지 및 충성도 강화 → 장기적 관계를 구축하려면 자동화 해야됨. 지속적인 실험과 최적화 (A/B테스트)  - Before / After ▶ 지속적인 테스트 하려면 가설이 필요함.(사람이 개입)머신 러닝과 AI를 통한 자동화..