2025/02/09 4

Pandas 데이터 정렬, 필터링, 그룹화, 집계

Pandas 데이터 정렬 (sorting) sort_values() 를 활용한 단일 열(컬럼) 정렬 ascending=True → 오름차순(작은 값부터 큰 값 순서)ascending=False → 내림차순(큰 값부터 작은 값 순서)df_sorted_asc = df.sort_values(by="매출액", ascending=True)print(df_sorted_asc)위의 예시는 sort_values()를 이용하여 '매출액'을 기준으로 오름차순으로 정렬한 것이다.  여러 열 기준 정렬by=["매출액", "클릭수"] → 두 개의 열을 기준으로 정렬ascending=[False, True] → 첫 번째 기준(매출액)은 내림차순, 두 번째 기준(클릭수)은 오름차순 정렬# 먼저 매출액을 내림차순 정렬한 후, 동일한..

Pandas 기초

Pandas 란?Python에서 데이터 분석과 조작을 쉽게 할 수 있도록 하는 오픈소스 라이브러리엑셀과 유사한 데이터 구조 제공. 표 형태의 데이터를 효율적으로 다룰 수 있음.Numpy 기반(C언어로 작성한 라이브러리)이라 고속 연산 가능.데이터 정리, 변환, 분석, 시각화 등의 기능 제공.CSV(DB의 공통 표준), Excel, JSON, SQL, 등 다양한 형식의 데이터 처리 가능.누락된 데이터인 결측값(NaN) 처리 기능 제공. (NaN = Not a Number)다른 라이브러리와 호환성 매우 좋음. Pandas 불러오기import pandas as pd # 일반적으로 'pd'라는 별칭으로 사용  Pandas의 데이터 구조Series : 1차원 데이터 구조 (엑셀의 한 열과 유사)리스트와 유사하지..

함수, 클래스, 모듈과 패키지

함수는 특정작업을 수행하는 코드 블록 기본 구조def 함수이름(매개변수1, 매개변수2, ...): 실행할 코드 return 반환값함수를 정의하는 부분이 있고 사용하는 부분이 따로 있다.def 뒤에 함수이름을 써준다.함수 이름은 함수를 만드는 사람이 임의로 만들 수 있다.함수이름 뒤 괄호안의 매개변수는 이 함수에 입력으로 전달되는 값을 받는 변수이다.return은 함수의 결과값을 리턴하는 명령어.프로그램에서 함수는 입력, 출력이 없을 수 있다.  매개변수와 인수def add(a,b): # a, b는 매개 변수 return a+bprint(add(3,4)) # 3, 4는 인수a,b는 매개변수이며, 3,4는 인수이다.매개변수 - 함수에서 정의되어 사용되는 변수 (=인자, ..

if문(조건문), for문, while문(반복문)

주어진 조건을 판단하여 해당 조건에 맞는 상황을 수행할 때 쓴다.if 조건문에서 '조건문'이란 참과 거짓을 판단하는 문장이다. 비교연산자 x == yx와 y가 같다.x != yx와 y가 같지 않다.x >= yx가 y보다 크거나 같다.x x가 y보다 작거나 같다. x or yx와 y 둘 중 하나만 참이어도 참이다.x and yx와 y 모두 참이어야 참이다.not xx가 거짓이면 참이다.※ x앞에 not이 붙으면 x의 반대  if문 예시mbti = input(f"mbti: ")if mbti == "INTJ": print("전략가.")elif mbti == "INTP": print("발명가.")elif mbti == "ENTJ": print("지도자")elif mbti == "ENTP": ..