본문 바로가기

pandas6

[Numpy] pandas와 numpy 호환 목차1. 개요2. 내용2-1. Pandas 객체와 Numpy 배열 간 변환Series를 Numpy 배열로 변환 (.values)DataFrame의 열을 Numpy 배열로 변환DataFrame 전체를 Numpy 배열로 변환 (.values)2-2. Numpy로 Pandas 데이터 처리하기Numpy의 유니버설 함수 활용Numpy의 집계 함수 활용Numpy의 브로드캐스팅 활용2-3. 효율적인 데이터 분석을 위한 전략벡터화 연산의 중요성Numpy를 활용한 조건부 처리3. 결론 1. 개요Pandas는 강력한 데이터 분석 및 조작 라이브러리로서, 테이블 형태의 데이터를 효율적으로 다룰 수 있는 DataFrame과 1차원 데이터를 위한 Series 객체를 제공합니다. 반면, Numpy는 수치 계산에 특화된 라이브러리.. 2025. 5. 19.
[pandas] Pandas 피벗(pivot)과 피벗 테이블(pivot_table) 완전 정복 목차1. 개요2. 내용2-1. pivot()의 기본 사용법2-2. pivot_table()의 기본 사용법2-3. aggfunc로 다양한 집계 적용2-4. 다중 인덱스와 열 이름 처리2-5. pivot_table vs groupby 비교3. 결론1. 개요데이터를 넓은 형식으로 재구조화할 때 자주 사용하는 도구가 pivot()과 pivot_table()입니다. 이 함수들은 데이터를 요약하고 가독성을 높이며, 분석을 위한 전처리에서 매우 중요한 역할을 합니다. 특히 피벗 테이블은 다중 집계, 결측값 처리 등에서 강력한 기능을 제공합니다.2. 내용2-1. pivot()의 기본 사용법pivot은 행-열 값을 기준으로 데이터를 재구성하며, 중복된 인덱스가 있으면 에러가 발생합니다.import pandas as pd.. 2025. 5. 13.
[pandas] Pandas 그룹화(GroupBy) 기초 완전정복 목차1. 개요2. 내용2-1. groupby() 기본 사용법2-2. 그룹별 집계 함수 적용2-3. 여러 열 기준 그룹화2-4. 그룹 객체 반복 처리2-5. 그룹별 transform과 filter3. 결론1. 개요Pandas의 groupby()는 데이터를 카테고리별로 묶고, 집계/변환/필터링 등의 연산을 효율적으로 수행할 수 있게 해주는 핵심 함수입니다. 데이터 분석에서 특정 기준으로 집계하는 일이 매우 많기 때문에 groupby()는 반드시 숙지해야 할 기능입니다.이번 글에서는 그룹화의 기본 개념부터 집계 함수, 다중 그룹화, transform과 filter까지 실제 예제를 통해 단계적으로 설명합니다.2. 내용2-1. groupby() 기본 사용법기본적으로 groupby('열이름') 형태로 그룹을 생성한.. 2025. 5. 9.
[pandas] 정렬과 순위_sort_values, sort_index, rank 완전정복 목차1. 개요2. 내용2-1. sort_values(): 열 기준 정렬2-2. sort_index(): 인덱스 기준 정렬2-3. rank(): 순위 매기기2-4. 여러 조건 정렬 실전 예제2-5. 정렬 옵션 비교 및 팁3. 결론1. 개요Pandas의 강력한 기능 중 하나는 정렬 및 순위 매기기입니다. 데이터프레임의 값을 기준으로 정렬하거나, 인덱스를 기준으로 정렬하며, 특정 열을 기준으로 순위를 매기는 작업은 데이터 분석의 기본입니다. 본 글에서는 sort_values(), sort_index(), rank() 세 가지 핵심 함수를 중심으로 실전 예제와 함께 정리합니다.2. 내용2-1. sort_values(): 열 기준 정렬sort_values()는 특정 열의 값을 기준으로 오름차순 또는 내림차순 정렬.. 2025. 5. 8.
[Pandas] 데이터 필터링과 조건 선택 함수 정리 (boolean indexing, query, isin 등) 목차1. 개요2. 내용2-1. Boolean 인덱싱2-2. query()2-3. isin()2-4. between()2-5. duplicated()3. 결론1. 개요데이터 분석에서 가장 중요한 작업 중 하나는 조건에 맞는 데이터를 선별해내는 것입니다. Pandas는 다양한 방식으로 조건 필터링을 지원하며, 이번 글에서는 Boolean 인덱싱, query(), isin(), between(), duplicated() 등을 정리해봅니다.2. 내용2-1. Boolean 인덱싱Boolean 인덱싱은 조건식을 만족하는 행만 선택하는 가장 기본적인 방법입니다. df[조건] 형식으로 작성합니다.import pandas as pddf = pd.DataFrame({ 'Name': ['Alice', 'Bob', 'C.. 2025. 4. 16.
[Pandas] 데이터프레임 생성 및 확인 함수 정리 (pd.DataFrame, head(), info(), tail(), describe()) 목차1. 개요2. 내용2-1. pd.DataFrame2-2. head()2-3. tail()2-4. info()2-5. describe()3. 결론1. 개요Pandas는 파이썬에서 데이터 분석을 수행할 때 가장 많이 사용하는 라이브러리 중 하나입니다. 이번 글에서는 Pandas의 핵심 객체인 DataFrame을 생성하고, 데이터를 확인하는 데 유용한 기본 함수들을 소개합니다.2. 내용2-1. pd.DataFramepd.DataFrame은 Pandas의 기본 구조로, 행과 열로 구성된 2차원 데이터 구조입니다. 딕셔너리, 리스트, 배열 등을 이용해 만들 수 있습니다.import pandas as pddata = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [.. 2025. 4. 15.