판다스 (Pandas) 핵심 가이드

파이썬 기반의 강력한 데이터 분석 및 조작 라이브러리인 Pandas(판다스)를 학습합니다.

주요 자료구조인 Series와 DataFrame의 생성부터 데이터 선택, 수정, 연산, 파일 입출력까지 실무에 필요한 데이터 정제 기술을 5개의 논리적인 섹션으로 나누어 살펴봅니다.

Pandas Concept Illustration

6.1 판다스 기초

판다스의 핵심 개념과 설치 방법을 배우고, 기본 자료구조인 Series와 DataFrame의 특징을 이해합니다. 데이터 분석 환경을 구축하고 기본기를 다지는 첫 단계입니다.

6.2 자료구조 생성 (Series & DataFrame)

리스트, 딕셔너리, 2차원 행렬 등 다양한 형태의 데이터를 활용하여 Series와 DataFrame을 직접 생성합니다. 시계열 데이터를 위한 날짜 데이터 생성 및 자료형 검사 방법도 익힙니다.

6.3 데이터 참조 및 인덱싱

방대한 데이터 중에서 원하는 행과 열을 정확하고 빠르게 추출하는 방법을 학습합니다. 이름 기반의 loc, 번호 기반의 iloc 및 조건식을 활용한 논리 검색 기법을 다룹니다.

6.4 데이터프레임 정보 확인 및 수정

데이터프레임의 통계 정보와 구조를 점검하고, 새로운 열(Column)이나 행(Row)을 추가하며 데이터를 수정합니다. 정렬과 고급 조건 검색을 통한 실무적인 데이터 전처리 과정을 배웁니다.

6.5 데이터 입출력 및 수집

CSV, Excel 파일 등 외부 데이터를 판다스로 불러오고 처리한 데이터를 다시 파일로 저장하는 방법을 배웁니다. 실제 공공데이터를 예제로 하여 데이터를 정제하고 불러오는 실전을 경험합니다.

6.6 데이터 셋 (Datasets)

다양한 데이터 분석 기법과 머신러닝 알고리즘 실습에 즉시 활용할 수 있는 Pandas와 Seaborn의 주요 내장 데이터 셋들을 소개합니다.

서브목차