책소개
판다스의 기본 자료구조 개념부터 데이터 분석 방법까지!
[개발 환경 구축 가이드], [파이썬 속성 과정], [넘파이 속성 과정], [정규 표현식] 특별 부록 제공
판다스는 파이썬의 데이터 분석 라이브러리로 수백만 행에 대한 작업을 빠르게 수행하고 파이썬 데이터 생태계의 다른 도구와 쉽게 호환되는 장점을 가졌다. 이 책은 마블과 디즈니의 인기 영화, 포켓몬, NBA와 NFL 유명 선수, 넷플릭스 등의 데이터로 판다스 라이브러리를 활용하여 파이썬 기반의 데이터 분석 방법을 소개한다. [개발 환경 구축 가이드], [파이썬 속성 과정], [넘파이 속성 과정], [정규 표현식] 등 알찬 내용의 부록으로 판다스가 부담스러운 초급자도 이 부록을 통해 빠르게 판다스를 시작할 수 있다. 그리고 각 장이 하나의 독립적인 튜토리얼과 같이 구성되어 있어 중급자 이상은 필요한 부분만 골라 학습할 수도 있다. 마지막으로 각 장 마지막에 제공되는 코딩 챌린지를 직접 해보며 실무 경험까지 챙길 수 있다. 처음부터 끝까지 확실하게 판다스를 가이드하는 이 도서로 판다스의 진정한 고수가 되어보자!
목차
PART 1 판다스 기본기 다지기
chapter 1 판다스 소개
_1.1 21세기의 데이터
_1.2 판다스 소개
_1.3 판다스 둘러보기
_1.4 핵심 요약
chapter 2 Series 객체
_2.1 Series의 개요
_2.2 파이썬 객체에서 Series 생성
_2.3 Series의 속성
_2.4 첫 번째 행과 마지막 행 검색
_2.5 수학 연산
_2.6 Series를 파이썬의 내장 함수에 전달
_2.7 코딩 챌린지 : 연습 문제 + 해법
_2.8 핵심 요약
chapter 3 Series 메서드
_3.1 read_csv 함수로 데이터셋 가져오기
_3.2 Series 정렬
_3.3 inplace 매개변수로 Series 덮어쓰기
_3.4 value_counts 메서드로 값 계산하기
_3.5 apply 메서드를 사용하여 모든 Series 값에 대한 함수 호출
_3.6 코딩 챌린지 : 연습 문제 + 해법
_3.7 핵심 요약
chapter 4 DataFrame 객체
_4.1 DataFrame의 개요
_4.2 Series와 DataFrame의 유사점
_4.3 DataFrame 정렬
_4.4 인덱스별 정렬
_4.5 새 인덱스 설정
_4.6 DataFrame에서 열과 행 선택
_4.7 DataFrame에서 행 선택
_4.8 Series에서 값 추출
_4.9 열 또는 행 이름 바꾸기
_4.10 인덱스 재설정
_4.11 코딩 챌린지 : 연습 문제 + 해법
_4.12 핵심 요약
chapter 5 DataFrame 필터링
_5.1 데이터셋과 메모리 최적화
_5.2 단일 조건으로 필터링
_5.3 다중 조건으로 필터링
_5.4 조건별 필터링
_5.5 중복 처리
_5.6 코딩 챌린지 : 연습 문제 + 해법
_5.7 핵심 요약
PART 2 판다스 응용하기
chapter 6 텍스트 데이터 다루기
_6.1 대소문자 변환과 공백
_6.2 문자열 슬라이싱
_6.3 문자열 슬라이싱과 문자 치환
_6.4 불리언 메서드
_6.5 문자열 분할
_6.6 코딩 챌린지 : 연습 문제 + 해법
_6.7 정규 표현식에 대한 참고 사항
_6.8 핵심 요약
chapter 7 MultiIndex DataFrame
_7.1 MultiIndex 객체
_7.2 MultiIndex DataFrame
_7.3 MultiIndex 정렬
_7.4 MultiIndex 행과 열 선택
_7.5 단면 추출
_7.6 인덱스 조작
_7.7 코딩 챌린지 : 연습 문제 + 해법
_7.8 핵심 요약
chapter 8 재구성과 피벗
_8.1 넓은 데이터와 좁은 데이터
_8.2 DataFrame에서 피벗 테이블 생성
_8.3 인덱스 레벨 스택과 언스택
_8.4 데이터셋 피벗 해제
_8.5 값의 목록 확장
_8.6 코딩 챌린지 : 연습 문제 + 해법
_8.7 핵심 요약
chapter 9 GroupBy 객체
_9.1 GroupBy 객체 생성
_9.2 데이터셋에서 GroupBy 객체 생성
_9.3 GroupBy 객체의 속성과 메서드
_9.4 집계 연산
_9.5 사용자 정의 연산
_9.6 다중 열 기반의 그룹화
_9.7 코딩 챌린지 : 연습 문제 + 해법
_9.8 핵심 요약
chapter 10 병합, 조인 및 연결
_10.1 데이터셋 소개
_10.2 데이터셋 결합
_10.3 결합된 DataFrame의 결측값
_10.4 왼쪽 조인
_10.5 내부 조인
_10.6 외부 조인
_10.7 인덱스 레이블 병합
_10.8 코딩 챌린지 : 연습 문제 + 해법
_10.9 핵심 요약
chapter 11 날짜 및 시간 다루기
_11.1 Timestamp 객체
_11.2 다중 Timestamp를 저장하는 DatetimeIndex
_11.3 열 또는 인덱스 값을 날짜/시간으로 변환
_11.4 DatetimeProperties 객체
_11.5 일정 시간의 덧셈과 뺄셈
_11.6 날짜 오프셋
_11.7 Timedelta 객체
_11.8 코딩 챌린지 : 연습 문제 + 해법
_11.9 핵심 요약
chapter 12 가져오기와 내보내기
_12.1 JSON 파일 읽고 쓰기
_12.2 CSV 파일 읽고 쓰기
_12.3 엑셀 통합문서에 읽고 쓰기
_12.4 코딩 챌린지 : 연습 문제 + 해법
_12.5 핵심 요약
chapter 13 판다스 설정
_13.1 판다스 설정 확인과 변경
_13.2 정밀도
_13.3 최대 열 너비
_13.4 절단 임계값
_13.5 설정 컨텍스트
_13.6 핵심 요약
chapter 14 시각화
_14.1 matplotlib 설치
_14.2 선형 차트
_14.3 막대 그래프
_14.4 파이 차트
_14.5 핵심 요약
[특별 부록]
부록 1 설치와 환경 설정(아나콘다, 주피터 노트북 설치, OS 설정)
부록 2 파이썬 속성 과정
부록 3 넘파이 속성 과정
부록 4 faker로 가짜 데이터 생성하기
부록 5 정규 표현식