상세정보
미리보기
Do it! 데이터 분석을 위한 판다스 입문
- 저자
- 다니엘 첸 저/김영하 역
- 출판사
- 이지스퍼블리싱
- 출판일
- 2018-09-28
- 등록일
- 2021-08-11
- 파일포맷
- PDF
- 파일크기
- 0
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
파이썬 기초 문법만 알아도 OK!
테슬라 주식, 우버 택시 등 86개의 예제로 판다스의 기본을 빠르게 익혀보자!
전 세계 최대 규모의 파이썬 과학 콘퍼런스 사이파이(SciPy)에서 ‘판다스 튜토리얼 강의’를 진행하고 있는 저자의 손을 잡고 데이터 분석과 판다스에 빠르게 입문하세요. 파이썬 기초 문법만 알아도 괜찮습니다. 저자의 강의 노하우가 담긴 86개의 예제로 직접 키보드 잡고 배워 보세요. 테슬라 주식, 우버 택시, 빌보드 차트 등의 현실 데이터를 직접 분석하다 보면 쉽고 빠르게 판다스의 기본기가 완성됩니다.
※ 이 책은 PDF 북이므로 화면이 작은 단말기(스마트폰)에서는 보기 불편합니다. ※
저자소개
데이터 분석 분야에서 활동 중인 저자는 2016년부터 매년 사이파이(SciPy)라는 국제적인 파이썬 커뮤니티에서 판다스 관련 강의를 맡아 진행하고 있다. 현재는 소프트웨어 카펜트리(Software Carpentry)에서 데이터 분석 언어인 R을 강의하고 있다. 한마디로 말하면 데이터 분석 언어인 판다스와 R을 모두 사랑하는 데이터 분석가이다. 현실 세계의 수많은 데이터를 분석하기 위해 반드시 알아야 하는 판다스 라이브러리를 초보자도 쉽게 이해할 수 있도록 그 동안의 강의 경험을 모두 녹여 이 책에 담았다. 86개의 실습 예제를 통해 현실 데이터를 직접 분석하며 판다스의 실무 기본기를 탄탄하게 익혀보자.
목차
01장 판다스 실습 환경 준비하기
01-1 아나콘다 설치
아나콘다가 잘 설치되었는지 확인하기
01-2 판다스 실습 준비
실습 프로젝트 준비하고 프로젝트 폴더 살펴보기
01-3 안녕? 주피터 노트북!
01-4 파이썬 패키지 관리자 ─ pip
02장 판다스 시작하기
02-1 데이터 집합 불러오기
데이터 분석의 시작은 데이터 불러오기부터
시리즈와 데이터프레임
판다스와 파이썬 자료형 비교
02-2 데이터 추출하기
열 단위 데이터 추출하기
행 단위 데이터 추출하기
인덱스와 행 번호 개념 알아보기
loc, iloc 속성 자유자재로 사용하기
02-3 기초적인 통계 계산하기
02-4 그래프 그리기
03장 판다스 데이터프레임과 시리즈
03-1 나만의 데이터 만들기
03-2 시리즈 다루기 ― 기초
시리즈 속성과 메서드 사용하기 ─ index, values, keys
시리즈의 기초 통계 메서드 사용하기
03-3 시리즈 다루기 ― 응용
시리즈와 불린 추출
시리즈와 브로드캐스팅
03-4 데이터프레임 다루기
03-5 시리즈와 데이터프레임의 데이터 처리하기
03-6 데이터 저장하고 불러오기
04장 그래프 그리기
04-1 데이터 시각화가 필요한 이유
앤스콤 4분할 그래프 살펴보기
앤스콤 데이터 집합 모두 사용해 그래프 만들기
04-2 matplotlib 라이브러리 자유자재로 사용하기
기초 그래프 그리기
다변량 그래프 그리기
04-3 seaborn 라이브러리 자유자재로 사용하기
04-4 데이터프레임과 시리즈로 그래프 그리기
04-5 seaborn 라이브러리로 그래프 스타일 설정하기
05장 데이터 연결하기
05-1 분석하기 좋은 데이터
분석하기 좋은 데이터란?
05-2 데이터 연결 기초
행이 1개라도 반드시 데이터프레임에 담아 연결해야 합니다
다양한 방법으로 데이터 연결하기
05-3 데이터 연결 마무리
06장 누락값 처리하기
06-1 누락값이란?
누락값과 누락값 확인하기
누락값이 생기는 이유
누락값의 개수
누락값 처리하기
누락값이 포함된 데이터 계산하기
07장 깔끔한 데이터
07-1 열과 피벗
넓은 데이터
07-2 열 이름 관리하기
하나의 열이 여러 의미를 가지고 있는 경우
split 메서드로 열 이름 분리하기
07-3 여러 열을 하나로 정리하기
07-4 중복 데이터 처리하기
07-5 대용량 데이터 처리하기
여러 개로 나누어진 데이터 불러오기
08장 판다스 자료형
08-1 자료형 다루기
자료형 변환하기
잘못 입력한 데이터 처리하기
08-2 카테고리 자료형
09장 문자열 처리하기
09-1 문자열 다루기
파이썬과 문자열
인덱스로 문자열 추출하기
전체 문자열 추출하기
09-2 문자열 메서드
09-3 문자열 포매팅
문자열 포매팅하기
숫자 데이터 포매팅하기
% 연산자로 포매팅하기
09-4 정규식으로 문자열 처리에 날개 달기
정규식이란?
10장 apply 메서드 활용
10-1 간단한 함수 만들기
10-2 apply 메서드 사용하기 ─ 기초
10-3 apply 메서드 사용하기 ─ 고급
11장 그룹 연산
11-1 데이터 집계
데이터 집계하기 ─ groupby 메서드
분할-반영-결합 과정 살펴보기 ─ groupby 메서드
groupby 메서드와 함께 사용하는 집계 메서드
agg 메서드로 사용자 함수와 groupby 메서드 조합하기
여러 개의 집계 메서드 한 번에 사용하기
11-2 데이터 변환
표준점수 계산하기
누락값을 평균값으로 처리하기
11-3 데이터 필터링
11-4 그룹 오브젝트
그룹 오브젝트 살펴보기
한 번에 그룹 오브젝트 계산하기
그룹 오브젝트 활용하기
여러 열을 사용해 그룹 오브젝트 만들고 계산하기
12장 시계열 데이터
12-1 datetime 오브젝트
datetime 오브젝트로 변환하기 ─ to_datetime 메서드
시간 형식 지정자
datetime 오브젝트로 변환하기 ─ read_csv 메서드
datetime 오브젝트에서 날짜 정보 추출하기
dt 접근자 사용하기
12-2 사례별 시계열 데이터 계산하기
datetime 오브젝트와 인덱스 ─ DatetimeIndex
시간 간격과 인덱스 ─ TimedeltaIndex
시간 범위와 인덱스
시간 범위 수정하고 데이터 밀어내기 ─ shift 메서드