상세정보
미리보기
파이썬 라이브러리를 활용한 데이터 분석 (3판)
- 저자
- 웨스 맥키니 저/김영근 역
- 출판사
- 한빛미디어
- 출판일
- 2023-05-01
- 등록일
- 2023-06-23
- 파일포맷
- PDF
- 파일크기
- 8MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
데이터 분석을 배우는 가장 완벽한 방법 파이썬 라이브러리 사용법부터 실제 데이터를 활용한 실습까지 믿고 보는 파이썬 데이터 분석 대표 도서가 3판으로 돌아왔다. 파이썬 판다스 프로젝트 창시자인 웨스 맥키니가 직접 설명하는 파이썬 라이브러리 사용법은 실용적이고 현대적이다. 파이썬과 판다스 최신 버전을 기준으로 내용을 업데이트했고 다양한 사례를 살펴보며 데이터 분석 문제를 효과적으로 해결하는 방법을 알아본다. 판다스, 넘파이, IPython, 맷플롯립, 주피터 등 다양한 파이썬 라이브러리를 소개하고 새로운 기능뿐만 아니라 메모리 사용량을 줄이고 성능을 개선하는 고급 사용법까지 다룬다. 또한 모델링 도구인 statsmodels와 사이킷런 라이브러리도 소개한다. 신생아 이름 통계 자료, 대선 데이터베이스 등 실제 데이터로 실습하며 데이터에 적합한 도구를 선택하고 효과적으로 분석하는 전문가로 거듭나보자.
저자소개
뉴욕에서 활동하는 소프트웨어 개발자이자 기업가다. 2007년 MIT 수학과 학부 과정을 마치고 코네티컷 주 그린위치에 있는 AQR 캐피탈 매니지먼트에서 금융 분석가로 근무했다. 복잡하고 느린 데이터 분석 툴에 실망하여 2008년 파이썬을 배우면서 pandas 프로젝트를 시작했다. 파이썬 데이터 커뮤니티의 활발한 일원이며 데이터 분석, 금융, 통계 계산 애플리케이션에서 파이썬 사용을 독려하고 있다.
창업한 DataPad가 2014년 클라우데라에 인수된 이후 빅데이터 기술에 집중했으며 아파치 소프트웨어 재단의 프로젝트인 아파치 애로우와 아파치 파케이의 Project Management Committee(프로젝트 관리 위원)로 합류했다. 2016년에는 뉴욕에 위치한 투시그마 투자사로 옮겨 오픈소스를 활용해 빠르고 쉬운 데이터 분석 환경을 만드는 데 노력을 기울이고 있다.
목차
CHAPTER 1 시작하기 전에1.1 다루는 내용1.2 데이터 분석에 파이썬을 사용하는 이유1.3 필수 파이썬 라이브러리1.4 설치 및 설정1.5 커뮤니티와 콘퍼런스1.6 이 책을 살펴보는 방법CHAPTER 2 파이썬 기초, Ipython과 주피터 노트북2.1 파이썬 인터프리터2.2. IPython 기초2.3 파이썬 기초2.4 마치며CHAPTER 3 내장 자료구조, 함수, 파일3.1 자료구조와 순차 자료형3.2 함수3.3 파일과 운영체제3.4 마치며CHAPTER 4 넘파이 기본: 배열과 벡터 연산4.1 다차원 배열 객체 ndarray4.2 난수 생성4.3 유니버설 함수: 배열의 각 원소를 빠르게 처리하는 함수4.4 배열을 이용한 배열 기반 프로그래밍4.5 배열 데이터의 파일 입출력4.6 선형대수4.7 계단 오르내리기 예제4.8 마치며CHAPTER 5 판다스 시작하기5.1 판다스 자료구조 소개5.2 핵심 기능5.3 기술 통계 계산과 요약5.4 마치며CHAPTER 6 데이터 로딩과 저장, 파일 형식6.1 텍스트 파일에서 데이터를 읽고 쓰는 법6.2 이진 데이터 형식6.3 웹 API와 함께 사용하기6.4 데이터베이스와 함께 사용하기6.5 마치며CHAPTER 7 데이터 정제 및 준비7.1 누락된 데이터 처리하기7.2 데이터 변형7.3 확장 데이터 유형7.4 문자열 다루기7.5 범주형 데이터7.6 마치며CHAPTER 8 데이터 준비하기: 조인, 병합, 변형8.1 계층적 색인8.2 데이터 합치기8.3 재구성과 피벗8.4 마치며CHAPTER 9 그래프와 시각화9.1 맷플롯립 API 간략하게 살펴보기9.2 판다스에서 시본으로 그래프 그리기9.3 다른 파이썬 시각화 도구9.4 마치며CHAPTER 10 데이터 집계와 그룹 연산10.1 그룹 연산에 대한 고찰10.2 데이터 집계10.3 apply 메서드: 일반적인 분리-적용-병합10.4 그룹 변환과 래핑되지 않은 groupby10.5 피벗 테이블과 교차표10.6 마치며CHAPTER 11 시계열11.1 날짜, 시간 자료형과 도구11.2 시계열 기초11.3 날짜 범위, 빈도, 이동11.4 시간대 다루기11.5 기간과 기간 연산11.6 리샘플링과 빈도 변환11.7 이동창 함수11.8 마치며CHAPTER 12 파이썬 모델링 라이브러리12.1 판다스와 모델 코드의 인터페이스12.2 patsy로 모델 생성하기12.3 statsmodels 소개12.4 사이킷런 소개12.5 마치며CHAPTER 13 데이터 분석 예제13.1 Bitly의 1.USA.gov 데이터13.2 무비렌즈의 영화 평점 데이터13.3 신생아 이름13.4 미국 농무부 영양소 정보13.5 2012년 연방선거관리위원회 데이터베이스13.6 마치며APPENDIX A 고급 넘파이A.1 ndarray 객체 구조A.2 고급 배열 조작 기법A.3 브로드캐스팅A.4 고급 ufunc 사용법A.5 구조화된 배열과 레코드 배열A.6 정렬 더 알아보기A.7 넘바를 이용해 빠른 넘파이 함수 작성하기A.8 고급 배열 입출력A.9 유용한 성능 팁APPENDIX B IPython 시스템 더 알아보기B.1 터미널 키보드 단축키B.2 매직 명령어B.3 명령어 히스토리 사용하기B.4 운영체제와 함께 사용하기B.5 소프트웨어 개발 도구B.6 IPython을 이용한 생산적인 코드 개발 팁B.7 IPython 고급 기능B.8 마치며