책소개
중국에서 각종 우수 도서상을 수상하고 베스트셀러로 판매되고 있는, 데이터 분석을 위한 최고의 한 권!이 책은 데이터 분석의 전체 프로세스를 체계적으로 학습할 수 있는 실습서이자 데이터 분석가에게는 꼭 필요한 실전 도구로서 만들어졌습니다. 어떠한 데이터이든지 처리하고 정리하여 일목요연하게 파악하기 쉽도록 만들어주는 최고의 툴인 엑셀과 파이썬을, 둘 중 어느 것도 놓치지 않고 두 도구의 장점만을 취해 데이터 처리와 분석을 효과적으로 쉽게 해낼 수 있도록 해줍니다. 이 책과 함께라면 데이터를 다루는 그 어떤 업무에서도 빠르고 효율적으로 성과를 낼 수 있을 것입니다.
저자소개
인터넷 회사에서 데이터 분석가로 일하고 있으며, 파이썬, SQL, 엑셀을 능숙하게 다룰 수 있어서 데이터 분석뿐만 아니라 머신러닝 분야에서도 두각을 드러내고 있다. 지식 나누기를 좋아하고, 데이터 과학자로서 평생 공부하고, 실천하며, 나누는 삶을 소망하고 있다. 개인 위챗 계정에서 데이터 분석, 머신러닝, 웹 크롤링, 파이썬 프로그래밍에 도움이 되는 정보를 공유하고 있다.
목차
CHAPTER 01 데이터 분석 기초 31.1 데이터 분석이란? 31.2 데이터 분석의 필요성 31.3 데이터 분석의 분석 대상은 무엇인가? 51.4 데이터 분석의 일반적인 프로세스 81.5 데이터 분석 도구: 엑셀과 파이썬 11CHAPTER 02 냄비 확인하기 ― 파이썬 기초 지식 152.1 파이썬이란? 152.2 파이썬 설치 162.3 Jupyter Notebook 소개 212.4 기본 개념 302.5 문자열 342.6 데이터 구조-리스트 382.7 데이터 구조-딕셔너리(dict) 432.8 데이터 구조-튜플 452.9 연산자 472.10 반복문 482.11 조건문 502.12 함수 532.13 고급 기능 562.14 모듈 58CHAPTER 03 Pandas 데이터 구조 593.1 Series 데이터 구조 593.2 DataFrame 테이블 형식의 데이터 구조 61CHAPTER 04 원재료 준비하기 ― 데이터 소스 가져오기 664.1 외부 데이터 가져오기 664.2 데이터 생성하기 774.34.3 데이터 파악하기 77CHAPTER 05 쌀과 야채 씻기 ― 데이터 전처리 835.1 결측값 처리 835.2 중복값 처리 895.3 이상값 검측과 처리 925.4 데이터 유형 변환 945.5 인덱스 설정 97CHAPTER 06 요리와 재료 선택하기 ― 데이터 선별 1036.1 열 선택하기 1036.2 행 선택하기 1066.3 행과 열 동시 선택하기 109CHAPTER 07 재료 손질하기 ― 데이터 조작 1137.1 데이터 바꾸기 1137.2 데이터 정렬하기 1187.3 데이터 순위 확인하기 1227.4 데이터 삭제하기 1257.5 숫자 카운트하기 1287.6 유일한 데이터 가져오기(중복값을 하나로 표현하기) 1307.7 데이터 찾기 1307.8 구간 분할하기 1327.9 새로운 행 또는 열 삽입하기 1357.10 행과 열 바꾸기 1367.11 인덱스 재구성하기 1387.12 테이블의 길이와 너비 전환하기 1397.13 apply( )와 applymap( ) 함수 142CHAPTER 08 요리 시작하기 ― 데이터 연산 1448.1 산술 연산 1448.2 비교 연산 1468.3 일괄 연산 1468.4 상관성 계산하기 155CHAPTER 09 요리 타이머 ― 시계열 1579.1 현재 시간 가져오기 1579.2 날짜와 시간 형식 지정하기 1599.3 문자열과 시간 형식 상호 변환하기 1619.4 시간 인덱스 1619.5 시간 계산하기 165CHAPTER 10 요리 분류 ― 데이터 그룹화/피벗 테이블 16810.1 데이터 그룹화 16810.2 데이터 피벗 테이블 174CHAPTER 11 디저트 과일 접시 준비 ― 다중 테이블 결합 17911.1 테이블의 가로 결합 17911.2 테이블의 수직 결합 187CHAPTER 12 상 차리기 ― 결과 도출 19112.1 .xlsx 파일 내보내기 19112.2 .csv 파일 내보내기 19512.3 파일을 여러 시트로 내보내기 198CHAPTER 13 요리 가지런히 놓기 ― 데이터 시각화 19913.1 데이터 시각화란? 19913.2 데이터 시각화의 기본 과정 19913.3 그래프의 기본 구성 요소 20013.4 엑셀과 파이썬의 시각화 20213.5 캔버스와 좌표계 생성하기 20313.6 좌표축 설정하기 20913.7 다른 그래프 형식 설정하기 21613.8 일반적인 그래프 그리기 22613.9 그래프 조합하기 25113.10 이중축 그래프 생성 25513.11 그래프 스타일 설정 257CHAPTER 14 대표적인 데이터 분석 사례 26314.1 파이썬을 사용한 보고서 자동화 26314.2 이메일 자동으로 보내기 26814.3 슈퍼마켓 체인점 관련 데이터 분석 27114.4 은행 관련 데이터 분석 275CHAPTER 15 NumPy 배열 28015.1 NumPy 소개 28015.2 NumPy 배열 생성 28115.3 NumPy 배열의 기본 속성 28615.4 NumPy 배열의 데이터 선택 28815.5 NumPy 배열의 데이터 전처리 29215.6 NumPy 배열 재구성 29315.7 NumPy 배열 병합 29515.8 자주 사용하는 데이터 분석 함수 297