상세정보
미리보기
Pandas를 이용한 데이터 분석 실습 2/e
- 저자
- 스테파니 몰린 저/장기식,노용환,김경환 공역
- 출판사
- 에이콘출판사
- 출판일
- 2023-01-06
- 등록일
- 2023-03-13
- 파일포맷
- PDF
- 파일크기
- 74MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
pandas는 파이썬에서 데이터 과학을 위한 강력하고 인기 있는 라이브러리다. 이 책은 주식 시장과 모의 해킹 시도, 기상 동향, 지진, 와인, 천문학 데이터 등 실제 데이터에 pandas를 이용한 데이터 분석 실습을 제공한다. pandas는 표 형식의 데이터를 효율적으로 다룰 수 있는 기능을 제공해 데이터 랭글링(data wrangling)과 시각화를 쉽게 할 수 있다. 데이터 분석 방법을 배운 다음에 다양한 응용 프로그램을 살펴본다. 파이썬 패키지를 구축한 다음, 데이터 시각화와 데이터 랭클링, 그리고 머신러닝을 위해 널리 사용되는 Matplotlib와 Seaborn, 넘파이(NumPy), Scikit-learn과 같은 추가 라이브러리를 사용해 주가 분석, 이상 탐지, 회귀, 군집화, 분류 문제에 도전한다. 이 책을 읽으면 파이썬으로 여러분만의 데이터 과학 프로젝트를 수행할 준비가 돼 있을 것이다.
저자소개
뉴욕 블룸버그 LP의 데이터 과학자이자 소프트웨어 엔지니어로서 정보보호 분야에서 이상 탐지(anomaly detection)와 데이터 수집을 위한 도구 개발, 지식 공유와 같이 어려운 문제를 담당하고 있다. AdTech와 FinTech 산업에서 데이터 과학, 이상 탐지 솔루션 설계, 머신러닝에 R과 파이썬을 활용하는 데 많은 경험이 있으며, 컬럼비아 대학의 후 재단 공과 및 응용과학 대학(Fu Foundation School of Engineering and Applied Science)에서 운용 연구(OR, Operations Research)로 석사 학위를 받았으며 경제학과 기업가 정신 및 혁신(entrepreneurship and innovation)을 부전공했다. 세계를 여행하고, 새로운 요리법을 개발하며, 사람과 컴퓨터 간에 사용되는 새로운 언어를 배우는 것을 즐긴다.
목차
1부. pandas 시작하기1장 데이터 분석 소개__1장 교재__데이터 분석 기초____데이터 수집____데이터 랭글링____탐색적 데이터 분석____결론 도출__통계 기초____표본 추출____기술통계학____추론통계학__가상 환경 설정하기____가상 환경____필수 파이썬 패키지 설치하기____왜 pandas인가?____주피터 노트북__요약__연습 문제__참고 자료2장. pandas DataFrame으로 작업하기__2장 교재__pandas 데이터 구조____시리즈____인덱스____DataFrame__pandas DataFrame 만들기____파이썬 객체로 DataFrame 만들기____파일로 DataFrame 만들기____데이터베이스로 DataFrame 만들기____API에서 DataFrame 만들기__DataFrame 객체 확인하기____데이터 검사하기____데이터 설명 및 요약하기__데이터의 부분집합 선택하기____열 선택하기____슬라이싱____인덱싱____필터링__데이터 추가하고 제거하기____새로운 데이터 만들기____원하지 않는 데이터 삭제하기__요약__연습 문제__참고 자료__데이터2부. pandas로 데이터분석하기3장. pandas로 데이터 랭글링하기__3장 교재__데이터 랭글링 이해하기____데이터 정제____데이터 변환____데이터 강화__기온 데이터를 찾고 수집하고자 API 사용하기__데이터 정제____열 이름 바꾸기____유형 변환____데이터 재정렬, 재인덱싱, 정렬__데이터 재구성하기____DataFrame 전치____DataFrame 피보팅____DataFrame 멜팅__중복, 결측, 유효하지 않은 데이터 다루기____문제가 있는 데이터 찾기____문제 완화하기__요약__연습 문제__참고 자료4장. pandas DataFrame 집계하기__4장 교재__DataFrame을 데이터베이스처럼 작업하기____DataFrame 질의하기____DataFrame 병합하기__데이터 강화를 위한 DataFrame 연산____산술과 통계____데이터 이산화____함수 적용하기____윈도우 계산__파이프__데이터 집계____DataFrame 요약하기____그룹으로 집계하기____피봇 테이블과 교차표__시계열 데이터로 작업하기____시간을 기준으로 선택하고 필터링하기____시차 데이터 이동하기____차분 데이터____재표본추출____시계열 데이터 병합하기__요약__연습 문제__참고 자료5장. pandas와 matplotlib를 사용한 데이터 시각화__5장 교재__matplotlib 소개____기초____그림 구성 요소____추가 옵션__pandas로 그림 그리기____시간의 경과에 따른 변화____변수 간의 관계____분포____개수와 빈도수__pandas.plotting 모듈____산포행렬____시차 그림____자기상관 그림____붓스트랩 그림__요약__연습 문제__참고 자료6장. seaborn과 사용자 정의 기술로 그림 그리기__6장 교재__seaborn으로 고급 그림 그리기____범주형 데이터____상관관계와 히트맵____회귀그림____패시팅__matplotlib로 그림 형식 지정하기____제목과 축 이름____범례____축 형식 지정하기__시각화 사용자 정의하기____참조선 추가하기____음영 영역____주석____색상____질감__요약__연습 문제__참고 자료3부. pandas를 이용한 실제 분석7장. 금융 분석-비트코인과 주식 시장__7장 교재__파이썬 패키지 만들기____패키지 구조____stock_analysis 패키지 개요____UML 다이어그램__금융 데이터 수집하기____StockReader 클래스____야후! 금융에서 과거 데이터 수집하기__탐색적 데이터 분석____Visualizer 클래스 패밀리____주가 시각화하기____다중 자산 시각화하기__금융 상품의 기술적 분석____StockAnalyzer 클래스____AssetGroupAnalyzer 클래스____자산 비교하기__과거 데이터를 사용한 수익률 모델링____StockModeler 클래스____시계열 분해____ARIMA____statsmodels의 선형회귀____모델 비교__요약__연습 문제__참고 자료8장. 규칙 기반 비정상 행위 탐지__8장 교재__로그인 시도 시뮬레이션____가정____login_attempt_simulator 패키지____터미널에서 시뮬레이션하기__탐색적 데이터 분석__규칙 기반 이상 탐지 구현____백분율 차____튜키 울타리____Z-점수____성능 평가__요약__연습 문제__참고 자료4부. scikit-learn을 이용한 머신러닝 소개9장. 파이썬에서 머신러닝 시작하기__9장 교재__머신러닝 개요____머신러닝의 종류____일반적인 작업____파이썬으로 머신러닝하기__탐색적 데이터 분석____레드 와인 품질 데이터__화이트 와인과 레드 와인의 화학 성분 데이터____행성과 외계 행성 데이터__데이터 전처리____학습 데이터와 평가 데이터____데이터 척도화 및 중심화____데이터 부호화____대치____추가 변환기____데이터 파이프라인 구축__군집화____k-평균____군집 결과 평가__회귀____선형회귀____회귀 결과 분석__분류____로지스틱 회귀____분류 결과 평가__요약__연습 문제__참고 자료10장. 예측 더 잘하기-모델 최적화 __10장 교재__격자검색을 통한 초매개변수 튜닝__특성 공학____상호작용 항과 다항식 특성____차원축소____특성 합집합____특성 중요도__앙상블 방법____확률숲____경사부스팅____투표__분류 예측 신뢰도 검사__계급불균형 해결____과소표본추출____과대표본추출__정칙화__요약__연습 문제__참고 자료11장. 머신러닝 기반 비정상 행위 탐지__11장 교재__시뮬레이션 로그인 시도 데이터 탐색__비정상 행위 탐지에 비지도학습 모델 활용____고립숲____국소특이점인자____모델 비교__지도학습 비정상 행위 탐지 구현____기준 설정____로지스틱 회귀__피드백 되돌림과 온라인학습 통합____PartialFitPipeline 하위 클래스 만들기____확률적 경사하강 분류기__요약__연습 문제__참고 자료5부. 추가 자료12장. 나아갈 길__데이터 출처____파이썬 패키지____데이터 검색____API____웹사이트__데이터 작업 연습__파이썬 연습__요약__연습 문제__참고 자료해답부록