상세정보
한권으로 파이썬 데이터 사이언스 입문 AtoZ
- 저자
- 문용준, 문성혁
- 출판사
- 잇플
- 출판일
- 2020-01-08
- 등록일
- 2020-02-03
- 파일포맷
- EPUB
- 파일크기
- 0
- 공급사
- 북큐브
- 지원기기
-
PC
PHONE
TABLET
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
이 책은 데이터 분석을 위한 기본서 라고 할 수 있다.
데이터사이언스 입문 A to Z은 4차 산업혁명에서 꼭 필요한 데이터분석에 대한 내용을 다룬 교재다. 사회적으로 데이터를 분석하는 전문가에 대한 수요는 급증하고 있는데 이 분야에 뛰어난 분석력과 창의적인 인재가 부족한 것이 현실이다.
이 책은 데이터전문가를 양성하는데 있어서 꼭 필요한 내용으로 역어져 있으며 데이터전문가로 성장하는데 필요한 기초적인 모든 내용을 포괄적으로 다루고 있다.
파이썬의 수학 라이브러리인 numpy를 비롯하여 데이터 통계 라이브러리인 pandas와 matplotlib 등에 관한 설명과 예제들이 가득한 책이며 금융 데이터 분석, 공공데이터 분석 등을 처리하는 예제들을 통한 데이터 분석 활용법을 알려주는 책이다.
4차 산업혁명에서 매우 중요한 위치를 차지하고 있는 데이터 사이언스와 머신 러닝이 일반화된 지금, 다양한 머신 러닝과 딥 러닝을 데이터에 적용하는 것은 그리 어렵지 않은 일이 됐다. 데이터 사이언스에서 가장 중요한 것은 데이터 그 자체다. 하지만 데이터 처리 기술에만 집중하고 있다.
IT 현장에서 데이터 수집 과정에서 수많은 오류를 포함하게 되는 경우를 자주 본다. 따라서 데이터 전처리(Data pre-processing)는 데이터 사이언스에서 매우 중요한 과정이다.
특히, 빅 데이터를 다루는 많은 사람들에게 있어 데이터 자체가 지니고 있는 오류를 발견하고 보정해주고, 추후에 모델이 수립될 경우 그 의미와 해석에 대해서 서로 연결 시켜나갈 수 있는 로우 데이터(Raw Data)를 들여다 볼 수 있는 실력은 정말 중요하다.
바로 이 책은 그런 부분을 중점적으로 집필했다.
이 책의 특징
꼭 필요한 내용을 하나로 연결
가장 기본적인 처리를 기준으로 꼭 필요한 것을 하나로 연결해서 더 쉽게 접근할 수 있도록 묶었습니다.
넘파이와 판다스 모듈 이해와 선형대수 처리방식
데이터를 분석하려면 숫자를 관리하는 배열 형태의 자료구조를 알아야 합니다. 넘파이와 판다스 모듈의 배열 개념을 이해하고, 배열 내의 원소를 계산하는 선형대수 처리 방식을 알아봅니다.
머신러닝과 딥러닝
머신러닝과 딥러닝의 알고리즘을 잘 사용하는 것도 중요하지만 데이터가 왜 이런 결과로 만들어졌는지 정확히 파악하는 것도 중요하므로 그 원리를 알아봅니다.
각종 데이터분석에서 부터 자연어의 기본까지 데이터사이언스에서 필요한 대부분의 내용들을 다루고 있습니다.
저자소개
? 문용준
- 숭실대학교 전자계산학과 졸업
- 평화은행 국민은행 한국IBM, LGCNS, SK C&C
- 패스트 켐퍼스 등 파이썬 강의
- IITP 빅데이터 자문 및 심사평가위원
- 한국 창의재단 소프트웨어 영재 교육 자문
- 현) SK 주식회사 C&C
〈저서〉
손에 잡히는 파이썬 《비제이퍼블릭》
손에 잡히는 판다스 《비제이퍼블릭》
반드시 알아야 할 파이썬 입문 A to Z 〈잇플〉
반드시 알아야 할 파이썬 심화 A to Z 〈잇플〉
? 문성혁
- 현 아토큐브 주식회사 CTO
- 세종대학교 컴퓨터 공학과 졸업
- 단국대 해커톤 기술 멘토
- 패턴 및 칼라인식 게임, 아또랑 큐브스타 제작
- 2017년 대한민국 창업리그 경기지역 대상
〈저서〉
반드시 알아야 할 파이썬 입문 A to Z 〈잇플〉
반드시 알아야 할 파이썬 심화 A to Z 〈잇플〉
목차
Chapter 01 개발환경 설치
1. 아나콘다 설치
2. 주피터 노트북 실행
3. 주피터 노트북 사용하기
4. 파이썬 모듈
Chapter 02 파이썬 기본
1. 파이썬 변수와 기본 문장
2. 파이썬 함수
3. 파이썬 클래스와 객체
4. 파이썬 내장 숫자 클래스
5. 문자열
Chapter 03 배열 데이터
1. 파이썬 리스트 클래스
2. 배열(array)모듈의 배열
3. 넘파이 모듈의 다차원 배열
Chapter 04 판다스의 자료구조
1. 시리즈(Series)클래스
2. 데이터프레임(Data Frame)구조
3. 시리즈와 데이터프레임의 자료 형 관리 기준
Chapter 05 데이터 구조 접근하기
1. 다차원 배열 팬시 검색과 논리 검색
2. 판다스의 팬시 검색과 논리 검색
3. 데이터 구조 변경
Chapter 06 시각화
1. 그래프의 기본
2. 그래프 꾸미기
3. 다른 시각화 모듈
Chapter 07 수학 함수
1. 시그마와 파이 기호
2. 지수, 로그와 삼각 함수
3. 축 기준으로 함수 처리
Chapter 08 확률의 기초와 원리
1. 집합
2. 경우의 수
3. 확률의 원리
4. 확률 변수와 확률분포
5. 베이지안
Chapter 09 선형 대수로 넘파이 모듈 이해하기
1. 벡터와 1차원 배열
2. 행렬과 2차원 배열
3. 텐서와 다차원 배열
4. 유니버설 함수 (universal function)
5. 선형대수 연산인 내적과 외적
6. 행렬식과 역행렬
7. 선형변환, 고윳값, 고유벡터
Chapter 10 선경망 사용 함수
1. 활성화 함수(activation function)
2. 미분
3. 계층(layer)을 다차원 배열로 계산하기
4. 합성 곱 함수
Chapter 11 데이터 변수 정제
1. 날짜 자료형
2. 결측값 및 이상치 값 처리
3. 다양한 값의 정규화와 변환
Chapter 12 데이터로 통계 알아보기
1. 중심위치 확인
2. 퍼진 정도 확인
Chapter 13 공공 데이터
1. 공공 데이터 분석
2. 유가 데이터 분석
Chapter 14 금융 데이터
1. 주식 데이터 분석
2. 환율, 지수 등 금융 데이터 분석
3. 한국의 주식 시가총액 분석
Chapter 15 자연어 기본
1. 자연어 기본 처리
2. HTML 파싱과 워드크라우드