상세정보
파이썬 딥러닝 머신러닝 입문
- 저자
- 오승환
- 출판사
- 정보문화사
- 출판일
- 2021-01-05
- 등록일
- 2021-03-25
- 파일포맷
- EPUB
- 파일크기
- 57MB
- 공급사
- 교보문고
- 지원기기
-
PC
PHONE
TABLET
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
아직도 파이썬을 모른다고?
이 책은 코드를 직접 입력하고 실행하는 데 필요한 기본적인 환경을 ‘구글 코랩’을 활용하여 파이썬의 가장 기본적인 문법 중 핵심적인 내용만 간단하게 설명한다. 머신러닝과 딥러닝을 직접 경험해보고 싶지만 파이썬 초보자라면 이 책이 적합할 것이다. 데이터를 수집하고 정리하는 판다스를 다루고, 사이킷런 등 다양한 머신러닝 기법들을 예제를 통해 실행한다. 그리고 실제 경진 대회 사이트에서 데이터를 받아 머신러닝 분석을 통해 결과를 예측해봄으로써 실전 경진 대회를 위한 실력을 체크해 볼 수 있다. 이후 머신러닝에서 다룬 데이터로 분류, 회귀 문제 등을 해결하면서 딥러닝의 기본 구조를 다룬다. 마지막으로 자연어, 시계열 예측 등 다양한 딥러닝 응용 사례를 다룸으로써 단순한 구조의 모델을 직접 만들어 보는 것으로 마무리 되는 구성이다. 그렇기 때문에 파이썬을 배우는 목적이 인공지능 기술을 실무에 활용하기 위한 것이라면 준전문가로 성장해 나갈 수 있을 것이다.
저자소개
저자 : 오승환
저자 : 오승환
국내 주요 금융 기관과 대기업에서 기업(산업) 분석 및 전략 기획 전문가로 근무했다. IT 비전공자이지만 Python 기반의 머신러닝/딥러닝 기술을 익히고, 데이터 기반 전략적 의사 결정에 관심이 많다. 인공지능 경진 대회 우승 경력이 있고, 현재 AI 스타트업 부대표로 근무하고 있다. 개발자가 아닌 일반인 관점에서 파이썬을 활용하는 방법에 대한 블로그를 운영하며, 강연을 통한 지식 나눔을 병행하고 있다. 저서로는 〈파이썬 머신러닝 판다스 데이터 분석〉, 〈실무자를 위한 파이썬 100제〉가 있다.
목차
PART 01 개발 환경 설정
1. 구글 코랩이란?
2. 코랩 시작하기
2-1. 구글 계정 로그인
2-2. 구글 코랩 실행하기
3. "Hello, Colab" 코딩하기
4. 예제 파일 업로드하기
PART 02 파이썬 기초
1. 프로그래밍 기본 개념
1-1. 데이터 입력과 출력
1-2. 변수에 저장
1-3. 화면에 출력
2. 자료형
2-1. 숫자형
2-2. 문자열
2-3. 리스트
2-4. 투플
2-5. 딕셔너리
3. 연산자
3-1. 산술연산자
3-2. 논리연산자
3-3. 비교연산자
4. 제어문
4-1. 조건문(if)
4-2. for 반복문
4-3. while 반복문
4-4. 예외처리(try~except)
5. 함수
5-1. 사용자 정의 함수
5-2. 람다(lambda) 함수
5-3. 파이썬 내장 함수
6. 클래스
PART 03 머신러닝 입문
1. 판다스 자료구조
2. 머신러닝
2-1. 지도학습 vs. 비지도학습
2-2. 회귀 vs. 분류
2-3. 머신러닝 프로세스
3. 일차함수 관계식 찾기
3-1. 문제 파악
3-2. 데이터 탐색
3-3. 데이터 전처리
3-4. 모델 학습
3-5. 예측
4. 분류(Classification) - 붓꽃의 품종 판별
4-1. 데이터 로딩
4-2. 데이터 탐색
4-3. Train-Test 데이터셋 분할
4-4. 분류 알고리즘 ① - KNN
4-5. 분류 알고리즘 ② - SVM
4-6. 분류 알고리즘 ③ - 로지스틱 회귀
4-7. 분류 알고리즘 ④ - 의사결정나무
4-8. 앙상블 모델 ① - 보팅
4-9. 앙상블 모델 ② - 배깅
4-10. 앙상블 모델 ③ - 부스팅
4-11. 교차 검증 ① - Hold-out
4-12. 교차 검증 ② - K-fold
5. 회귀(Regression) - 보스턴 주택 가격 예측
5-1. 데이터 로딩
5-2. 데이터 탐색
5-3. 데이터 전처리
5-4. 베이스라인 모델 - 선형 회귀
5-5. 모델 성능 평가
5-6. 과대적합 회피(L2/L1 규제)
5-7. 트리 기반 모델 - 비선형 회귀
PART 04 머신러닝 응용
1. 사전 준비
1-1. 데이콘 경진 대회 데이터셋 다운로드
1-2. 구글 드라이브에 파일 업로드
1-3. 구글 드라이브 마운트
2. 데이터 탐색
2-1. 데이터 로딩
2-2. 데이터 구조
2-3. 결측값 확인
2-4. 상관 관계 분석
3. 베이스라인 모델
3-1. 데이터 결합
3-2. 데이터 전처리
3-3. 모델 학습 및 검증
3-4. 모델 예측
3-5. 데이콘 리더보드 점수 확인
4. 피처 엔지니어링(+EDA)
4-1. Survived : 생존 여부
4-2. Pclass : 객실 등급
4-3. Sex : 성별
4-4. Name : 이름
4-5. Age : 나이
4-6. SibSp : 형제자매/배우자
4-7. Parch : 부모/자식
4-8. Fare : 요금
4-9. Embarked : 탑승 항구
4-10. Cabin : 객실 구역
4-11. Ticket : 탑승권
5. 데이터 전처리
5-1. 레이블 인코딩
5-2. 원핫 인코딩
5-3. 피처 스케일링
6. 모델 학습
6-1. 피처 선택
6-2. 피처 중요도
6-3. 분류 확률값
PART 05 딥러닝 입문
1. 인공 신경망의 구조
1-1. 활성화 함수
1-2. 손실 함수
1-3. 옵티마이저(최적화 알고리즘)
1-4. 다층 신경망(MLP, Multi-Layer Perceptron)
2. 간단한 딥러닝 모델 만들기
2-1. Sequential API
2-2. 모델 컴파일
2-3. 모델 학습 및 예측
3. 딥러닝을 활용한 회귀 분석 : 보스턴 주택 가격 예측
3-1. 데이터 전처리
3-2. MLP 모델 아키텍처 정의
3-3. 미니 배치 학습
3-4. 교차 검증
4. 딥러닝을 활용한 분류 예측 : 와인 품질 등급 판별
4-1. 데이터 전처리
4-2. 모델 설계 : 드랍아웃 활용
4-3. 콜백 함수 : Early Stopping 기법
4-4. 예측값 정리 및 파일 제출
PART 06 딥러닝 응용
1. 이미지 분류 : Fashion MNIST 의류 클래스 판별
1-1. 데이터 전처리
1-2. 홀드아웃 교차 검증을 위한 데이터셋 분할
1-3. MLP 모델 학습
1-4. 합성곱 신경망(CNN)
1-5. 과대적합 방지
1-6. 사용자 정의 콜백 함수
2. 오토인코더 : 차원 축소와 이미지 복원
2-1. 기본 개념
2-2. 오토인코더 모델 만들기
3. 전이 학습 : 사전 학습 모델 활용
3-1. GPU 런타임 설정
3-2. CIFAR-10 데이터셋
3-3. 일반 합성곱 신경망(CNN)으로 분류 예측
3-4. 전이 학습으로 분류 예측
4. 자연어 처리(NLP) : IMDb 영화 리뷰 감성 분석
4-1. IMDb 영화 리뷰 데이터셋
4-2. 제로 패딩
4-3. 단어 임베딩
4-4. RNN
4-5. LSTM
4-6. GRU
5. 시계열 분석 : 전력 거래 가격 예측
5-1. 데이터 탐색
5-2. 데이터 전처리
5-3. LSTM 모델로 시계열 예측