상세정보
미리보기
비즈니스 데이터 과학
- 저자
- 맷 태디 저/이준용 역
- 출판사
- 한빛미디어
- 출판일
- 2022-06-27
- 등록일
- 2022-08-11
- 파일포맷
- PDF
- 파일크기
- 10MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
더 나은 의사결정을 위한 필수 통계학, 경제학 개념부터 핵심 머신러닝 알고리즘까지
실무자를 위한 비즈니스 빅데이터 기술
비즈니스 분야에서 자주 언급되는 문제와 관련된 통계학, 경제학 개념 및 빅데이터 기술을 소개합니다. 이 책에는 아마존과 마이크로소프트에서 데이터 과학팀을 이끌고 시카고 대학교에서 계량경제학 및 통계학 교수로 재직하면서 데이터 과학 커리큘럼을 개발한 저자의 경험이 고스란히 담겨있습니다. 통계학, 경제학 개념부터 머신러닝 알고리즘까지 실무자가 알아야 하는 필수적인 내용들을 친절하게 설명하며 이를 R 프로그래밍 언어로 직접 구현하면서 모델링 기법의 목적과 사용법을 더 자세히 이해할 수 있게 돕습니다. 데이터 과학자, 데이터 엔지니어, 인공지능 개발자, 비즈니스 의사결정자 그리고 고급 통계학 지식을 얻고자 하는 사람에게 유용한 책입니다.
저자소개
아마존 부사장. 2008년부터 2018년까지 시카고 대학교 부스 경영대학원에서 계량경제학 및 통계학 교수로 재직하면서 데이터 과학 커리큘럼을 개발했다. 마이크로소프트의 수석 연구원(Head of Economics and Data Science, Business AI)과 이베이의 연구원(Research Fellow)을 포함하여 다양한 산업 분야에서 일한 경험이 있다.
목차
CHAPTER 0 들어가며
두 도표에 대한 이야기
빅데이터와 머신러닝
계산
CHAPTER 1 불확실성
1.1 빈도주의 관점에서의 불확실성과 부트스트랩
_알고리즘 1 | 비모수 부트스트랩
_심화학습 | 편향된 추정량과 부트스트랩 사용
_알고리즘 2 | 신뢰구간을 위한 비모수 부트스트랩
1.2 가설 검정과 거짓 발견 비율 조절
_알고리즘 3 | BH FDR 제어
_심화학습 | BH 알고리즘이 작동하는 이유
1.3 베이지안 추론
CHAPTER 2 회귀
2.1 선형 모델
2.2 로지스틱 회귀
2.3 편차와 가능도
2.4 회귀 불확실성
2.5 공간과 시간
CHAPTER 3 정규화
3.1 표본 외 성능
_알고리즘 4 | K-폴드 표본 외 검증
3.2 정규화 경로
_알고리즘 5 | 전진 단계별 회귀
_알고리즘 6 | lasso 정규화 경로
3.3 모델 선택
_알고리즘 7 | K-폴드 CV
_알고리즘 8 | K-폴드 CV lasso
3.4 lasso에 대한 불확실성 정량화
_알고리즘 9 | lasso 신뢰구간을 위한 모수적 부트스트랩
_알고리즘 10 | √n 학습에서 서브샘플링 CI
CHAPTER 4 분류
4.1 최근접 이웃
_알고리즘 11 | K 최근접 이웃
4.2 확률, 비용, 분류
_알고리즘 12 | 맵리듀스 프레임워크
4.3 다항 로지스틱 회귀
4.4 분산 다항 회귀
4.5 분산과 빅데이터
CHAPTER 5 실험
5.1 무작위 대조 시험
5.2 유사 실험 설계
5.3 도구 변수
_알고리즘 13 | 2SLS
CHAPTER 6 제어
6.1 조건부 무시가능성과 선형 처리 효과
6.2 고차원 교란 조정
_알고리즘 14 | LTE lasso 회귀
6.3 표본 분할과 직교 머신러닝
_알고리즘 15 | LTE를 위한 직교 머신러닝
6.4 이종 처리 효과
6.5 합성 제어
_알고리즘 15 | 합성 제어
CHAPTER 7 인수분해
7.1 클러스터링
_알고리즘 17 | K-평균
7.2 요인 모델과 PCA
_알고리즘 18 | 주성분 분석
7.3 주성분 회귀
_알고리즘 19 | 주성분 (lasso) 회귀
7.4 부분 최소제곱법
_알고리즘 20 | 주변 회귀
_알고리즘 21 | 부분 최소제곱법(PLS)
CHAPTER 8 데이터로서의 테스트
8.1 토큰화
8.2 텍스트 회귀
8.3 토픽 모델
_알고리즘 22 | 희소 데이터를 위한 PCA
8.4 다항 역회귀
8.5 협업 필터링
8.6 워드 임베딩
CHAPTER 9 비모수
9.1 의사결정트리
_알고리즘 23 | CART 알고리즘
9.2 랜덤 포레스트
_알고리즘 24 | 랜덤 포레스트(RF)
_알고리즘 25 | 경험적 베이지안 포레스트(EBF)
9.3 인과 트리
_알고리즘 26 | 인과 트리(CT)
9.4 반모수와 가우스 프로세스
CHAPTER 10 인공지능
10.1 인공지능이란 무엇인가?
10.2 범용 머신러닝
10.3 딥러닝
10.4 확률적 경사하강법
10.5 강화 학습
10.6 상황에 따른 인공지능