상세정보
미리보기
데이터 분석을 위한 수리 모델 입문
- 저자
- 에자키 타카히로 저/김범준 역
- 출판사
- 위키북스
- 출판일
- 2022-11-15
- 등록일
- 2022-12-07
- 파일포맷
- PDF
- 파일크기
- 6MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
이 책에서는 수리 모델을 사용한 데이터 분석의 본질적인 부분을 골라내면서 데이터 분석을 넓은 시점에서 살펴보는 방식으로 설명을 진행한다. 이러한 설명을 통해 다음과 같은 요구에 대해 적절한 답을 제시하고자 한다.
저자소개
도쿄대학 첨단과학기술 연구 센터 특임 강사. 2011년 도쿄대학 공학부 항공우주공학과 졸업. 2015년 동대학원 박사 과정 수료(특례 적용에 의해 1년 단축), 박사(공학). 일본 학술진흥회 특별 연구원, 국립정보학연구소 특임 연구원, JST 선도 연구원, 스탠포드 대학 객원 연구원을 거쳐, 2020년부터 현직. 도쿄대학 총장상, 이노우에 연구 장려상 등 수상. 수리적 해석기술을 무기로 통계물리학, 뇌과학, 행동경제학, 생화학, 교통공학, 물류과학 등 폭넓은 분야의 문제에 대처하고 있다.
목차
[01부] 수리 모델이란 ▣ 01장: 데이터 분석과 수리 모델 1.1 데이터를 분석하는 일 ___인간이 인지할 수 있는 한계와 데이터 분석 ___대상을 데이터 생성 시스템으로 생각한다 ___데이터 분석의 세계 ___두 가지 접근법 1.2 수리 모델의 역할 ___데이터를 바라보는 것 이상의 분석이 필요하다면 수리 모델을 사용할 때 ___수리 모델은 ‘가정하는 것’이다 ___수리 모델을 구성하는 요소 ___일단 변수로 표현해보자 ▣ 02장: 수리 모델을 구성하는 요소와 종류 2.1 변수 수리의 구조 매개변수 ___수리 모델을 구성하는 요소 ___일단 변수로 표현해보자 ___수리구조 = ‘수리 모델의 뼈대’ ___매개변수는 수리 모델을 ‘움직인다’ 2.2 수리 모델과 자연과학의 기초 이론 ___확립된 수리 모델은 기초 이론이 된다 ___경계조건과 계산의 난이도 2.3 이해 지향형 모델링과 응용 지향형 모델링 ___목적에 따라 모델링은 크게 달라진다 ___모델이 복잡한 정도와 쉽게 이해할 수 있는 정도 2.4 이해 지향형 모델링 ___이해 지향형 모델링 방법 ___(1) 수리 구조를 통해 설명하는 방법 ___(2) 추정한 매개변수의 값을 통해 설명하는 방법 ___(3) 추정된 잠재변수나 내부 표현을 사용해 그 다음 부분을 해석하는 방법 ___(4) 수리 모델에 있는 매개변수를 변화시키면서 상황을 시뮬레이팅하는 방법 2.5 응용 지향형 모델링 ___수리 모델의 데이터 생성능력을 활용한다 ___예측모델의 예1: 값을 예측한다(회귀) ___예측모델의 예2: 분류 문제 ___생성모델을 사용한 응용 2.6 수리 모델의 한계와 적용 범위 ___‘옳은’ 수리 모델? ___좋은 수리 모델도 항상 옳지는 않다 [02부] 기초적인 수리 모델 ▣ 03장: 방정식 모델 3.1 선형모델 ___변수 사이의 관계를 등식으로 표현한다 ___선형모델 ___선형모델을 구한다 ___최소제곱법 3.2 실험식과 커브 적합 ___BMI와 수리 모델 ___멱법칙으로 특징짓는다 ___대수플롯으로 멱법칙을 찾는다 ___실험식 3.3 최적화 문제 ___목적한 양을 제어한다 ___대역적 최적과 국소적 최적 ___매개변수를 조정하는 일도 최적화 ___최적화를 어렵게 만드는 요소 ▣ 04장: 미분 방정식으로 구성된 모델 4.1 풀 수 있는 미분 방정식 모델 ___미분 방정식을 통해 시간 변화를 나타낸다 ___맬서스의 개체 수 모델 ___맬서스 모델의 해의 구조 ___개체 수가 계속 폭발적으로 늘어나는 것은 아니다 ___간단한 연립 선형 미분 방정식 ___두 개의 연립 미분 방정식 ___연립 1계 선형 상미분 방정식 ___‘고윳값’에 의해 해의 성질이 결정된다 4.2 비선형 미분 방정식 모델 ___비선형인 항을 포함한 미분 방정식 모델 ___로트카-볼테라 방정식 ___‘정상’인 상태에 관해 생각해 보자 ___정상해의 ‘안정성’ ___안정성을 실제로 평가한다 ___미분 방정식을 선형화해서 해석한다 ___수치 시뮬레이션 4.3 풀 수 있은 모델과 풀 수 없는 모델 ___풀 수 있는 미분 방정식은 많지 않다 ___선형인 미분 방정식 ___1 변수인 비선형 미분방정식 ___편미분 방정식 ___분석 소프트웨어를 이용한다 4.4 제어이론 ___입력변수에 대해 시스템이 어떻게 응답하는가 ___미분 방정식을 풀기 위해 사용되는 도구 ___라플라스 변환으로 미분 방정식을 푼다 ___미분 방정식에 제어항을 넣어보자 ___목푯값을 달성하기 위한 피드백을 생각한다 ___고전 제어이론과 현대 제어이론, 그리고 그 이후 ▣ 05장: 확률모델 5.1 확률과정 ___확률적인 상황을 생각해 보자 ___확률분포는 확률의 정보를 모아 놓은 것이다 ___연속변수의 확률분포 ___연속변수의 확률분포: 확률밀도함수 ___주사위를 여러 번 던진다 5.2 마르코프 과정 ___마르코프 과정은 과거의 상태를 무시한다 ___점심 메뉴 정하기 ___어떤 비율로 라면을 먹게 될까 ___상태확률의 방정식을 세운다 ___시간이 충분히 경과한 후 5.3 대기행렬이론 ___창구의 대기줄을 확률적으로 표현한다 ___평균적인 움직임에 기반한 추측 ___사용자가 무작위로 도착하는 모습을 표현한 포와송 과정 ___커지고 작아지는 모습을 표현하는 출생사멸 과정 ___대기줄의 길이를 확률적으로 구한다 ___정상상태 분석 ___확률분포를 알면 기댓값을 구할 수 있다 ___확률모델의 강점과 한계 ___수치적인 해석은 비교적 쉽다 ___마르코프 근사 ▣ 06장: 통계모델 6.1 정규분포 ___뱀 주사위 놀이 결과 ___정규분포는 확률분포의 왕 ___정규분포의 정의 ___다른 정규분포끼리 덧셈한 것도 정규분포 ___정규분포를 제곱해서 덧셈하면 어떻게 될까? 6.2 통계적 검정 ___분산에 관해 생각해 본다 ___우연의 확률 ___평균에 관한 검정 ___통계검정은 만능이 아니다 ___1종 오류와 2종 오류 ___통계검정 실시 6.3 회귀분석 ___선형모델의 타당성 ___같은 선형모델에서 나타나는 차이 ___피어슨 상관계수로 평가한다 ___선형식과 잘 부합되기만 하면 괜찮을까? ___변수의 개수가 많을 때는 중회귀분석 ___X 선형이 아닌 모델 [03부] 수준 높은 수리 모델 ▣ 07장: 시계열 모델 7.1 시계열 데이터를 구성하는 구조 ___다양한 시계열 ___여러 가지 접근법 ___트렌드+성분+노이즈 ___주파수 성분 ___특정한 비선형 구조가 있는 경우 ___시계열이 정상인지를 알아본다 ___시간을 설명변수로 사용해서 통계검정을 실행하면 안 된다 7.2 관측변수를 사용한 모델 ___예측에 사용할 수 있는 모델들 ___AR 모델 ___ARMA 모델 ___ARIMA 모델 ___SARIMA 모델 7.3 상태공간 모델 ___상태변수를 포함한 모델 ___상태공간 모델의 일반적인 표현 ___이산시간, 선형, 가우스 모델 ___다른 경우의 상태공간 모델 7.4 그 밖의 다양한 시계열 분석법 ___자기상관으로 시간구조를 특징짓는다 ___이상확산으로 특징짓는다 ___푸리에 변환으로 주파수를 해석한다 ___카오스, 비선형 시계열 해석 ___두 개 이상의 시계열에서 인과관계를 조사한다 ▣ 08장: 머신러닝 모델 8.1 머신러닝으로 다루는 모델과 문제의 특징 ___머신러닝의 기본적인 개념 ___복잡한 문제, 복잡한 모델 ___모델의 자유도와 오버피팅 ___머신러닝 모델을 사용해서 분석한다 8.2 분류와 회귀 문제 ___분류와 회귀 ___결정 트리 ___랜덤 포레스트 ___서포트 벡터 머신 ___신경망 8.3 클러스터링 ___클러스터링으로 데이터를 해석한다 ___k-평균법 ___혼합분포 모델 ___계층적 클러스터링 기법 8.4 차원축소 ___차원축소란 ___주성분 분석 ___독립성분 분석 ___비선형인 차원축소법 8.5 딥러닝 ___딥러닝이란 ___컨볼루션 신경망 ___순환 신경망 ___오토인코더 ___적대적 생성 네트워크 ▣ 09장: 강화학습 모델 9.1 행동 모델인 강화학습 ___강화와 학습 ___도박 문제 ___행동 선택을 포함한다 ___모델의 다양성과 발전 ___행동모델로 사용한다 9.2 머신러닝 분야의 강화학습 ___머신러닝 분야의 강화학습 ___가치 함수의 성질을 결정한다 ___가치 함수를 갱신한다 ___딥러닝을 사용한 Q 학습 ___Q 학습 이외의 방법 ▣ 10장: 다체계 모델(행위자 기반 모델) 10.1 미크로에서 매크로로 ___다체계 모델(행위자 기반 모델)이란 ___모델을 구성하는 요소 ___시간과 공간의 이산화 ___매크로적인 변수로 시스템의 움직임을 특징짓는다 ___모델을 분석하는 방식 10.2 다양한 집단 현상 모델 ___집단 모델 ___동기 현상 모델 ___인간의 행동과 의사결정 모델 10.3 상호작용 네트워크 ___네트워크 구조를 통해 문제를 본다 ___다른 노드와 얼마나 연결됐나 ___유유상종? ___네트워크상에서 이동하기 쉬운 정도를 특징짓는다 ___‘중심성’으로 중요한 노드를 특징짓는다 ___‘친구의 친구’는 친구일까? ___무작위 네트워크를 만든다 ___척도 없는 네트워크의 기본 모델 ___컨피규레이션 모델 [04부] 수리 모델을 만든다 ▣ 11장: 모델을 결정하기 위해 필요한 요소 11.1 수리 모델의 성질 ___수리 모델을 만드는 목적 ___모델링은 시행착오다 ___결정론적 모델 vs. 확률 모델, 통계 모델 ___이용할 수 있는 모델을 검토한다 11.2 이해 지향형 모델링의 요점 ___이해하기 쉬운 모델이란 ___간단한 모델이라고 해서 무엇이든 괜찮은 것은 아니다 ___이해하려는 깊이와 모델링 기법 ___수리 모델과 연역 ___모델에 지정한 메커니즘의 수준보다 근원적인 내용은 설명할 수 없다 11.3 응용 지향형 모델링의 요점 ___문제를 정의한다 ___성능을 중시해서 모델을 선택한다 ___데이터의 성질 ▣ 12장: 모델을 결정하기 위해 필요한 요소 12.1 변수를 선택한다 ___포함해야 할 변수, 포함하지 않는 변수 ___변수의 해석성 ___관계없는 변수는 제외한다 ___특징량 엔지니어링 ___이산값 변수와 연속값 변수 12.2 데이터 수집과 실험계획 ___주목하는 변수의 영향을 제어하면서 데이터를 수집한다 ___피셔의 삼원칙 ___피셔의 삼원칙은 데이터의 치우침을 알아내는 힌트다 12.3 수리 구조와 매개변수 선택 ___목적에 맞는 수리 구조를 선택한다 ___목적변수의 분산을 무시할 수 없는 경우 ___분산을 생각하지 않아도 되는 경우 ___매개변수 값의 범위 12.4 모델링에 실패하지 않으려면 ___기존 체계와의 일관성과 비교 ___망치만 가진 사람에게는 모든 것이 못으로 보인다 ___데이터에 적절한 전처리를 가한다 ▣ 13장: 매개변수를 추정한다 13.1 목적에 맞는 매개변수 추정 ___움직일 수 있는 매개변수와 움직일 수 없는 매개변수 ___매개변수를 점추정한다 ___변수의 움직임을 정량적으로 데이터에 맞추는 경우 ___단순히 오차의 크기의 평균을 계산한다 ___대수우도 ___확률분포 사이의 ‘차이’를 최소화하는 지표 ___교차 엔트로피 13.2 추정에서 목적함수를 최소화한다 ___목적함수를 최소화하려면 ___해석적으로 푼다 ___매개변수를 스윕한다 ___경사하강법 ___국소해에 빠지지 않으려면 ___과대적합을 피한다 ___목적함수를 최소화한다 13.3 베이즈 추정과 베이즈 모델링 ___베이즈 추정은 매개변수의 분포를 생각하는 것이다 ___매개변수의 확률분포란? ___추정된 분포를 특징짓는다 ___마르코프 연쇄 몬테카를로법 ___메트로폴리스법 ▣ 14장: 모델을 평가한다 14.1 ‘좋은 모델’이란 ___목적에 맞는 모델을 평가한다 ___메커니즘의 이해를 목적으로 한 모델 평가 ___통계적 추론을 실행하기 위한 모델 평가 ___응용 지향형 모델링에서 모델을 평가한다 14.2 분류 정확도를 측정하는 지표 ___적합성과 성능을 측정한다 ___정답률, 재현율, 특이도, 적합률, F값 ___ROC 곡선과 AUC 14.3 정보량 규준 ___모델이 복잡하면 적합도는 높아진다 ___아카이케 정보량 규준(AIC) ___베이즈 정보량 규준 BIC ___그 밖의 정보량 규준 14.4 널 모델과 비교, 우도비 검정 ___모델에 넣은 요소에 의미가 있는가 ___우도비 검정 ___통계검정과 널 모델 14.5 교차검증 ___모델의 성능을 미지의 데이터로 테스트한다 ___누수에 주의한다 ___모델의 신빙성과 미지의 데이터