책소개
이 교재를 통해 R과 친숙해지고 다양한 분석 방법을 R로 구현하는 방법을 습득하여, 실제 데이터로부터 유용한 정보를 얻어 내는 능력을 기를 수 있게 되기를 기대한다. 이 교재는 다음과 같이 구성되어 있다.
제1장 ‘R 데이터 처리’에서는 데이터를 다루는 다양한 방법을 정리하고, 특히 최근에 각광을 받는 dplyr 패키지를 이용하여 데이터를 처리하는 방법을 소개하였다. 제 2장 ‘통계계산’에서는 여러 가지 확률 분포에 대한 R 함수를 소개하였고, 제3장 ‘통계추론’에서는 추정과 가설검정에 관련된 이론을 복습하고 R로 구현하는 방법을 정리하였다. 제4장 ‘R 통계 그래픽스’에서는 lattice 패키지와 ggplot2 패키지를 이용하여 데이터를 시각화하는 다양한 방법을 소개하였다. 제5장 ‘R을 이용한 고급 그래픽 기법’에서는 빅데이터 시각화, shiny를 이용한 웹 프로그래밍, knitr 패키지를 이용한 다이내믹 문서작성을 소개하였다. 제6장 ‘일반화 선형모형’에서는 예시 자료를 이용하여 일반화 선형모형에 해당하는 다양한 분석 방법을 적용하고 통계적으로 모형을 선택하는 방법을 소개하였다. 제7장 ‘분류’에서는 다그룹 로지스틱 회귀, 판별분석, 나무방법, 신경망, 서포트벡터 기계 등의 분류 방법을 R을 이용하여 구현하는 방법을 소개하였다.
저자소개
서울대학교 자연과학대학 통계학과(이학사) 및 수학과(이학사)
미국 University of North Carolina at Chapel Hill, 통계?운용과학과(통계학박사)
미국 University of Chicago 건강의학과 연구교수
미국 University of Pittsburgh 의학과 조교수, 부교수
서울아산병원 울산의대 의학통계학과 연구부교수
- 현재: 한국방송통신대학교 자연과학대학 통계?데이터과학과 교수
목차
CHAPTER 1 R 데이터 처리
1.1 R과 RStudio
1.2 R 사용 준비
1.3 R 데이터
1.4 R 데이터 처리
CHAPTER 2 통계계산
2.1 모의실험
2.2 복원 및 비복원 추출
2.3 확률난수의 생성, 누적분포함수, 확률밀도함수 및 분위수 계산
2.4 균등분포
2.5 정규분포
2.6 카이제곱분포
2.7 지수분포와 감마분포
2.8 t-분포
2.9 f-분포
2.10 포아송분포
2.11 베르누이 시행과 이항분포
2.12 기하분포
2.13 음이항분포
2.14 초기하분포
CHAPTER 3 통계추론
3.1 일표본 모평균에 대한 추론
3.2 독립 이표본 모평균에 대한 추론
3.3 대응표본 모평균에 대한 추론
3.4 일표본 및 이표본 평균 추론에 대한 R 함수
3.5 비율에 대한 추론
3.6 모분산에 대한 추론
3.7 상관계수에 대한 추론
3.8 도수분포표 및 분할표에서 적합도 및 독립성 검정
3.9 회귀분석 추론
3.10 일원배치 분산분석에 대한 추론
CHAPTER 4 R 통계 그래픽스
4.1 R을 이용한 통계 그래픽스
4.2 lattice 패키지를 이용한 다양한 그래픽스
4.3 그래픽 문법을 이용한 ggplot2 패키지의 활용
CHAPTER 5 R을 이용한 고급 그래픽 기법
5.1 빅데이터 시각화
5.2 shiny 라이브러리를 이용한 웹 프로그래밍
5.3 knitr 라이브러리를 이용한 다이내믹 문서 작성
CHAPTER 6 일반화 선형모형
6.1 회귀분석과 선형모형
6.2 선형모형과 일반화 선형모형
6.4 모형의 선택과 추정
6.5 R의 lm, glm 함수
6.6 자료분석 사례
CHAPTER 7 분 류
7.1 다그룹 로지스틱 회귀
7.2 판별분석
7.3 신경망 분류 방법
7.4 나무방법
7.5 서포트벡터 기계
7.6 조율모수의 설정과 여러 방법의 비교