책소개
입문자를 위한 R 데이터 분석 프로그래밍!데이터 분석을 하기 위한 도구와 분석 요령을 배우기 위한 입문자들을 위한 도서로, 복잡한 수학이나 어려운 통계학적 이론은 빼고 꼭 필요한 정보만 이해할 수 있도록 예제와 함께 설명하고 있다. 특히 R을 활용하여 머신러닝의 지도학습과 비지도 학습을 구분하여 자세하게 설명하기 때문에, 연습 문제를 따라해 보면서 자신만의 결과값을 완성해 볼 수 있다. 그리고 R의 핵심 명령어 23개 및 효과적인 분석을 지원하는 데이터 조작 패키지를 알아보고, 통계 분석의 개념과 표본 생성 및 기초 통계량에 대해서도 자세하게 알아본다. 기본적인 설명 이후에는 통계학의 기본인 회귀 분석을 응용하여 신경망을 공부하며 딥러닝과 관련된 기술적 흐름에 대해서도 학습해 볼 수 있다. R을 시작하는 초심자가 활용하기 적합한 구성의 도서이다.
저자소개
중원대학교 컴퓨터공학과 교수로 재직 중이며, HP KOREA, OPENWAVE KOREA, MACROMEDIA KOREA, SK C&C에서 근무했습니다. 컴퓨터 응용 분야에 관심이 많고, 25년 동안 컴퓨터 관련 실무를 수행하며, 수많은 기업체에서 컴퓨터 원리와 응용에 대해 강의하였습니다. 소셜 네트워크와 데이터마이닝, 머신러닝에 관련된 분야에 관심을 가지고 연구하고 있으며, 다음에는 데이터 분석에 대한 주제를 가지고 독자들과 만날 계획입니다.
주요 저서
「빅데이터 분석을 위한 R 프로그래밍(2016)」
「프로그래머가 알아야 할 1%의 핵심원리(2009)」 공저
목차
PART 1. R의 사용법1. R의 사용법1.1 소개 및 환경 구성 1.2 기초 사용법 1.3 데이터 타입 1.4 프로그래밍 기능 1.5 데이터 조작 관련 명령어 정리 1.6 데이터 조작 관련 패키지 사용 1.7 요약 2. 데이터 시각화 2.1 그래프 그리기 절차의 요약 2.2 그래프 구성의 결정 2.3 그래프의 다양한 옵션 2.4 단계별로 그래프 그리기 2.5 기본 그래프 그리기2.6 그래프의 부가적인 기능 2.7 다양한 그래프 소개 2.8 패키지를 사용한 그래프 그리기 2.9 패키지를 사용한 그래프 그리기 - ggplot2 패키지 2.10 데이터 시각화 방법 정리 2.11 요약 PART 2. R을 사용한 통계 분석3. 통계 분석 3.1 통계 분석의 설명에 대한 전체 요약 3.2 표본 생성 및 기초 통계량 3.3 독립성 및 적합성 검정 3.4 통계 분석의 종류 3.5 차이 검정 3.6 인과(상관)관계 검정 3.7 요약 PART 3. R의 활용법4. 회귀 분석 4.1 선형회귀 4.2 중선형회귀 및 적절한 변수의 선택 4.3 신경망 4.4 커널 방법론 4.5 로지스틱 회귀 4.6 다항 로지스틱 회귀 4.7 요약5. 기계학습 5.1 개념 5.2 의사결정 트리 5.3 앙상블 5.4 서포트 벡터 머신 5.5 베이지안 추론 5.6 요약 6. 빅데이터 분석 6.1 개념 6.2 군집 분석 6.3 차원 축소 기법 6.4 연관 규칙 분석 6.5 판별 분석 6.6 요약 7. 시계열 분석 7.1 개념 7.2 시계열 데이터의 생성 7.3 시계열 데이터의 분석 절차(ARIMA 기준) 7.4 시계열 데이터의 분해 단계 7.5 시계열 데이터의 변환 단계 7.6 최적화된 파라미터의 결정 단계 7.7 모형 만들기와 예측 단계 7.8 변환하지 않은 시계열 데이터 기반의 예측(옵션) 7.9 시계열 데이터의 군집화(옵션) 7.10 요약 8. 특수 분석 8.1 워드 클라우드 8.2 소셜 네트워크 분석 8.3 구조 방정식 8.4 시뮬레이션과 몬테카를로 시뮬레이션 8.5 요약 PART 4. 데이터 분석 및 전처리 기법9. 데이터 분석 및 전처리 기법 9.1 데이터 분석에 필요한 역량 9.2 데이터 분석의 유형 9.3 데이터 탐색 과정 9.4 데이터 전처리 과정 정리(데이터 클린징) 9.5 추가 데이터 전처리 기법 9.6 효과적인 분석을 위한 변수의 제거 및 선택 9.7 요약10. 마무리