R과 파이썬 머신러닝 어프로치
연구 논문을 위한 『R과 파이썬 머신러닝 어프로치』는 〈R에 들어가기〉, 〈R 지도학습〉, 〈R 비지도학습〉, 〈파이썬에 들어가기〉 등 크게 6부로 나누어져 있으며 R과 파이썬 머신러닝 어프로치에 대한 내용이 수록되어 있다.
본서의 특징은 다음과 같다
첫째, 동일한 주제를 놓고 R과 파이썬 두 언어로 해결하는 방법을 이해한다.
두 언어는 마치 영어와 스페인어처럼 유사하다. 두 언어를 배우면 동질감과 이질감의 맛을 느낄 수 있다. 예컨대 회귀분석을 R에서 해 보고 파이썬에서도 시도한다면 전문성을 갖는 데에 유리할 것이다. 그리고 주피터 노트북(파이썬)에서도 R분석이 가능하도록 설명하였다
둘째, 논문을 쓰기 위한 분석 과정에서 논리적이고 통계학적인 경험을 다양하게 얻는다. 머신러닝 분석 방법에는 크게 지도학습과 비지도학습이 있다. 각 장에서는 하나의 자료뿐만 아니라 다른 여러 자료를 경험하도록 제시하고 있다. 그리고 유의확률과 유의수준 개념을 알면 결과 해석이 가능하다.
셋째, 다양한 자료 원천에서 기초 자료를 획득하고 정제하는 방법을 배운다. 기본적으로 R이나 파이썬에는 많은 자료가 내장되어 있다. 이뿐만 아니라 UCI Machine Learning Repository, 머신러닝 10대 블로그 등에 자료가 넘치고 있다. 그런데 이러한 자료들은 원천마다 특징이 있고 분석을 위해 정제해야 한다. 본서는 이 방법을 상세하게 설명하고 있다.