R통계데이터 분석과 시각화
R이라는 패키지는 STATA나 파이썬(Python)과는 다른 매력을 지니고 있다. SPSS의 사용 편리성과 SAS의 다기능을 가진 것이 Stata라면, R은 정형/비정형 데이터수집에 뛰어난 기능을 갖고 있어 알고리즘에 감각이 있는 사람이라면 다양한 프로그램을 연동시켜 깡통처럼 활용하면 좋을 듯하다. 파이썬이 대세라고는 하지만 파이썬은 엄격한 통계분석에는 어울리지 않는 특성을 지니며 세밀한 통계 기능을 갖추고 있지 못한 부분이 있다. 세련된 알고리즘 처리는 파이썬으로 하고, 투박하지만 엄격한 통계는 R을 사용하는 것이 맞다. “하우즈만은 R로 하는 것이 옳다!” 이 말을 알아듣는 사람은 R과 파이썬을 자유자재로 다룰 줄 아는 사 람이다. “R을 왜 해? 파이썬을 써야지!” 이 말을 하는 사람은 R과 파이썬을 둘 다 잘 모르는 사람임에 틀림없다.
지금은 4차 산업혁명 시대를 논하는 시점이 되었다. 빅데이터, 인공지능, 블록체인 등등 새롭고 놀라운 주제어들이 주변을 꽉 채우고 있다. 우리 연구자들은 물론 사회생활을 준비하는 학생들에게 어렵고 도전적인 과제를 남겨주는 무섭고 두려운 개념들이다. 그렇다고 그냥 주저 앉아 있어도 된다는 뜻도 아니며, 그럴 수도 없다. 본 저자도 인공지능 파이썬 고급과정 을 수료하고 이제 마이크로소프트 교육과정을 수강하고 있다. 수강 목적은 상경계열 학생들이 자신의 전공분야를 살리면서 지향해야 할 빅데이터 분석과 인공지능 활용을 위한 방향을 설정하는데 도움이 되는 지도교수가 되기 위함이다. 상경계열 학생들이 단순히 컴공 전공자 들을 따라가려는 모습은 바람직해 보이지도 않고 자신의 장점을 아쉽게 스스로 포기하는 것 같아 매우 안타깝다.