책소개
이제는 누가 클릭할지, 누가 구매할지, 누가 합격할지 데이터를 통해 예측할 수 있다. 이 책, 〈예측 분석이다〉에서는 도대체 어떻게 이러한 일들이 가능한지, 학계의 연구에만 머물렀던 예측 기술이 현실의 비즈니스에서 어떻게 작용하고 있는지를 보여준다. 논픽션 어워드 2014 금상 수상작이도 한 이 책은 예측 사회를 살아가는 리더들이 꼭 알아야 할 의사결정 나무, 휴리스틱, 네트워크 분석, 앙상블 기법, 텍스트 분석, 예측 최적화 등의 키워드를 선진 기업들의 실제 적용 사례를 통해 생생하게 소개한다.
이제 예측 분석의 키워드를 이해하는 기업만 살아남는다. 기계 학습의 과정과 인공지능이 만들어준 놀라운 성과를 서둘러 만나보라. 예측 사회로 진입하는 지금, 프로그래머뿐 아니라 마케터, CEO 들의 일독을 권한다. 전 세계의 IT 업계를 달구고 있는 핫이슈인 예측 분석의 세계로 들어가 보자!
목차
- 옮긴이의 말 · 데이터 과학이라는 새로운 분야의 등장
- 서언 · 큰 힘에는 큰 책임이 따른다
- 머리말 · 이제 비즈니스의 규칙이 새로 쓰여진다
00 예측 분석의 매혹과 위험성
대기업과 예측: 자산의 미래 | 천리안을 가진 컴퓨터를 소개합니다 | “나에게 먹이를 주세요.” 컴퓨터는 데이터를 먹고 자란다 | 나는 당신이 그럴 줄 알았다 | 예측의 잠재력과 한계 | 꿈의 구장 | 예측은 비즈니스를 최적화한다 | 폐인들의 힘: 데이터 과학자 | 학습의 예술
01 예측이 주는 소리 없는 혁명
- 데이터 과학의 성과가 비즈니스의 판을 급격히 바꾸고 있다
예측 사회의 시작 | 누구나 예측 분석의 가치를 비용으로 환산할 수 있다 | 2분 후를 미리 볼 수 있는 사람이 할 수 있는 일 | 백만 달러짜리 소리 없는 혁명 | 개인별 맞춤화의 위험 | 오늘도 내일도 의미 있는 예측이 되려면? | 누가 클릭할지 알고 나니 매출이 껑충! | 예측 모델은 어떻게 만들어지는가 | 행동에 옮기는 것이 진정한 경쟁력 | 위험한 도전! 주식시장의 블랙박스 거래 시스템의 오류를 찾아라 | 지상관제탑 나와라! 문제가 생겼다, 오버! | 작은 모델이 할 수 있는 것들 | 지상관제탑 나와라! 이륙에 성공했다, 오버! | 존 엘더, 예측 분석 서비스 회사를 차리다 | 인간의 내면에 대한 예측
02 힘이 커질수록 책임도 커진다
- 휴렛팩커드, 쇼핑몰, 경찰은 당신의 비밀을 추론해 낸다
타깃의 예측과 예측의 타깃 | 여론몰이의 도화선이 된 프레젠테이션 | 기업이 그녀의 임신을 알아냈다! 후폭풍 | 쇼핑몰의 고객 예측, 사생활 침해 논란에 휩싸이다 | 순간이동할 수 있는 사물을 가둘 수는 없다 | 법과 질서: 정책, 정치, 규제 | 데이터를 둘러싼 전투 | 데이터 마이닝은 파헤치지 않는다 | HP, 누가 퇴사할 것인지 알아내는 예측 모델을 개발하다 | 빛과 그림자, 전 직원에게 ‘이직 위험’ 점수를 매기다 | 데이터 분석적 인사관리 | 통찰력: 퇴사에 영향을 주는 요소들 | 민감한 데이터 분석 보고서 다루기 | 남보다 앞서 나간 상태에서 그만두지 마라 | 범죄를 예측하여 사전에 예방한다 | 사기범 찾아내기 | 범죄 데이터와 데이터 범죄 | 측정되지 않은 컴퓨터 리스크 | 편견의 악순환과 판도라의 상자 | 좋은 예측, 나쁜 예측 | 힘의 원천
03 데이터 효과
- 대중의 집단 정서와 경기 변동의 관계
감정에 대한 데이터와 데이터에 대한 감정 | 블로그 게시물의 분위기 예측하기 | 불안 지수 | 사람들의 집단적 정서를 시각화하기 | 사람들의 기분이 좋을 때 당신의 돈을 투자하라 | 사람들의 기분과 주가의 관계 | 데이터 쓰레기 더미에서 보물을 찾아라 | 할 수 있는 모든 것을 계측화하라 | 데이터가 몰려온다! T.M.I. | 빅데이터의 ‘속도’에 주목하라 | 데이터는 언제나 우리에게 말을 건넨다 | 예측을 위한 변수들 | 예측 분석이 발견한 이상하고 놀라운 인간 행동들 | 상관관계가 인과관계를 의미하지는 않는다 | 감정의 원인과 결과 | 한 장의 그림이 주는 힘 | 대중의 기분과 경기 변동을 최초로 예측 | 우연한 발견을 마주치는 법 | 블로그 연구를 통해 투자를 고려하는 게 문제일까· | 돈이 세상을 움직인다 | 모든 것을 한 군데로 모으기
04 학습하는 기계 - 부동산 담보대출 리스크에 대한 체이스 은행의 예측 분석
데이터 과학자, 은행을 만나다 | 은행, 리스크에 직면하다 | 예측, 리스크와 싸우다 | 사업은 곧 리스크다 | 학습하는 기계 | 학습하는 기계 만들기 | 실패한 경험으로부터 학습하기 | 기계 학습은 어떻게 이루어지는가 | 의사결정 나무는 어떻게 만들어지는가 | 컴퓨터여, 너 자신을 프로그램하라 | 데이터를 통해 배우고 또 배운다 | 더 큰 것이 더 좋은 것이다 | 과잉학습: 너무나 많은 가정 | 귀납법의 수수께끼 | 기계 학습의 예술과 과학 | 기계가 제대로 학습되었는지 검증하려면 | 예술작품을 조각하듯 섬세하게 조정하라 | 의사결정 나무를 체이스 은행 업무에 적용하기 | 나무에서 돈이 자란다 | 예측 분석은 왜 글로벌 금융위기를 막지 못했나 | 더 우수한 성능을 위하여
05 앙상블 효과
- 넷플릭스, 크라우스소싱, 그리고 협력으로 예측 분석력 향상시키기
아마추어들, 데이터 분석 과학자 되다 | 데이터 분석도 통계학도 몰랐던 다크호스 | 마인드소싱: 다양성 속에 존재하는 성공 | 크라우드소싱이 날개를 달다 | 경쟁자와 공유하고 협력하면 이긴다 | 적과 연합하여 경쟁하라 | 메타 학습 | 이길 수 없다면 하나가 되어라 | 기계도 ‘집단 지성’을 발휘한다 | 예측 모델들의 대중적 지혜 | 예측 모델들을 담은 자루 | 실전에 투입된 앙상블 모델 | 일반화의 역설: 더 많다고 좋은 것은 아니다 | 예측의 힘, 한계는 없다
06 인간을 이긴 기계 학습
-컴퓨터 왓슨, 〈제퍼디!〉에서 어떻게 이겼나
텍스트 분석 | 기계에게 인간의 말은 너무 어렵다 | 질문을 이해했다면 이제 답변하라 | 지식의 원천은 이미 존재한다 | 애플의 시리 대 IBM의 왓슨 | 인공지능은 과연 가능할까· | 답변의 ‘정확성’을 예측한다 | 사람처럼 걷고, 사람처럼 말하다 | 왓슨의 학습을 위한 준비 방법 | 테크놀로지의 융합, 마술을 낳다 | 예측을 통한 공부시간의 최적화 | 왓슨의 데이터 수집법 | 왓슨이 답을 찾아가는 과정은· | 답안을 찾아내는 루틴들 | 앙상블 모델로 증거에 가중치 주기 | 앙상블의 앙상블을 구성하라 | 기계 학습이 자연어 처리의 잠재적 가능성을 실현하다 | 왓슨의 자기확신에 대한 평가 방법 | 생각의 속도를 높이기 위한 방법들 | 더블 제퍼디! 왓슨이 이길 것인가· | 〈제퍼디!〉 운명의 날은 다가왔다 | 승리를 위하여 | 대결 이후: 존경, 환호, 그리고 두려움 | Iambic IBM AI | 미래 예측을 뛰어넘어 대안 예측하기
07 숫자를 통한 설득
- 이동통신회사, 은행, 대통령선거에서 어떻게 ‘예측’을 활용하는가
이동통신회사, 누가 갈아탈 것인가 | 잠자는 사자의 코털을 건드리지 마라 | 예측해야 할 새로운 대상 | 생각의 변화를 눈으로는 볼 수 없다 | 영화에서나 가능한 일: 한 번에 여러 가지 마케팅 실험하기 | 상대를 설득하는 선택의 기술 | 당신도 사용자에게 미치는 영향을 테스트할 수 있다 | 어찌되었든 물건을 구입했을 사람을 찾아라 | 향상 모델링을 통한 영향력 예측 | 영향력을 통한 은행의 금융상품 판매 | 접촉을 해야만 물건을 사는 고객을 찾아라 | 반응 향상 모델링 | 향상 모델링의 작동 원리 | 향상 모델링은 어떻게 작동하는가 | 설득 효과 | 산업별로 알아보는 영향력 | 이동통신 고객들의 이탈을 막아라 | 부동층을 넘어서 : 설득 모델링은 어떻게 오바마가 재집권에 성공하도록 도와주었는가
부록 1 · 다섯 가지 예측 효과
부록 2 · 예측 분석 응용 사례 21가지
찾아보기