세상을 읽는 새로운 언어, 빅데이터
서울대 가지 않아도 들을 수 있는 명강의, ‘서가명강’ 시리즈
“인공지능 시대에
어떻게 원하는 것을 얻을 것인가?“
◎ 도서 소개
서울대 가지 않아도 들을 수 있는 명강의, ‘서가명강’
칸트의 ‘3대 비판서’를 통해 이뤄낸 위대한 철학 혁명
대한민국 최고의 명품 강의를 책으로 만난다! 현직 서울대 교수진의 강의를 엄선한 ‘서가명강(서울대 가지 않아도 들을 수 있는 명강의)’ 시리즈의 다섯 번째 책이 출간됐다. 역사, 철학, 과학, 의학, 예술 등 각 분야 최고의 서울대 교수진들의 명강의를 책으로 옮긴 서가명강 시리즈는 독자들에게 지식의 확장과 배움의 기쁨을 선사하고 있다.
『세상을 읽는 새로운 언어, 빅데이터』는 대한민국 최고의 빅데이터 전문가인 서울대 산업공학과 조성준 교수가 인공지능 시대의 새로운 자원이자 화폐라 불리는 빅데이터에 대해 쓴 대중교양서다. 빅데이터의 정확한 실체와 위상은 모를지라도 누구나 ‘데이터’의 힘을 느끼고 있다. 그야말로 일상의 모든 것이 데이터가 되는 세상에서 우리는 빅데이터를 어떻게 바라봐야 할까? 빅데이터란 무엇이며, 어떻게 생성되고 저장되고 활용될까? 데이터의 소비자이자 생산자이기도 한 우리는 빅데이터의 주인이라 할 수 있을까? 우리의 권리를 확보하고 확장하기 위해서 어떻게 대응해야 할까? 이제 빅데이터에 대한 이해는 다가올 미래에 어떻게 원하는 것을 얻을 수 있을지에 대한 답이 될 것이다.
◎ 추천사
언어가 문자화되어 세상의 지혜를 전하던 시절, 문해력은 진리를 탐구하는 이들에게 필수불가결한 능력이었다. 무수히 쌓인 데이터 속 진리를 구한다면 반드시 필요할 새로운 언어를 배우고 싶은 모든 분들에게 일독을 권한다.
송길영, 마인드 마이너 · ㈜다음소프트 부사장
아날로그 구질서가 붕괴하고 디지털 신질서가 수립되는 문명적 전환기다. 디지털 시대의 미래를 조망해온 학자로서의 풍부한 식견과 현장에서의 다양한 실무 경험을 기반으로 빅데이터라는 디지털 시대의 언어를 이해하고 활용하는 실질적 방법에 대한 통찰과 조언으로 가득하다.
김경준 딜로이트 컨설팅 부회장
◎ 출판사 서평
인공지능 시대에 어떻게 원하는 것을 얻을 것인가?
빅데이터가 열어갈 새로운 세상!
서울대학교 산업공학과 교수이자 정부 산하의 공공데이터전략위원회 위원장을 맡고 있는 『세상을 읽는 새로운 언어, 빅데이터』의 저자 조성준 교수는 국내 최고의 빅데이터 권위자로 손꼽힌다. 빅데이터, 인공지능, 머신러닝 등의 분야에서 활동하고 있는 저자는 정부 및 공공기관, 유수의 기업으로부터 초빙되어 빅데이터와 인공지능을 연구, 자문, 교육하며 현장에서 의미 있는 사례들을 만들어 나가고 있다. 이 책 『세상을 읽는 새로운 언어, 빅데이터』는 기업 사례와 저자의 연구를 바탕으로 빅데이터에 대한 핵심만 모아 정리한 것으로, 최근 가장 뜨거운 화두 중 하나인 빅데이터의 정확한 정의와 함께 빅데이터가 어떻게 가치로 탄생되고 혁신을 이루어내는지에 대한 연구와 활용 방법을 담고 있다.
이 책에서 저자는 “빅데이터에 대한 이해는 결국 빅데이터로 승부하는 세상에서 어떻게 살아갈 것인지를 고민하는 기본 소양이 될 것이다”라고 강조한다. 즉 다가올 미래에 원하는 것을 구할 수 있는 기회가 ‘빅데이터’에 있다는 것이다. 앞으로 인공지능이 우리 삶에 커다란 변화를 가져올 것을 의심하는 이는 없다. 이 인공지능을 구현하는 데 필수적인 것이 바로 빅데이터다. 인공지능은 빅데이터를 통한 학습을 필요로 하기 때문이다. 빅데이터가 인공지능 시대의 새로운 자원이자 화폐라 불리는 이유다. 저자는 최근 10년간 크게 달라진 빅데이터의 위상이 앞으로 10년 후 지금과 비교했을 때 또 달라져 있을 것이라 전망한다. 데이터의 양은 폭발적으로 증가하고 있을 뿐 아니라, 이를 처리할 수 있는 컴퓨터 기술 또한 획기적으로 향상되고 있다. 그전까지는 보지 못했던 새로운 가치를 빅데이터를 통해 읽을 수 있는 능력이 생긴 것이다. 빅데이터의 중요성은 몇 번을 강조해도 부족하지 않다. 그런 만큼 빅데이터에 대한 이해 또한 필수적이라고 할 수 있겠다.
마케팅, 영업, 금융, 의료, 사회, 행정, 정치…
빅데이터로 어디까지 예측할 수 있을까?!
조성준 교수는 이 책에서 빅데이터가 인공지능, 머신러닝, 시각화 등 다양한 데이터 분석법을 통해 ‘인사이트’, 즉 통찰력으로 바뀌고 가치를 만드는 복잡한 과정을 전공자가 아닌 누구라도 이해하기 쉽게 설명하고 있다. 또한 빅데이터에서 발견한 인사이트로 세상을 혁신할 수 있는 새로운 시대가 왔다는 사실을 직접 경험하고 목격한 현장 사례로서 생생하게 보여준다.
저자는 국내의 한 영화 배급사와 함께 개봉 전 데이터 분석을 통해 미리 관객 수를 예측한 사례를 소개하기도 한다. 그전까지는 관객 수 예측이 경험을 토대로 이뤄졌지만, 정확하지 않을뿐더러 예측이 틀려도 그 원인을 알 수 없는 등의 문제가 있었다. 그러나 저자와 연구팀은 국내 개봉한 모든 영화의 장르, 국가, 제작사, 배우, 감독, 제작비, 대중의 인지도, 선호도 등의 데이터를 확보해 분석함으로써 개봉 후 첫째 주 토요일 관객 수를 예측할 수 있었다. 이러한 예측은 데이터가 쌓이고 분석을 거듭할수록 더욱 정확해진다.
빅데이터가 만드는 혁신은 기업 마케팅에 그치지 않는다. 이 책에는 스마트폰 사용으로 생성되는 위치 데이터, 통신 가입자 주소 데이터, 스마트카드를 통한 택시 승하차 데이터를 종합해 최적의 서울시 심야버스 노선을 만드는 등 공익적 가치가 창출된 사례들 또한 소개하고 있다. 지금까지 빅데이터를 데이터 사이언티스트의 전유물로 생각해왔던 독자들도 빅데이터를 활용해 만들어진 금전적·비금전적 이익이 개인의 삶에 어떠한 영향을 미칠 수 있는지 확인한다면 빅데이터의 무한한 가능성을 발견할 수 있을 것이다.
누가 빅데이터의 주인이 될 것인가?
거부할 수 없는 미래, 미래를 지배할 빅데이터!
스마트폰, 소셜미디어, 사물인터넷 등에 의해 우리는 일상의 모든 것이 빅데이터가 되는 세상에서 살아가고 있다. 휴대폰 전원을 켜는 순간 위치 데이터가 생성되고, 구글에 검색하는 단어, 페이스북과 인스타그램에 올리는 사진, ‘좋아요’를 누르는 패턴 모두 데이터화된다. 그러나 실제 빅데이터를 소유하고 있는 것은 대부분 대기업이다. 빅데이터를 모으고 보관하는 데 자본이 필요하기 때문이다. 여기에서부터 빅데이터를 둘러싼 수많은 논쟁이 시작된다. 개인의 사생활은 보호될 수 있는가? 누군가에 의해 침해되고 조종될 수 있지는 않을까? 과연 빅데이터는 공공의 이익을 위할 수 있는가? 빅데이터가 열어갈 밝은 미래를 마냥 낙관할 수만은 없다고 말하며 빅브라더에 대한 공포심을 자극하는 부정적 시선에 이 책의 저자는 반문한다. “새로운 세상으로 진보할 것인가, 아니면 프라이버시 보호를 위해 과거에 머물 것인가?”
이 책의 저자는 빅데이터가 가져올 변화를 피할 수 없는 미래라 인식하고 있다. 기술의 진보에는 언제나 득과 실이 함께한다. 개인정보는 보안 정책과 법을 다듬는 것으로 보호할 수 있다는 것이 저자의 주장이다. “새로운 기술이 성취해낸 생산성을 포기하기보다 손해를 최소화하는 방향을 함께 찾는 것이 중요하다”라고 역설한다. 무엇보다 우리는 “데이터의 생산자로서 어떠한 주인의식을 가져야 하는가?”라는 저자의 질문에 더 주목해야 할 것이다. 우리의 권리를 확보하고 확장하기 위해, 데이터 관련 규제를 만드는 입안자들에게 어떤 의견을 개진해야 할지 알기 위해, 빅데이터가 열어갈 세상에서 각자 삶의 주인으로서 당당한 미래를 만들어가기 위해 빅데이터에 대한 올바른 이해가 필요할 것이다.
◎ 책 속에서
21세기 초반에 살고 있는 우리는 앞으로 인공지능이 우리 삶에 커다란 변화를 불러일으킬 것이라는 데 의심하지 않는다. 인공지능은 컴퓨터가 빅데이터를 학습해서 지능적으로 행동하는 것이다. 따라서 빅데이터 없이 인공지능은 구현되지 못한다. 휘발유 없이 자동차가 움직이지 못하는 것과 같다. 그래서 데이터를 새로운 자원 또는 신(新)경제의 화폐라고도 한다.
【들어가는 글 : 12쪽】
이미지 데이터와 텍스트 데이터는 사실상 컴퓨터가 처리하기 전에 전부 숫자로 변환된다. 컴퓨터는 이 세상에 있는 모든 단어와 이미지를 숫자로 바꿔준다. 사용된 단어가 의미적으로 가까운 개념의 단어들로 숫자 코드가 유사하다면 추후 분석을 할 때에 유용하게 사용될 수 있다. 예를 들어 ‘아버지’와 ‘아빠’에 대응되는 숫자 코드는 서로 유사한 값을 갖고, ‘아버지’와 ‘우주선’에 대응되는 숫자 코드는 매우 다른 값을 갖는 것이다.
【미래를 여는 기술, 빅데이터란 무엇인가 : 39쪽】
분석가가 빅데이터를 인사이트로 바꾸고, 현업 의사결정자가 인사이트 기반의 액션을 실행하면 비즈니스 가치를 얻을 수 있다. 그리고 그 과정에서 가장 중요한 것은 결국 최종적인 가치다. 이 가치를 만들기 위해 우리에게 어떤 인사이트가 필요한지, 인사이트를 만들기 위해 어떠한 데이터가 있어야 하는지를 거꾸로 생각하는 것이 기획이다.
【더 나은 삶을 위한 빅데이터 사용법 : 75쪽】
기업이나 공공기관에서 빅데이터를 활용해서 인사이트를 도출하겠다고 하면, 나는 우선적으로 무조건 데이터를 모아서 시각화해보라고 말한다. 복잡한 분석 기법을 적용하기 전에 눈으로 보고 직관적으로 이해할 수 있는 게 정말 많기 때문이다. 또한, 이러한 시각화 분석을 통해 향후 분석 단계에서 무엇을 더 이해하고 예측하고 싶은지에 대한 아이디어가 떠오를 수도 있기 때문이다.
【빅데이터가 ‘가치’로 탄생하기까지 : 166~167쪽】
구글, 페이스북 등은 무료 인터넷 서비스를 제공하면서 자연스럽게 고객 데이터를 수집한다. 아마도 세계에서 소비자 데이터를 가장 많이 확보한 회사는 구글일 것이다. 구글은 왜 우리에게 무료로 검색을 하게 해주는가? 검색 단어만으로도 언제 어디서 누가 무엇에 관심을 가지고 있는지 전 세계인의 관심 동향을 손바닥 위에 올려놓고 볼 수 있기 때문이다. 구글은 이렇게 막대한 정보를 가지고 어떻게 돈을 벌 것인지를 고민하고 있다.
【빅데이터, 거부할 수 없는 미래 : 263쪽】
사실상 배움의 장벽이 불과 수년 전과 비교해도 엄청나게 낮아지고 있는 것이다. 이제는 전공과 관계없이 관심 있는 누구나 빅데이터 혁명에 능동적으로 참여할 수 있다. 게다가 빅데이터는 누구든지 확보 가능하다. 특히, 데이터는 토지와 같은 한정된 자원이 아니다. 토지를 차지하려면 엄청난 비용을 지불하거나 혁명을 일으켜서 토지 개혁을 하는 방법밖에 없다. 그러나 데이터는 한정된 자원이 아니다. 돈이 많든 적든, 힘이 세든 약하든 누구에게나 데이터를 가질 수 있는 가능성이 열려 있다. 마치 신대륙이 생긴 것과 마찬가지다. 지금의 이 기회를 잘 활용하면 당신도 데이터의 주인이 되지 못할 이유가 없다. 내가 꿈꾸는 세상을 만드는 기획, 바로 우리 자신이 할 수 있는 것이다. 어떠한가, 여러분도 한번 도전해보고 싶지 않은가?
【나가는 글 : 274~275쪽】