책소개
스마트폰과 소셜네트워크 활동이 대중화되고, 사물인터넷과 센서 등이 확산하면서 개인, 정부, 기업의 모든 활동이 데이터로 생성, 저장, 유통, 처리되어 새 로운 가치를 만드는 빅데이터 시대이다. 빅데이터는 단순히 크기가 큰 것만을 의 미하지 않고 데이터 형식과 처리 속도도 포함하여 기존의 방식으로 수집·저장· 처리·분석하기 어려운 데이터를 포함하여 정의되고 있다. 이 책은 2014년 빅데이터에 관한 관심이 커지면서 빅데이터가 무엇이고 어떻게 활용되며 그와 관련된 기술, 분석 방법, 문제점 등이 무엇인지에 대해 살펴보기 위해 만들어졌다.
2022년 현재 빅데이터의 시대가 빠르게 진전되어 이제 데이 터는 경제의 기본 생산요소인 자본, 노동에 더해지는 새로운 생산요소가 되었다. 이 책은 이러한 빅데이터 시대의 변화를 반영하여 빅데이터를 전반적으로 살펴보는 것을 목적으로 작성되었다. 이 책의 구성은 10개의 장으로 이루어져 있다. 제1장에서 빅데이터를 정의하 고 빅데이터와 관련된 주제를 전반적으로 소개한다. 제2장에서는 빅데이터의 수집에 대해서 정리한 후 각종 빅데이터 관련 서비스를 이용하여 빅데이터를 분석해 본다. 제3장에서는 익숙한 빅데이터인 텍스트 빅데이터의 분석에 대해 살펴본 다. 제4장에서는 빅데이터를 가장 직관적으로 볼 수 있는 데이터 시각화의 의미와 시각화 방법에 대해 살펴본다. 제5장에서는 빅데이터가 본격적으로 이용되어 성 과를 보였던 추천시스템에 대해 살펴보고, 제6장에서는 빅데이터 기반으로 만들 어지는 기계학습에 대해 살펴본다. 제7장과 제8장에서는 기업의 빅데이터를 이용한 의사결정과 빅데이터를 이용한 기업 경영의 변화에 대해 살펴본다. 제9장에서는 빅데이터를 저장·처리·분석할 수 있는 빅데이터 관련 기술을 살펴본다. 제10장에서는 빅데이터 시대에 나타나는 문제 중 하나인 개인정보 및 프라이버시 보호에 대해 살펴보고 이와 관련된 법적, 기술적 문제에 대해 살펴본다.
저자소개
서울대학교 언론정보학과 교수. 미국 카네기멜론대학 School of Computer Science에서 HCI 전공으로 박사학위를 받았다. 인간-컴퓨터 상호작용 분야의 전문가다. 벤처창업과 IT와 콘텐츠 산업의 실무 경험을 가지고 있으며, Human-AI Interaction, 소셜컴퓨팅과 로봇저널리즘 분야의 다양한 연구를 수행하고 있다. 저서로는 『호모마키나: 기계와 함께하는 인간의 미래』 (공저, 2020) 등이 있다.
목차
제1장 빅데이터의 개요
1. 빅데이터 시대
2. 빅데이터의 확산 배경
3. 빅데이터의 정의
4. 데이터 분석
5. 데이터 과학자
6. 데이터 경제
제2장 빅데이터의 수집과 활용
1. 빅데이터의 수집
2. 검색데이터의 활용
3. 텍스트데이터의 활용
4. 웹페이지 데이터의 수집과 활용
5. API를 이용한 데이터의 수집과 활용
제3장 텍스트 빅데이터
1. 텍스트 처리와 자연어 처리
2. 자연어 처리 기술의 활용
3. 텍스트 전처리
4. 단어의 표현방법
5. 언어모형
제4장 빅데이터 시각화
1. 데이터 시각화
2. 시간 시각화
3. 텍스트 시각화
4. 소셜네트워크 시각화
5. 데이터 시각화의 도구
제5장 추천시스템
1. 추천시스템 소개
2. 연관성 분석
3. 협력적 정화방법과 행렬분해
4. 추천시스템의 평가
제6장 기계학습
1. 인공지능의 역사
2. 기계학습의 구분
3. 기계학습 응용사례
제7장 빅데이터 의사결정
1. 빅데이터를 활용한 가치창출 과정
2. 빅데이터 의사결정의 4단계
제8장 빅데이터 기업 경영
1. 빅데이터와 기업 경영성과
2. 빅데이터와 경영
제9장 빅데이터 기술
1. 빅데이터 처리 인프라와 프레임워크
2. 하 둡
3. 스파크
4. 대스크(Dask)
5. 계산 그래프
6. Dask를 이용한 기계학습
제10장 개인정보와 프라이버시 보호
1. 빅데이터 시대와 개인 데이터
2. 개인정보와 프라이버시의 정의
3. 개인 데이터의 수집
4. 개인정보의 침해 사례
5. 데이터 관련 개인정보의 보호 제도
6. 개인정보의 기술적 보호