책소개
정확성과 심미성을 모두 갖춘 데이터 시각화에 대한 바이블!
통계적 본질에 근거해 데이터 분석 결과를 효율적으로 전달하는 데이터 시각화에 대한 모든 것!
데이터 시각화는 예술이자 과학이다. 과학적으로 정확하면서 미적으로 흉하지 않아야 하며, 또한 미적으로 탁월하면서도 과학적으로 오류를 용납하지 않는 결과물을 만들어야 한다. 데이터 시각화는 무엇보다도 데이터를 정확하게 전달해야 한다. 데이터 분석 결과를 정보 왜곡 없이 사실 그대로, 그리고 보는 사람에게 인지적 부담 없이 쉽고 명확하게 전달하는 ‘그래프와 차트, 도표’ 제작 방법에 대한 기본 원리와 실전 응용에 대해 자세히 설명한다. 데이터 과학자, 디자이너, 마케터, 컨설턴트, 학생, 교수, 의사, 기자, 직장인, 기업 대표 등 누구나 할 것 없이 정확하고 올바른 정보 전달에 관심 있는 이라면 누구나 참고해서 읽어야 할 책이다.
저자소개
저자 : 클라우스 윌케
저자 : 클라우스 윌케
Claus O. Wilke
텍사스 대학교 오스틴 캠퍼스의 통합 생물학 교수다. 독일 보훔 루르 대학교에서 이론 물리학 박사 학위를 받았다. 계산생물학, 수학적 모델링, 생물정보학, 진화생물학, 단백생화학, 바이러스학, 통계학을 주제로 한 과학 논문 170편 이상을 단독 또는 공동으로 저술했다. 카우플롯(cowplot), 지지릿지(ggridges) 등 데이터 시각화에 쓰이는 인기 R 패키지를 작성하고, 지지플롯2(ggplot2) 패키지 제작에도 기여했다.
역자 : 권혜정
국민대학교 시각디자인학과를 졸업했다. GE, 엠파이어스테이트빌딩, 태블로 등 다양한 글로벌 기업의 번역, 트랜스크리에이션, 카피라이팅 프로젝트에 참여해왔다. 그 외에 도서 번역가로도 활동 중이며, 지금까지 옮긴 책은 『인포그래픽이란 무엇인가』, 『터치스크린 모바일 게임 디자인』, 『내부 고발자들, 위험한 폭로』(이상 에이콘출판사), 『테트리스 이펙트』, 『피, 땀, 픽셀』(이상 한빛미디어), 『계획된 불평등』(이김) 등 15권이다. 한편 10년 안에 음반을 완성하겠다는 목표로 노래들을 만들고 있다. 블로그 aeki.me에 소소한 생각, 작곡한 노래들을 올린다.
감수 : 최재원
일본 게이오 대학원을 졸업하고 아주대 대학원에서 학습분석(Learning Analytics)으로 박사 학위를 취득했다. 대학에서 통계와 데이터 사이언스 과목을 강의했으며 현재는 아주대학교에서 데이터 분석 업무를 담당하고 있다. 『데이터 시각화, 인지과학을 만나다』, 『IT 개발자의 영어 필살기』, 『대학혁신을 위한 빅데이터와 학습분석』 등을 번역했다.
목차
1장_ 시작하며: 이 책의 내용과 구성
__이 책의 예시 그래프를 이해하는 법
[1부] 데이터, 시각화로 날개를 달다
2장_ 데이터 시각화: '읽는' 데이터에서 '보는' 데이터로
__시각적 속성의 의미와 데이터 유형
__데이터 값을 시각적 속성으로 바꾸기
3장_ 위치 스케일: 좌표와 축
__데카르트 좌표
__비선형 축
__곡선 축이 있는 좌표계
4장_ 색상 스케일
__색을 활용한 데이터 구분
__색을 활용한 데이터 값 표현
__색을 활용한 강조
5장_ 다양한 시각화 방식
__수량의 시각화
__분포의 시각화
__비율의 시각화
__x-y 관계로 나타내는 시각화
__지리공간 데이터의 시각화
__불확실성의 시각화
6장_ 수량 데이터의 시각화
__막대 도표의 다양한 활용
__묶은 막대와 누적 막대
__점 도표와 히트맵
7장_ 데이터 분포의 시각화: 히스토그램과 밀도 도표
__단일 분포 상태의 시각화
__여러 분포 상태를 하나의 도표로 시각화
8장_ 데이터 분포의 시각화: 경험적 누적 분포 함수와 QQ 도표
__경험적 누적 분포 함수
__고도의 비대칭 분포
__QQ 도표
9장_ 여러 분포 상태의 결합 시각화
__가로축에 기준을 둔 분포 상태의 시각화
__세로축에 기준을 둔 분포 상태의 시각화
10장_ 비율 데이터의 시각화
__파이 차트
__병렬 막대 도표
__누적 막대와 누적 밀도 도표
__전체 대비 부분 비율의 표현
11장_ 내포된 비율 데이터의 시각화
__내포 비율 시각화의 잘못된 사례
__모자이크 도표와 트리맵
__내포 파이 차트
__평행 집합
12장_ 여러 정량 변수의 관계 시각화
__산점도
__상관곡선
__차원 축소
__쌍 데이터
13장_ 독립 변수의 시계열 데이터와 함수 시각화
__단일 시계열 데이터
__다중 시계열 데이터와 용량-반응 곡선
__2개 이상의 반응 변수를 포함한 시계열 데이터
14장_ 추세의 시각화
__평활화를 통한 데이터 보정
__정의된 함수 형식으로 추세 시각화
__추세 제거와 시계열 데이터 분해
15장_ 지리공간 데이터의 시각화
__투영 도법
__레이어를 활용한 지도
__단계구분도
__단순화한 카토그램
16장_ 불확실성의 시각화
__빈도의 개념을 이용한 확률의 시각화
__점 추정의 불확실성 시각화
__곡선 적합의 불확실성 시각화
__가설적 결과 도표
[2부] 그래프 디자인의 기본 원칙
17장_ 잉크 양 비례의 원칙
__선형 축 도표 그리기
__로그 축이 있는 도표 그리기
__데이터 값을 면적으로 나타내기
18장_ 오버플로팅: 겹치는 점 처리 방법
__반투명 값과 지터링
__2차원 히스토그램
__등고선 그래프
19장_ 효과적인 색 사용을 위한 조언
__목적 없는 무분별한 색 사용은 금물
__비단조적 색상 스케일 구성
__색각 이상자를 배려하자
20장_ 불필요한 기호화
__불필요한 기호화는 범례 디자인을 망친다
__범례가 없어도 좋은 도표
21장_ 여러 개의 패널로 구성된 도표
__소형 다중 패널
__복합형 도표
22장_ 제목, 캡션, 표의 효과적 활용
__도표 제목과 캡션
__축과 범례 제목
__표, 제대로 만들기
23장_ 데이터 이해를 돕는 시각화의 주변 요소
__적절한 수준의 요소 활용
__배경 격자
__쌍 데이터__
24장_ 축 레이블의 글자는 큼직하게
25장_ 선 그림은 피하자
26장_ 3차원 그래픽과 차트는 그만
__불필요한 3차원 그래픽은 지양하자
__3차원 위치 스케일도 이제 그만
__3차원 시각화가 필요한 경우
[3부] 시각화 레벨업을 위한 꿀팁
27장_ 가장 흔히 쓰는 이미지 파일 형식
__비트맵과 벡터 그래픽
__비트맵 그래픽 무손실 및 손실 압축
__이미지 형식 변환하기
28장_ 올바른 시각화 소프트웨어 선택법
__재현 가능성과 반복 가능성
__데이터의 탐색적 분석과 데이터 표현
__내용과 디자인은 분리하자
29장_ 스토리텔링과 요점 전달
__이야기란 무엇일까
__장군님을 위한 도표 만들기
__방대한 정보는 복잡한 도표로
__기억에 남는 도표 만들기
__일관성을 유지하되 반복은 피할 것