상세정보
미리보기
AWS 기반 데이터 과학
- 저자
- 크리스 프레글리,안티 바르트 저/서진호,최미영 역
- 출판사
- 한빛미디어
- 출판일
- 2023-05-08
- 등록일
- 2024-01-26
- 파일포맷
- PDF
- 파일크기
- 15MB
- 공급사
- YES24
- 지원기기
-
PC
PHONE
TABLET
웹뷰어
프로그램 수동설치
뷰어프로그램 설치 안내
책소개
80여 가지 AWS AI & ML 서비스로 구현하는데이터 과학 프로젝트 실전 가이드이 책은 AWS에서 제공하는 AI와 ML 기능을 활용하여 데이터 과학 프로젝트를 구축하고 배포하는 방법을 다룬 실전 지침서다. 아마존 EC2, 아마존 EBS, 아마존 다이나모DB, AWS 람다, AWS IAM을 비롯한 다양한 AWS 서비스를 사용하여 데이터 수집 및 처리, 머신러닝, 보안을 다룬다. 또한 AWS에서 데이터 과학 프로젝트의 비용을 절감하고 성능을 향상시키는 팁도 소개한다. 이 책을 따라 모든 학습을 마치고 나면 머신러닝 모델의 성능을 향상하기 위한 기술과 방법을 이해하고, AWS를 효과적으로 활용하여 머신러닝 모델을 구축하고 배포할 수 있게 될 것이다.
저자소개
AWS 샌프란시스코 지사에서 AI/ML 분야 수석 개발자 애드버킷으로 재직 중이다. 동시에 파이프라인AI(PipelineAI)의 창립자이며, 이전에는 데이터브릭스(Databricks)의 솔루션 엔지니어, 넷플릭스(Netflix)의 소프트웨어 엔지니어로 일한 경력이 있다. 지난 10년간 AI/ML 분야에서 폭넓은 지식을 쌓아오면서 오라일리가 주최하는 AI 관련 시리즈 프로젝트인 ‘AI Superstream Series’에 참여하기도 했다. 또한 세계 각국에서 열리는 AI/ML 콘퍼런스에 참석하여 지식을 나누는 연설을 정기적으로 하고 있다. 현재 AWS에서는 AI/ML 파이프라인을 구축하는 데 전념하고 있다.
목차
CHAPTER 1 AWS 기반 데이터 과학 소개1.1 클라우드 컴퓨팅의 장점1.2 데이터 과학 파이프라인 및 워크플로우1.3 MLOps 모범 사례1.4 아마존 세이지메이커를 사용한 아마존 AI와 AutoML1.5 AWS에서 데이터 수집, 탐색 및 준비1.6 아마존 세이지메이커를 사용한 모델 훈련 및 튜닝1.7 아마존 세이지메이커와 AWS 람다 함수를 사용한 모델 배포1.8 AWS 스트리밍 데이터 분석 및 머신러닝1.9 AWS 인프라 및 맞춤형 하드웨어1.10 태그, 예산, 알림으로 비용 절감하기1.11 마치며CHAPTER 2 데이터 과학의 모범 사례2.1 모든 산업에 걸친 혁신2.2 개인별 상품 추천 시스템2.3 아마존 레코그니션으로 부적절한 동영상 감지2.4 수요 예측2.5 아마존 프로드 디텍터를 사용한 가짜 계정 식별2.6 아마존 메이시를 사용한 정보 유출 탐지 활성화2.7 대화형 디바이스와 음성 어시스턴트2.8 텍스트 분석 및 자연어 처리2.9 인지 검색과 자연어 이해2.10 지능형 고객 지원 센터2.11 산업용 AI 서비스와 예측 정비2.12 AWS IoT와 아마존 세이지메이커를 사용한 홈 자동화2.13 의료 문서에서 의료 정보 추출2.14 자체 최적화 및 지능형 클라우드 인프라2.15 인지 및 예측의 비즈니스 인텔리전스2.16 차세대 AI/ML 개발자를 위한 교육2.17 양자 컴퓨팅을 통한 운영체제 프로그램2.18 비용 절감 및 성능 향상2.19 마치며CHAPTER 3 AutoML3.1 세이지메이커 오토파일럿을 사용한 AutoML3.2 세이지메이커 오토파일럿을 사용한 트래킹 실험3.3 세이지메이커 오토파일럿을 사용한 자체 텍스트 분류기 훈련 및 배포3.4 아마존 컴프리헨드를 사용한 AutoML3.5 마치며CHAPTER 4 클라우드로 데이터 수집하기4.1 데이터 레이크4.2 아마존 아테나를 사용해 아마존 S3 데이터 레이크 쿼리하기4.3 AWS 글루 크롤러를 통해 지속적으로 새 데이터 수집하기4.4 아마존 레드시프트 스펙트럼으로 레이크 하우스 구축하기4.5 아마존 아테나와 아마존 레드시프트 중에서 선택하기4.6 비용 절감 및 성능 향상4.7 마치며CHAPTER 5 데이터셋 탐색하기5.1 데이터 탐색을 위한 AWS 도구5.2 세이지메이커 스튜디오를 사용한 데이터 레이크 시각화5.3 데이터 웨어하우스 쿼리하기5.4 아마존 퀵사이트를 사용한 대시보드 생성5.5 아마존 세이지메이커 및 아파치 스파크를 사용한 데이터 품질 문제 감지5.6 데이터셋에서 편향 감지하기5.7 세이지메이커 클래리파이로 다양한 유형의 드리프트 감지5.8 AWS 글루 데이터브루를 사용한 데이터 분석5.9 비용 절감 및 성능 향상5.10 마치며CHAPTER 6 모델 훈련을 위한 데이터셋 준비6.1 피처 선택 및 엔지니어링 실행6.2 세이지메이커 프로세싱을 통한 피처 엔지니어링 확장6.3 세이지메이커 피처 스토어를 통한 피처 공유6.4 세이지메이커 데이터 랭글러를 사용한 데이터 수집 및 변환6.5 아마존 세이지메이커를 사용한 아티팩트 및 익스페리먼트 계보 트래킹6.6 AWS 글루 데이터브루를 사용한 데이터 수집 및 변환6.7 마치며CHAPTER 7 나의 첫 모델 훈련시키기7.1 세이지메이커 인프라 이해하기7.2 세이지메이커 점프스타트를 사용해 사전 훈련된 BERT 모델 배포하기7.3 세이지메이커 모델 개발7.4 자연어 처리 역사7.5 BERT 트랜스포머 아키텍처7.6 처음부터 BERT 훈련시키기7.7 사전 훈련된 BERT 모델 미세 조정하기7.8 훈련 스크립트 생성7.9 세이지메이커 노트북에서 훈련 스크립트 시작하기7.10 모델 평가하기7.11 세이지메이커 디버거를 사용한 모델 훈련 디버깅 및 프로파일링7.12 모델 예측 해석 및 설명7.13 모델 편향 감지 및 예측 설명7.14 BERT를 위한 추가 훈련 선택7.15 비용 절감 및 성능 향상7.16 마치며CHAPTER 8 대규모 모델 훈련과 최적화 전략8.1 최적의 모델 하이퍼파라미터 자동으로 찾기8.2 세이지메이커 하이퍼파라미터 튜닝에 웜스타트 추가 사용8.3 세이지메이커 분산 훈련으로 확장하기8.4 비용 절감 및 성능 향상8.5 마치며CHAPTER 9 프로덕션에 모델 배포하기9.1 실시간 예측 또는 일괄 예측 선택하기9.2 세이지메이커 엔드포인트를 사용한 실시간 예측9.3 아마존 클라우드워치를 사용한 세이지메이커 엔드포인트 오토스케일링9.4 새 모델 또는 업데이트된 모델로 배포하는 전략9.5 새 모델 테스트 및 비교9.6 모델 성능 모니터링 및 드리프트 감지9.7 배포된 세이지메이커 엔드포인트의 데이터 품질 모니터링9.8 배포된 세이지메이커 엔드포인트의 모델 품질 모니터링하기9.9 배포된 세이지메이커 엔드포인트의 편향 드리프트 모니터링9.10 배포된 세이지메이커 엔드포인트의 피처 속성 드리프트 모니터링9.11 세이지메이커 일괄 변환을 사용한 일괄 예측9.12 AWS 람다 함수 및 아마존 API 게이트웨이9.13 엣지에서의 모델 관리 및 최적화9.14 토치서브를 사용한 파이토치 모델 배포9.15 AWS DJL을 사용한 텐서플로우-BERT 추론9.16 비용 절감 및 성능 향상9.17 마치며CHAPTER 10 파이프라인과 MLOps10.1 머신러닝 운영10.2 소프트웨어 파이프라인10.3 머신러닝 파이프라인10.4 세이지메이커 파이프라인을 사용한 파이프라인 오케스트레이션10.5 세이지메이커 파이프라인으로 자동화하기10.6 더 많은 파이프라인 종류10.7 휴먼인더루프 워크플로우10.8 비용 절감 및 성능 향상10.9 마치며CHAPTER 11 스트리밍 데이터 분석과 머신러닝11.1 온라인 학습과 오프라인 학습의 비교11.2 스트리밍 애플리케이션11.3 스트리밍 데이터용 윈도우 쿼리11.4 AWS에서 스트리밍 분석 및 머신러닝 구현하기11.5 아마존 키네시스, AWS 람다, 아마존 세이지메이커를 사용한 실시간 상품 리뷰 분류11.6 아마존 키네시스 데이터 파이어호스를 사용한 스트리밍 데이터 수집 구현11.7 스트리밍 분석으로 실시간 상품 리뷰 요약하기11.8 아마존 키네시스 데이터 애널리틱스 설정11.9 아마존 키네시스 데이터 애널리틱스 애플리케이션11.10 아파치 카프카, AWS 람다, 아마존 세이지메이커를 사용한 상품 리뷰 분류11.11 비용 절감 및 성능 향상11.12 마치며CHAPTER 12 AWS 보안12.1 AWS와 사용자 간의 공동 책임 모델12.2 AWS IAM12.3 컴퓨팅 및 네트워크 환경 격리12.4 아마존 S3 데이터 액세스 보호12.5 저장 시 암호화12.6 전송 중 암호화12.7 세이지메이커 노트북 인스턴스 보호12.8 세이지메이커 스튜디오 보안12.9 세이지메이커 작업과 모델 보안12.10 AWS 레이크 포메이션 보호12.11 AWS 시크릿 매니저를 통한 데이터베이스 자격 증명 보안12.12 거버넌스12.13 감사 가능성12.14 비용 절감 및 성능 향상12.15 마치며