실전 시계열 분석: 통계와 머신러닝을 활용한 예측 기법

Book description

실제 환경에 특화된 시계열 데이터 분석 및 모범 사례를 다루는 실무 지침서다. ARIMA 및 베이즈 상태 공간 같은 표준적인 통계 모델과 계층형 모델을 폭넓게 다루고, 시계열 데이터 모델링의 현대적인 파이프라인 전체를 실용적인 관점에서 안내한다. 이 책에 담긴 통계와 머신러닝 기술을 활용하면 데이터 엔지니어링 및 분석 과제를 해결하는 방법을 익히고, 시계열 데이터의 핵심을 꿰뚫어볼 수 있는 시각을 얻을 수 있을 것이다.

Table of contents

  1. 추천사
  2. 지은이·옮긴이 소개
  3. 옮긴이의 글
  4. 감사의 글
  5. 이 책에 대하여 (1/3)
  6. 이 책에 대하여 (2/3)
  7. 이 책에 대하여 (3/3)
  8. 1장 시계열의 개요와 역사
    1. 1.1 다양한 응용 분야의 시계열 역사
      1. 1.1.1 시계열 문제로서의 의학
      2. 1.1.2 일기예보
      3. 1.1.3 경제 성장 예측
      4. 1.1.4 천문학
    2. 1.2 시계열 분석의 도약
    3. 1.3 통계적 시계열 분석의 기원
    4. 1.4 머신러닝 시계열 분석의 기원
    5. 1.5 보충 자료
  9. 2장 시계열 데이터의 발견 및 다루기
    1. 2.1 시계열 데이터는 어디서 찾는가
      1. 2.1.1 미리 준비된 데이터셋
      2. 2.1.2 발견된 시계열
    2. 2.2 테이블 집합에서 시계열 데이터 집합 개선하기
      1. 2.2.1 작업의 예: 시계열 데이터 집합 조립하기 (1/2)
      2. 2.2.1 작업의 예: 시계열 데이터 집합 조립하기 (2/2)
      3. 2.2.2 발견된 시계열을 구성하기
    3. 2.3 타임스탬프의 문제점
      1. 2.3.1 무엇에 대한 타임스탬프인가
      2. 2.3.2 타임스탬프를 추측하여 데이터 이해하기
      3. 2.3.3 의미 있는 시간 규모란
    4. 2.4 데이터 정리
      1. 2.4.1 누락된 데이터 다루기
      2. 2.4.2 업샘플링과 다운샘플링
      3. 2.4.3 데이터 평활 (1/2)
      4. 2.4.3 데이터 평활 (2/2)
    5. 2.5 계절성 데이터
    6. 2.6 시간대
    7. 2.7 사전관찰의 방지
    8. 2.8 보충 자료
  10. 3장 시계열의 탐색적 자료 분석
    1. 3.1 친숙한 방법
      1. 3.1.1 도표 그리기
      2. 3.1.2 히스토그램
      3. 3.1.3 산점도
    2. 3.2 시계열에 특화된 탐색방법
      1. 3.2.1 정상성 이해하기
      2. 3.2.2 윈도우 함수 적용
      3. 3.2.3 자체상관의 파악과 이해 (1/3)
      4. 3.2.3 자체상관의 파악과 이해 (2/3)
      5. 3.2.3 자체상관의 파악과 이해 (3/3)
      6. 3.2.4 허위상관
    3. 3.3 유용한 시각화
      1. 3.3.1 1차원 시각화
      2. 3.3.2 2차원 시각화 (1/2)
      3. 3.3.2 2차원 시각화 (2/2)
      4. 3.3.3 3차원 시각화
    4. 3.4 보충 자료
  11. 4장 시계열 데이터의 시뮬레이션
    1. 4.1 시계열 시뮬레이션의 특별한 점
      1. 4.1.1 시뮬레이션과 예측
    2. 4.2 코드로 보는 시뮬레이션
      1. 4.2.1 스스로 직접 만들어보기 (1/2)
      2. 4.2.1 스스로 직접 만들어보기 (2/2)
      3. 4.2.2 스스로 실행하는 시뮬레이션 세계 구축 (1/2)
      4. 4.2.2 스스로 실행하는 시뮬레이션 세계 구축 (2/2)
      5. 4.2.3 물리적인 시뮬레이션 (1/2)
      6. 4.2.3 물리적인 시뮬레이션 (2/2)
    3. 4.3 시뮬레이션에 대한 마지막 조언
      1. 4.3.1 통계적인 시뮬레이션
      2. 4.3.2 딥러닝 시뮬레이션
    4. 4.4 보충 자료
  12. 5장 시간 데이터 저장
    1. 5.1 요구 사항 정의
      1. 5.1.1 실시간 데이터와 저장된 데이터
    2. 5.2 데이터베이스 솔루션
      1. 5.2.1 SQL과 NoSQL
      2. 5.2.2 인기 있는 시계열 데이터베이스와 파일 솔루션
    3. 5.3 파일 솔루션
      1. 5.3.1 넘파이
      2. 5.3.2 팬더스
      3. 5.3.3 표준 R에 동등한 것
      4. 5.3.4 Xarray
    4. 5.4 보충 자료
  13. 6장 시계열의 통계 모델
    1. 6.1 선형회귀를 사용하지 않는 이유
    2. 6.2 시계열을 위해 개발된 통계 모델
      1. 6.2.1 자기회귀 모델
      2. 6.2.2 이동평균 모델 (1/2)
      3. 6.2.2 이동평균 모델 (2/2)
      4. 6.2.3 자기회귀누적이동평균 모델 (1/3)
      5. 6.2.3 자기회귀누적이동평균 모델 (2/3)
      6. 6.2.3 자기회귀누적이동평균 모델 (3/3)
      7. 6.2.4 벡터자기회귀
      8. 6.2.5 통계 모델의 변형
    3. 6.3 시계열 통계 모델의 장단점
    4. 6.4 보충 자료
  14. 7장 시계열의 상태공간 모델
    1. 7.1 상태공간 모델의 장단점
    2. 7.2 칼만 필터
      1. 7.2.1 개요
      2. 7.2.2 코드로 표현한 칼만 필터
    3. 7.3 은닉 마르코프 모형
      1. 7.3.1 모델의 동작 방식
      2. 7.3.2 모델을 적합시키는 방법
      3. 7.3.3 코드로 보는 HMM의 적합 과정 (1/2)
      4. 7.3.3 코드로 보는 HMM의 적합 과정 (2/2)
    4. 7.4 베이즈 구조적 시계열
      1. 7.4.1 코드로 살펴보는 bsts
    5. 7.5 보충 자료
  15. 8장 시계열 특징의 생성 및 선택
    1. 8.1 입문자를 위한 예제
    2. 8.2 특징 계산 시 고려 사항
      1. 8.2.1 시계열의 특성
      2. 8.2.2 도메인 지식
      3. 8.2.3 외적 고려 사항
    3. 8.3 특징의 발견에 영감을 주는 장소 목록
      1. 8.3.1 시계열 특징 생성의 오픈 소스 라이브러리
      2. 8.3.2 특정 도메인에 특화된 특징의 예
    4. 8.4 생성된 특징들 중 일부를 선택하는 방법
    5. 8.5 마치며
    6. 8.6 보충 자료
  16. 9장 시계열을 위한 머신러닝
    1. 9.1 시계열 분류
      1. 9.1.1 특징의 선택과 생성
      2. 9.1.2 결정 트리 기법 (1/2)
      3. 9.1.2 결정 트리 기법 (2/2)
    2. 9.2 클러스터링
      1. 9.2.1 데이터에서 특징 생성하기 (1/2)
      2. 9.2.1 데이터에서 특징 생성하기 (2/2)
      3. 9.2.2 시간을 인식하는 거리 측정법
      4. 9.2.3 클러스터링 코드
    3. 9.3 보충 자료
  17. 10장 시계열을 위한 딥러닝
    1. 10.1 딥러닝 개념
    2. 10.2 신경망 프로그래밍
      1. 10.2.1 데이터, 기호, 연산, 계층, 그래프
    3. 10.3 학습 파이프라인 만들기
      1. 10.3.1 데이터셋 살펴보기
      2. 10.3.2 학습 파이프라인 단계 (1/4)
      3. 10.3.2 학습 파이프라인 단계 (2/4)
      4. 10.3.2 학습 파이프라인 단계 (3/4)
      5. 10.3.2 학습 파이프라인 단계 (4/4)
    4. 10.4 순전파 네트워크
      1. 10.4.1 간단한 예제
      2. 10.4.2 어텐션 기법으로 순전파 신경망이 시간을 인지하도록 만들기
    5. 10.5 합성곱 신경망
      1. 10.5.1 간단한 합성곱 모델
      2. 10.5.2 그 밖의 합성곱 모델
    6. 10.6 순환 신경망
      1. 10.6.1 전기 사용 예제에 RNN 적용하기
      2. 10.6.2 오토인코더의 혁명
    7. 10.7 복합 구조
    8. 10.8 마치며
    9. 10.9 보충 자료
  18. 11장 오차 측정
    1. 11.1 예측을 테스트하는 기본 방법
      1. 11.1.1 모델에 특화된 백테스트 고려 사항
    2. 11.2 예측하기 좋은 시점
    3. 11.3 시뮬레이션으로 모델의 불확실성 추정
    4. 11.4 여러 단계를 앞선 예측
      1. 11.4.1 직접 관심 범위에 적합시키기
      2. 11.4.2 거리가 먼 시간 범위에 대한 재귀적인 접근 방법
      3. 11.4.3 시계열에 적용된 멀티태스크 학습
    5. 11.5 모델 검증 시 주의 사항
    6. 11.6 보충 자료
  19. 12장 시계열 모델의 학습과 배포에 대한 성능 고려 사항
    1. 12.1 일반 사례를 위해 만들어진 도구로 작업하기
      1. 12.1.1 표본 간 데이터를 ‘공유’하지 않는 비시계열 데이터용 모델
      2. 12.1.2 사전 계산을 하지 않는 모델로 데이터 측정과 예측 사이에 불필요한 지연 발생
    2. 12.2 데이터 스토리지 형식의 장단점
      1. 12.2.1 바이너리 형식의 데이터 저장
      2. 12.2.2 데이터를 ‘슬라이딩’할 수 있는 방식의 전처리
    3. 12.3 성능 고려 사항에 맞게 분석 수정
      1. 12.3.1 전체 대신 일부 데이터가 더 나은 상황
      2. 12.3.2 간단한 모델이 더 나은 상황
      3. 12.3.3 선택 가능한 고성능 도구
    4. 12.4 보충 자료
  20. 13장 헬스케어 애플리케이션
    1. 13.1 독감 예측
      1. 13.1.1 한 대도시의 독감 연구 사례 (1/4)
      2. 13.1.1 한 대도시의 독감 연구 사례 (2/4)
      3. 13.1.1 한 대도시의 독감 연구 사례 (3/4)
      4. 13.1.1 한 대도시의 독감 연구 사례 (4/4)
      5. 13.1.2 독감을 예측하는 최첨단 기술
    2. 13.2 혈당치 예측
      1. 13.2.1 데이터 정리 및 탐색 (1/2)
      2. 13.2.1 데이터 정리 및 탐색 (2/2)
      3. 13.2.2 특징 생성 (1/2)
      4. 13.2.2 특징 생성 (2/2)
      5. 13.2.3 모델의 적합 (1/2)
      6. 13.2.3 모델의 적합 (2/2)
    3. 13.3 보충 자료
  21. 14장 금융 애플리케이션
    1. 14.1 금융 데이터의 취득과 탐색 (1/2)
    2. 14.1 금융 데이터의 취득과 탐색 (2/2)
    3. 14.2 딥러닝을 위한 금융 데이터 전처리
      1. 14.2.1 원시 값에 관심 수량 추가
      2. 14.2.2 사전관찰 없이 관심 수량 규모의 크기 조절하기
      3. 14.2.3 데이터를 신경망에 맞는 형태로 만들기
    4. 14.3 RNN의 구축과 학습 (1/2)
    5. 14.3 RNN의 구축과 학습 (2/2)
    6. 14.4 보충 자료
  22. 15장 정부를 위한 시계열
    1. 15.1 정부 데이터 취득
    2. 15.2 대규모 시계열 데이터의 탐색
      1. 15.2.1 데이터를 반복 접근할 때 업샘플링과 취합 수행하기
      2. 15.2.2 데이터 정렬
    3. 15.3 시계열 데이터에 대한 실시간 통계 분석 (1/3)
    4. 15.3 시계열 데이터에 대한 실시간 통계 분석 (2/3)
    5. 15.3 시계열 데이터에 대한 실시간 통계 분석 (3/3)
      1. 15.3.1 여전히 남은 의문
      2. 15.3.2 그 이상의 개선 사항
    6. 15.4 보충 자료
  23. 16장 시계열 패키지
    1. 16.1.1 구글의 예측 산업
      1. 16.1.2 페이스북의 Prophet 오픈 소스 패키지
    2. 16.2 이상 감지
      1. 16.2.1 트위터의 AnomalyDetection 오픈 소스 패키지
    3. 16.3 그 밖의 시계열 패키지
    4. 16.4 보충 자료
  24. 17장 시계열 예측의 미래 전망
    1. 17.1 서비스형 예측
    2. 17.2 딥러닝으로 확률적 가능성 향상
    3. 17.3 통계적 방법보다 중요성이 더 커진 머신러닝 방법
    4. 17.4 머신러닝과 통계를 결합하는 방법론의 증가
    5. 17.5 일상으로 스며든 더 많은 예측 (1/2)
    6. 17.5 일상으로 스며든 더 많은 예측 (2/2)

Product information

  • Title: 실전 시계열 분석: 통계와 머신러닝을 활용한 예측 기법
  • Author(s): 박찬성, 에일린 닐슨
  • Release date: April 2021
  • Publisher(s): Hanbit Media, Inc.
  • ISBN: 9791162247020