
37
2
장
데이터의 중요성
2.1.5
금융: 사기 탐지
이 프로젝트의 목표는 금융 거래의 사기 여부를 예측하는 모델을 구축하는 것입니다. 여러분이
속한 회사는 수십만 명의 사용자가 사용하는 모바일 결제 서비스를 제공합니다. 사기 거래는
매우 드물게 발생하며, 발생하더라도 보통 다른 안전장치에서 적발합니다. 그러나 안타깝게도
일부는 보안을 뚫고 빠져나가 사용자에게 부정적인 영향을 미칩니다. 여기서 사용하는 데이터
셋은 사용자 행동과 사기 거래를 재현할 목적으로 시뮬레이션된 거래 데이터로 구성됩니다. 하
지만 여러분은
ML
에 관한 배경지식이 없고, 프로그래밍할 줄 모릅니다. 따라서
AutoML
을 사
용하기로 합니다. [그림
2
-
5
]는 모델에 기여하는 데이터 요소를 보여줍니다.
그림
2-5
사기 탐지 모델에 기여하는 데이터 요소들
2.1.6
에너지: 전력 생산량 예측
이 프로젝트의 목표는 발전소 근처의 기상 조건을 고려해 복합화력발전소
combined
cycle
power
plant
(
CCPP
)의 시간당 전기 에너지 순생산량을 예측하는 것입니다. 데이터셋에는
2006
~
2011
년까지의
6
년간,
CCPP
에서 최대 부하로 작동할 때 수집한 데이터가 포함됩니다. 데이터
는 시간 단위로 집계되었지만, 정확한 시간 정보는 따로 제공되지 않습니다. 따라서 이전 기록
에 기반해 ...