
57
Chapter 2 -
데이터, 데이터, 또 데이터
2.2
실제 데이터와 시뮬레이션 데이터
실제 데이터
real
data
와 시뮬레이션 데이터
simulated
data
의 차이점을 아는 것은 매우 중요하다. 두 가
지 유형 모두 발견과 발전에 매우 유용하다. 두 데이터 유형에 관해 알아보자.
실제 데이터
실제 데이터는 실제 관찰을 통해 수집된다. 예를 들어 측정 장치와 센서를 사용하거나 설문 조
사나 의료 진단처럼 구조화된 양식을 활용하거나 망원경 또는 영상 장치, 웹 사이트, 주식 시
장, 통제된 실험으로 실제 데이터를 수집할 수 있다. 이런 데이터는 측정 방법과 기기의 부정확
성 및 오류 등으로 인해 불완전하고 노이즈를 포함하는 경우가 많다. 수학적으로 실제 데이터
를 생성한 함수나 확률 분포를 정확히 알 수는 없지만 모델과 이론 및 시뮬레이션을 통해 가설
을 세울 수 있다. 그런 다음 해당 모델을 테스트하고 예측에 사용할 수 있다.
시뮬레이션 데이터
시뮬레이션 데이터는 이미 알고 있는 함수에서 생성된 데이터이거나 알려진 확률 분포에서 무
작위로 샘플링된 데이터다. 즉, 알려진 수학적 함수나 모델이 있고 이 모델에 몇 개의 숫자를
가미하여 데이터 포인트를 생성한 것이다. 다음은 시뮬레이션 데이터의 예시다.
●
모든 자연 현상을 모델링하는 편미분 방정식의 해
-
난류 ...