82
개발자를 위한 필수 수학
3.1
데이터란 무엇인가요?
우리 모두가 사용하고 당연하게 여기는
데이터
data
를 정의하는 것이 이상하게 느껴질 수도 있습
니다. 하지만 꼭 한번 생각해봐야 할 부분입니다. 누군가에게 데이터가 무엇인지 묻는다면 “데
이터는... 알다시피 정보잖아요!”라고 대답하고 그 이상은 생각하지 않을 가능성이 높습니다.
이제는 데이터가 모든 것의 전부이자 끝인 것처럼 홍보되는 것 같습니다. 데이터가 진실일 뿐
만 아니라 지능의 원천인 것처럼 말이죠! 데이터는 인공지능의 연료이므로 데이터가 많을수록
더 많은 진실을 알 수 있다고 여겨집니다. 그렇기에 데이터는 결코 충분할 수 없습니다. 데이터
는 비즈니스 전략을 재정의하고, 인공 일반 지능
artificial
general
intelligence
(
AGI
)을 만드는 데 필요한
비밀을 푸는 실마리입니다. 하지만 여기서는 실용적인 관점에서 데이터가 무엇인지 논의해봅
니다. 데이터 그 자체는 중요하지 않습니다. 이 모든 혁신과 솔루션의 원동력은 데이터 분석과
데이터를 생성하는 방법에 달렸습니다.
한 가족의 사진 한 장이 제공되었다고 가정해봅시다. 이 사진 한 장으로 이 가족의 이야기를 파
악할 수 있을까요? 사진이
20
장이 있다면 어떨까요?
200
장 또는
2
,
000
장의 사진이 있다면
요? 가족의 이야기를 알기 위해 얼마나 많은 사진이 필요할까요? 집이나 직장 등 다양한 환경
에서 찍은 사진이 필요한가요? 또는 혼자, 누군가와 함께 찍은 사진은 어떨까요?
데이터
는 사진과 마찬가지로 어떤 ...