230
4
부
배포와 모니터링
먼저 데이터를 살펴보고 소유권 문제를 다룬 다음, 데이터 편향을 알아보겠습니다.
8.1
데이터 고려 사항
데이터를 생성, 저장, 사용할 때 유념해야 할 팁 소개부터 시작합니다. 데이터 소유권과 데이터
저장에 관련된 책임을 먼저 다룹니다. 그다음 데이터셋에서 편향을 일으키는 원인을 살펴봅니
다. 그리고 모델을 구축할 때 이런 편향을 처리하는 방법을 설명합니다. 마지막으로 이런 편향
으로 인한 부정적인 결과와 이를 감소시키는 것이 왜 중요한지 예를 들어 살펴봅니다.
8.1.1
데이터 소유권
데이터 소유권은 데이터 수집과 사용에 관련된 요구 사항을 의미합니다. 데이터 소유권에 관해
고려할 중요한 요소는 다음과 같습니다.
•
데이터 수집
: 모델을 훈련하기 위해 필요한 데이터셋을 수집하고 사용할 법적 권한을 가지고 있나요?
•
데이터 사용 및 허락
: 사용자의 데이터가 필요한 이유와 사용 방법을 명확하게 설명했나요? 사용자가 이에
동의했나요?
•
데이터 저장
: 데이터를 어떻게 저장하나요? 누가 데이터에 접근할 수 있나요? 언제 데이터를 삭제하
나요?
사용자로부터 데이터를 수집하면 제품의 사용자 경험을 개인화하고 맞춤형 서비스를 제공하는
데 도움이 됩니다. 이에는 도덕적, 법적 책임이 수반됩니다. 사용자가 제공한 데이터를 안전하
게 보관할 도덕적 의무가 있지만 새로운 규제는 이를 법적 책임으로 점점 바꾸고 있습니다. 예
를 들어 유럽
GDPR
규정은 데이터 수집과 처리에 대한 엄격한 지침을 세우고 있습니다.
대규모 ...