419
11
장
머신러닝의 인간적 측면
선의로 공개한 경우에도 잠재 위험이 있음을 보여줍니다. 사용자 데이터를 수집하는 애플리케
이션 개발자는 사용자가 적절한 개인 정보 설정을 선택하는 기술적 노하우와 개인 정보 인식을
가지지 않았을 수도 있음을 이해해야 합니다. 수집하는 데이터가 적어지는 한이 있어도 올바른
설정을 기본값으로 설정하기 위해 적극 노력해야 합니다.
11.3.2 11.3.2
책임 있는 책임 있는
AIAI
의 프레임워크의 프레임워크
이 절에서 다루는 내용은
ML
실무자로서 모델 동작을 감시하고 프로젝트 요구 사항을 충족하
는 데 도움이 되는 지침을 설정하기 위한 기반이 됩니다. 다만 이 프레임워크는 모든 유스 케이
스에 적합하지는 않습니다. 어떤 프레임워크를 따르든
AI
사용이 부적절하거나 비윤리적인 애
플리케이션, 예컨대 형사 판결, 예측 치안 등이 있기 때문이죠.
모델 편향의 출처 찾아내기
ML
시스템 설계에 관한 논의를 경험했다면 편향이 워크플로 전체에서 발생한다는 점을 익히
알 겁니다. 첫째로 이러한 편향이 어떻게 침투하는지 알아내야 합니다. 다음은 데이터 소스의
예이며 이 목록 외에도 많은 소스가 있습니다. 편향을 해결하기 어려운 이유 중 하나는 편향이
프로젝트 수명 주기 내 어느 단계에서든 발생할 수 있기 때문입니다.
훈련 데이터
모델 개발에 사용한 데이터가 모델이 실제로 처리할 데이터를 대표하나요? 그렇지 않
다면 모델은 훈련 데이터에 표시되는 데이터가 적은 사용자 그룹에 대해 편향적이 될
수 있습니다.
레이블링
인간 어노테이터 ...