이터가 (지금 당장은) 다음 단계를 진행하기에 충분히 타당해 보이거나, 더 많은 데이터 또
는 다른 데이터 세트를 확보해야 한다고 판단할 수도 있습니다. 이 과정을 계속 반복하세요.
TIP
인터뷰어가 머신러닝 문제가 발생했을 때 어떻게 대처할 것인지를 물어본다면 여러분이 데이터 원본
을 확보한 후
EDA
를 하겠다고 언급하기를 기대하고 있는 것입니다. 단순히 사전에 정제된 데이터 세트를 사
용하는 것이 아니라 데이터를 비판적으로 살펴보고 결함까지 찾아낼 수 있다는 것을 보여주는 것이 중요합
니다.
피처 엔지니어링 소개
데이터를 탐색하고 모델 학습을 위한 좋은 출발점을 찾을 때까지 반복했다면, 이젠 피처 엔
지니어링에 착수할 시점입니다. 머신러닝에서 피처
Feature
는 머신러닝 모델에 대한 입력값을
가리킵니다. 피처 엔지니어링의 목표는 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.