합니다. 이 절에서는 데이터 과학 및 데이터 분석에 널리 사용하는 오픈 소스 파이썬 패키지인
판다스로 데이터를 불러오는 방법을 알아봅니다. 데이터를판다스의 데이터프레임으로 불러
오고 나면,데이터를 탐색할 준비가 된 것입니다. 다행히 데이터는 이미 정리가 완료되어 누락
된 값이나 이상한 문자는 포함되지 않았습니다. 탐색적 데이터 분석(
EDA
)은 데이터가 깨끗한
지 확인하고, 변수 간의 관계를 탐색하여 팀에서 제기한 질문에 답하는 데 유용한 정보를 파악
하는 과정입니다. 앞 장에서 언급한 대로
ML
작업의 대부분은 모델을 학습시키는 것이 아니라
학습 데이터를 이해하고 준비하는 데 할애됩니다. 그만큼 데이터를 준비하는 과정이 중요하다
는 뜻이죠.
이 절에서 소개하는 모든 코드와 몇 가지 추가 예제는
low
-
code
-
ai
깃허브저장소
3
의
Chap-
ter4 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.