1장. 머신 러닝 환경
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
얼마 전까지만 해도 휴대폰을 들고 집으로 가는 길을 알려달라고 요청하면 휴대폰은 이를 무시했을 것이고 사람들은 당신의 제정신에 의문을 제기했을 것입니다. 하지만 머신러닝은 더 이상 공상 과학 소설이 아닙니다. 매일 수십억 명의 사람들이 머신러닝을 사용하고 있습니다. 사실 머신러닝은 광학 문자 인식(OCR) 과 같은 일부 특수 애플리케이션에서 수십 년 동안 사용되어 왔습니다. 실제로 주류가 되어 수억 명의 삶을 개선한 최초의 ML 애플리케이션은 1990년대에 은밀하게 전 세계를 장악한 스팸 필터입니다. 이 필터는 정확히 자기 인식 로봇은 아니지만, 기술적으로는 머신 러닝이라고 할 수 있습니다. 실제로 이 필터는 매우 잘 학습하여 더 이상 이메일을 스팸으로 분류할 필요가 거의 없게 되었습니다. 그 후 빅 데이터, 하드웨어 개선, 몇 가지 알고리즘 혁신 덕분에 수백 개의 머신 러닝 애플리케이션이 등장했고 이제는 음성 안내, 자동 번역, 이미지 검색, 제품 추천 등 여러분이 일상적으로 사용하는 수백 개의 제품과 기능을 조용히 지원하고 있습니다. 그리고 마침내 ChatGPT, Gemini(이전의 Bard), Claude, Perplexity 및 기타 여러 챗봇이 등장했습니다: AI는 더 이상 백그라운드에서 서비스를 지원하는 것이 아니라 서비스 그 자체입니다.
머신러닝의 시작과 끝은 어디일까요? 기계가 무언가를 학습한다는 것은 정확히 무엇을 의미할까요? 모든 Wikipedia 문서의 사본을 다운로드하면 컴퓨터가 정말 무언가를 학습한 걸까요? 갑자기 더 똑똑해지나요? 이 장에서는 먼저 머신 러닝이 무엇이며 왜 머신 러닝을 사용해야 하는지를 명확히 설명하겠습니다.
그런 다음 머신 러닝 대륙을 탐험하기 전에 지도를 살펴보고 주요 지역과 가장 주목할 만한 랜드마크인 지도 학습과 비지도 학습 및 그 변형, 온라인 학습과 배치 학습, 인스턴스 기반 학습과 모델 기반 학습에 대해 알아볼 것입니다. 그런 다음 일반적인 ML 프로젝트의 워크플로우를 살펴보고, 직면할 수 있는 주요 과제에 대해 논의하며, 머신러닝 시스템을 평가하고 미세 조정하는 방법을 다룹니다.
이 장에서는 모든 데이터 과학자가 기본적으로 알아야 할 많은 기본 개념(및 전문 용어)을 소개합니다. 이 장은 개괄적인 개요(코드가 많지 않은 유일한 장입니다)로, 다소 단순하지만 책의 나머지 부분을 계속 진행하기 전에 모든 것을 명확하게 이해하도록 하는 것이 목표입니다. 그러니 커피 한 잔 들고 시작해 보겠습니다!
팁
머신 러닝 기본 사항에 이미 익숙하다면 2장으로 바로 건너뛰셔도 좋습니다. 잘 모르겠다면 각 장의 마지막에 나열된 모든 질문에 답해보고 넘어가세요.
머신러닝이란 무엇인가요?
머신러닝( 학습 )은 컴퓨터가 데이터로부터 학습할 수 있도록 프로그래밍하는 과학(및 예술)입니다.
다음은 조금 더 일반적인 정의입니다:
[기계 학습은 명시적으로 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access