5장. 데이터 수집: 데이터 로드
이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com
4장에서는 원하는 소스 시스템에서 데이터를 추출했습니다. 이제 데이터를 Redshift 데이터 웨어하우스에 로드하여 데이터 수집을 완료할 차례입니다. 로드하는 방법은 데이터 추출의 출력에 따라 달라집니다. 이 섹션에서는 테이블의 각 열에 해당하는 값이 있는 CSV 파일로 추출된 데이터를 로드하는 방법과 CDC 형식의 데이터가 포함된 추출 출력에 대해 설명합니다.
Amazon Redshift 창고를 대상으로 구성하기
데이터 웨어하우스에 Amazon Redshift( )를 사용하는 경우, 데이터를 추출한 후 로드하기 위해 S3와 통합하는 것은 매우 간단합니다. 첫 번째 단계는 데이터 로딩을 위한 IAM 역할이 아직 없는 경우 이를 만드는 것입니다.
참고
Amazon Redshift 클러스터 설정에 대한 지침은무료 평가판을 포함한 최신 문서 및 가격을 확인하세요.
역할을 만들려면 다음 지침을 따르거나 AWS 설명서에서 최신 세부 정보를 확인하세요:
-
AWS 콘솔의 서비스 메뉴(또는 상단 탐색 모음)에서 IAM으로 이동합니다.
-
왼쪽 탐색 메뉴에서 역할을 선택한 다음 '역할 만들기' 버튼을 클릭합니다.
-
선택할 수 있는 AWS 서비스 목록이 표시됩니다. Redshift를 찾아 선택합니다.
-
'사용 사례 선택'에서 Redshift - 사용자 지정 가능을 선택합니다.
-
다음 페이지(권한 정책 첨부)에서 AmazonS3ReadOnlyAccess를 검색하여 선택한 후 다음을 클릭합니다.
-
역할에 이름을 지정하고(예: "RedshiftLoadRole") "역할 만들기"를 클릭합니다.
-
새 역할의 이름을 클릭하고 이 장의 뒷부분에서 사용할 수 있도록 역할 Amazon 리소스 이름 (ARN)을 복사합니다. 나중에 IAM 콘솔의 역할 속성에서도 이 이름을 찾을 수 있습니다. ARN은 다음과 같습니다:
arn:aws:iam::<aws-account-id>:role/<role-name>.
이제 방금 만든 IAM 역할을 Redshift 클러스터에 연결할 수 있습니다. 이렇게 하려면 다음 단계를 따르거나 Redshift 설명서에서 자세한 내용을 확인하세요.
참고
클러스터에 변경 사항을 적용하는 데 1~2분 정도 걸리지만 이 시간 동안에도 클러스터에 계속 액세스할 수 있습니다.
-
AWS 서비스 메뉴로 돌아가서 Amazon Redshift로 이동합니다.
-
탐색 메뉴에서 클러스터를 선택하고 데이터를 로드할 클러스터를 선택합니다.
-
작업에서 "IAM 역할 관리"를 클릭합니다.