일부 압축 기술은 정렬에 기반합니다. 따라서 테이블에서 어떤 필드가 정렬돼 있는지 파악하고 이를 잘 이용
해 쿼리를 작성하면 쿼리 성능이 향상됩니다. 단, 대용량 테이블에
JOIN
을 사용하면 느려지니 주의합시다.
결론적으로 이 책에서 다루는 분석을 수행하는 데는 데이터베이스 타입이 중요하지 않습니다.
다른 일도 모두 마찬가지겠지만 데이터 크기와 업무의 복잡성을 잘 고려해 적절한 도구를 사용
하면 의미 있는 분석을 수행할 수 있습니다.
1.3.3
데이터 인프라스트럭처 유형
데이터를 데이터베이스에만 저장할 수 있는 건 아닙니다. 데이터를 분석하고 활용하기 위한 다
양한 데이터 저장 방법이 생겨나고 있습니다. 데이터 레이크 같은 파일 저장 시스템은 데이터
웨어하우스 대신 데이터를 저장하는 대표적인 대안입니다.
NoSQL
데이터베이스와 검색 기반
데이터 저장 시스템은 지연 시간이 낮아서 로그 파일을 빠르게 검색합니다. 이러한 여러 유형
의 데이터 인프라스트럭처는 데이터 분석 과정에서 일어나는 일과는 관련이 적지만, 많은 조직
에서 데이터 인프라스트럭처를 다루므로 간단하게 언급하고 넘어가겠습니다. 한 가지 재미있
는 점은 이러한 새로운 유형의 인프라스트럭처가 처음에는
SQL
데이터베이스의 한계를 극복
하기 위해 등장했음에도, 결국 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.