第2章 データベース データベース
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
データベースとは何か?
最も広い定義では、データベースとは、 、データを収集し、整理するあらゆるものを指す。顧客の予約を保存するスプレッドシートはデータベースであり、フライトスケジュールデータを含むプレーンテキストファイルもデータベースである。プレーンテキストデータ自体は、XMLやCSVなど様々な形式でストアできる。
しかし専門的には、「データベース」というとリレーショナル・データベース管理システム(RDBMS)を指すことが多い。この言葉は専門的で敷居が高く聞こえるかもしれないが、RDBMSは単にデータベースの一種であり、1つまたは複数のテーブルを保持し、互いにリレーションシップを持つことができる。
リレーショナルデータベースを探求する
テーブルという概念はよく知られているはずだ。 テーブルには列と行があり、スプレッドシートのようにデータをストアする。これらのテーブルは、顧客情報のCUSTOMER テーブルを参照するORDER テーブルのように、互いにリレーションシップを持つことができる。
例えば、CUSTOMER_ID (図2-1)というフィールドを持つORDER テーブルがあるとする。
図2-1. CUSTOMER_ID を持つ ORDER テーブル
CUSTOMER (図2-2)と呼ばれる、各CUSTOMER_ID の顧客情報を保持する別のテーブルが存在すると考えるのが妥当であろう。
図2-2. CUSTOMER テーブル
ORDER 、CUSTOMER_ID を使って、CUSTOMER テーブルの顧客情報を検索することができる。これは "リレーショナル・データベース "の基本的な考え方であり、テーブルには他のテーブルの情報を参照するフィールドがある。エクセルのVLOOKUPを使って、あるシートの情報をワークブックの別のシートから取り出したことがある人なら、この概念に聞き覚えがあるかもしれない。
なぜテーブルを分けるのか?
しかし、なぜこのようにテーブルが分けられ、このように設計されているのだろうか? その動機は正規化である。、異なるタイプのデータを1つのテーブルに入れるのではなく、それぞれのテーブルに分けるのである。もしすべての情報を一つのテーブルに入れていたら、冗長性に富み、肥大化し、メンテナンスが非常に困難になる。もし顧客情報をORDER 。図2-3はその様子を示している。
図2-3. 正規化されていないテーブル
リ・バール建設の注文では、誰かが3つの注文のために顧客情報を3回入力しなければならなかった(名前、地域、住所、市町村、州、郵便番号)。これは非常に冗長性であり、不必要なストレージスペースを取り、メンテナンスが難しい。もし顧客の住所が変更になり、それを反映させるためにすべての注文を更新しなければならなくなったとしよう。これが、 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access