
に移し替えるような場合です。
それでは、データクレンジングとは、具体的にどのような処理を行なうのか、代
表的なものを紹介しましょう。この内容を理解すると、データクレンジングを怠っ
た場合にどのようなアンチパターンやグレーノウハウが生じるのかもわかるように
なります。
リレーショナルデータベースの考え方に慣れてくればくるほど、レコードを一意
に特定することのできる一意キー(ユニークキー)の存在は、当たり前のように思
えてきます。しかし、意外に世の中で行なわれている多くの業務では、データの一
意性については注意が払われていないことも多くあります。
たとえば、みなさんがホテルや旅館の利用者の帳簿をつける仕事をしていて、昔
ながらの紙で記録するやり方をしているとしましょう。この場合、日々の宿泊の記
録をとっているだけなら、宿泊客について一意なデータを作る必要は感じないかも
しれません。また、それをやろうとしても、宿泊客の中には、泊まるたびに「渡邊」
「渡辺」と新字と旧字で異なる表記をしたり、それどころか「ワタナベ」とカタカ
294
8