第4章. 検索を適用する:シンプルなパターンから高度なパターンまで
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
前の章では、データカタログにおける検索の仕組みと、検索の仕組みを理解することで検索方法を改善し、データカタログの価値を高める方法について説明した。検索は、データカタログ内のデータをいかにうまく整理するかにかかっていることを忘れてはならない。必要なものに対して完璧なクエリ文を作成したとしても、データカタログのメタデータが貧弱であれば、検索は何も返さないだろう。
そこで、検索をどのように応用するかという話になる。検索を応用することは、テクノロジーそのものを理解することとは異なる技術である。まず第一に、データを検索する際には、データの 検索を訓練されたデータサイエンティストではなく、データの検索を訓練された図書館員のように検索する必要がある。図書館員のようなマインドセットがあれば、検索機能を解き放つクリエイティブな方法を発見できるだろう。単純な検索は、より広範囲に、あるいはごく少数のヒットだけを検索するために、精度を上げたり下げたりする様々な方法で使うことができる。検索はデータ内のナビゲーションとそのコンテキストの理解を可能にし、さらなる利点は、このコンテキストを単純検索と複合検索の両方を改良するために使用できることである。そして、単純な検索が様々な方法で使用できるように、複雑な検索も可能である。
この章で学ぶことは、ほんの始まりに過ぎない。あなたの会社の言語や目的に合うように、応用検索をさらに適応させ、洗練させる必要がある。
図書館員のように検索する-データサイエンティストのようには検索しない
データサイエンティスト データ分析に秀でている。小さなデータセットから巨大なデータセットまで、彼らは必要な発見を引き出すためにデータを検索するツールと考え方を持っている。それが彼らのスーパーパワーだ。しかし、彼らが作業するためのデータを検索することは、本当に難しいことである。第3章を思い出してほしいが、データの検索とデータの中の検索には大きな違いがある。
一方、図書館員は、本、定期刊行物、論文など、ありとあらゆる資料を探し出すのが得意だ!あなたがそれを求めれば、彼らはおそらくそれを検索し、発見することができるだろう。そして、彼らのスーパーパワーには、データを検索し、必要なデータを知ることも含まれる。
ここ数十年で重要性を増したデータサイエンスとは異なり、図書館情報学(LIS)は何百年も前から存在し、知識を整理し検索する技術を完成させてきた。
図書館員として検索をするということは、何よりもまず、情報ニーズを見極めることに長けているということである。なぜなら、情報ニーズによってデータの検索方法が決まるからである。情報ニーズは、1962年に ロバート・S・テイラーによって、レファレンスデータベースへの質問の仕方として作られた言葉である。1
必要な情報は大小さまざまだ。あなたが検索しているのは何なのか、自問してみよう:
-
すべて
-
いくつかの良い点
-
唯一の正しいこと
-
もう一度必要なもの2
情報ニーズによって、どのようにデータを検索するかが決まる。ニーズはさまざまな規模や意図を表すからだ。
すべてが複雑な検索を伴い、あなたは精度を犠牲にして高い想起を目指している。しかし、この章の後半で説明するように、様々な方法でこれを行うことができる。
数少ない良いものという ...