18章Webスクレイピングの適法性と倫理

2010年にソフトウェア技術者Pete WardenがFacebookからデータを集めるクローラを作りました。彼は約2億件のデータを集めました。Facebookユーザの名前、住所情報、友達、興味です。もちろん、Facebookはこれに気付き、彼に中止要請書を送り、彼はそれに従いました。なぜ中止要請に従ったのかと聞かれて、こう答えました。「ビッグデータ?つまんない。弁護士?御免だね」

本章では、スクレイピングに関する米国の(および国際的な)法律について見てゆき、所与のWebスクレイピングの状況において、どのように適法性と倫理とを分析するのかを学びます。

これから読み進む前に、当たり前なことをわきまえておいてください。著者はソフトウェア技術者であって弁護士ではありません。本章や本書の他の章で読んだことを法律専門家の助言と受け取ったり、あるいは、これを頼りに行動しないでください。私は、Webスクレイピングの適法性や倫理について、一応の知識を持って議論することができますが、法律的に曖昧なWebスクレイピングプロジェクトに取り掛かる前には、(ソフトウェア技術者ではなく)弁護士に相談すべきです。

本章の目標は、知的財産、コンピュータへの無許可アクセス、サーバ利用などのWebスクレイピングのさまざまな側面について理解し議論するためのフレームワークを提供することであり、実務上の法律的助言と考えるべきではありません。

18.1 商標、著作権、特許

知的財産101†1の時間です。IP(知的財産)には3つの基本的な種類があります。商標(™や®で示される)、著作権(どこにもある©)、特許(当該発明が特許で保護されているという文章で示されることもあるが、何もないことが多い)です。 ...

Get PythonによるWebスクレイピング 第2版 now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.