10章ソーシャルネットワークとデータジャーナリズム
この章では、過去5年から10年くらいの間に特に流行している2つの話題について説明します。ソーシャルネットワークとデータジャーナリズムです。ソーシャルネットワーク(必ずしもオンライン上のものを指すわけではありません)は、社会学者たちによって何十年にもわたって研究されています。計算機科学の分野でそれに相当するものは、数学や統計学におけるグラフ理論でしょう。そしていまやFacebookやLinkedIn、TwitterやGoogle+のようなソーシャルネットワークの出現によって、新しい非常に豊富なデータが手に入ります。このことは、社会科学的な視点からも、定量的/技術的視点からも多くの研究上の課題をもたらしています。
この章ではまず、Morningside Analyticsという企業が、どのようにしてソーシャルネットワーク上のデータと、そのデータの背景にあるソーシャルネットワークの理論を明らかにし、意味を見出していったのかを確認していきます。そして、ソーシャルネットワークデータから浮かび上がるストーリーを構築していきます。これもデータジャーナリズムの1形式と言えるでしょう。データサイエンティストのプロフィールを考えるとき(この例は遺伝子の表現型と似た考え方になりそうです)、データサイエンスとデータジャーナリズムに必要な数学や統計学、コミュニケーションや可視化、プログラミングスキルは、少し異なってきます。しかし、基本的な部分は同じでしょう。両方に必要なスキルの心臓部となるのは、よい質問をする力やその質問にデータで答える力、そして、発見したことをコミュニケーションする力です。この章の最後では、データジャーナリズムに関して、O'Reillyの編集者であるJon ...
Get データサイエンス講義 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.