Skip to Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
10.3 グラフ、ネットワーク、距離 295
今後の課題
グラ
フあるいは距離行列によって、点の集合における点の関連性の高さを示すことができる。ま
た、点集合が空間に埋め込まれたことにより、グラフあるいは距離行列における具体的な距離や
長さがわかる。
点の距離によって定義される幾何学的グラフは、私が「誘導ネットワーク」と名付けたグラフの代表例で
ある。誘導ネットワークでは、何らかの外部データソースから機械的な方法で辺が定義される。これはデー
タサイエンスでネットワークを構築するためによく使われている方法であり、データセットをどうすればグ
ラフに変換できるかに注意する必要がある。
一連の要素からネットワークを作るには、普通は距離関数や類似度関数が使われる。一般に、個々の頂点
k 個の最も近い頂点や類似する頂点に接続する辺に注目する。k を小さく保てば(目安は k 10)疎グ
ラフが得られる。疎グラフは、n が大きくても簡単に操作できる。
しかし、誘導ネットワークには他の種類もある。よくあるのは、意味のある属性を共有する頂点 x y
接続するものだ。例えば、履歴書を使えば人々の誘導ソーシャルネットワークが作れる。同じ時期に同じ会
社に在籍していたり、同じ学校に通っていた 2 人を結ぶのである。このようなネットワークは、クリークを
形成する頂点の大規模な部分集合を含む塊状の構造を含むことが多い。x y と同じ大学を卒業し、y z
と同じ大学を卒業していれば、(x, z) も同じグラフの辺でなければならない。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Rではじめるデータサイエンス

Rではじめるデータサイエンス

Hadley Wickham, Garrett Grolemund, 黒川 利明, 大橋 真也
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873118918Other