book

Pythonによる地理空間データ分析 ―例題で学ぶロケーションインテリジェンス

Name: Pythonによる地理空間データ分析 ―例題で学ぶロケーションインテリジェンス
ISBN: 9784814400324

by Bonny P. McClain, 廣川類

September 2023

Intermediate to advanced

272 pages

4h 26m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

表紙
大扉
原書大扉
クレジット
はじめに
なぜPython？この本の構成この本が対象とする読者ツールに関するヒント自分なりの道を探す本書の表記法コード例の使用オライリー学習プラットフォーム連絡先謝辞
1章　地理空間データ分析入門
1.1　データの民主化1.2　データに関する質問1.3　空間データサイエンスの概念1.3.1　地図の投影法地図の誤差指標1.3.2　ベクタデータ：オブジェクトとしての場所1.3.3　ラスタデータ：空間的関係の理解1.4　データセットの評価と選択1.5　まとめ
2章　地理空間データ分析に必要なツール
2.1　QGISにおける地理空間データ分析2.1.1　QGISのインストール2.1.2　QGISにベースマップを追加する2.1.3　データリソースの探索2.2　ニューヨーク市の環境に関する苦情の可視化2.2.1　QGISへのデータの読み込み2.2.2　プロジェクトCRSの設定2.2.3　クエリエディタによるデータのフィルタリング2.3　人口データの可視化2.3.1　QGIS Pythonコンソール2.3.2　ラスタレイヤの読み込み2.3.3　赤線引き：不平等のマッピング2.4　まとめ
3章　QGIS：PyQGISによる地理空間データ分析と処理アルゴリズム
Pythonのクラス3.1　QGISワークスペースの探索：サンフランシスコの樹木被覆と不平等3.1.1　Pythonプラグイン3.1.2　データへのアクセス3.1.3　レイヤパネルの使い方3.1.4　研究課題への取り組み3.2　WFS：マサチューセッツ州の環境脅威を特定する3.2.1　データへのアクセス3.2.2　属性の発見3.2.3　イテレータの利用Pythonのリスト3.2.4　レイヤのスタイル設定3.3　Pythonコンソールで処理アルゴリズムを使用する3.3.1　アルゴリズムを使う3.3.2　QGIS式による抽出3.3.3　バッファ3.3.4　位置情報による抽出3.4　まとめ
4章　地理空間データ分析のクラウド化：Google Earth Engineとその他のツール
4.1　Google Earth Engineの設定4.2　GEEコンソールとgeemapの使用法4.2.1　Conda環境の構築4.2.2　geemapとその他のパッケージのインストール環境について4.3　geemapを利用する4.3.1　レイヤとツール4.3.2　ベースマップ4.4　Landsat 9の画像コレクションを探索する4.5　スペクトルバンドを使った作業4.6　国土被覆データベースのベースマップ4.6.1　データへのアクセス4.6.2　カスタム凡例の作成4.7　Leafmap：Google Earth Engineの代替4.8　まとめ
5章　OpenStreetMap：OSMnxで地理空間データにアクセスする
5.1　OpenStreetMapのコンセプトハッシュ可能はイミュータブルと同じか？5.1.1　タグ5.1.2　多重有向グラフ5.2　OSMnxのインストール5.3　場所の選択5.4　引数とパラメータを理解する5.5　移動時間の計算5.6　OSMnxの基本的な統計指標5.6.1　道直比5.6.2　ネットワーク分析：フランス・パリの道直比5.6.3　媒介中心性5.6.4　ネットワークの種類5.7　近隣地図のカスタマイズ5.7.1　場所からジオメトリを取得5.7.2　座標からジオメトリを取得5.8　QGISでQuickOSMを操作してみる5.9　まとめ

6章　ArcGIS Python API
6.1　設定6.1.1　ArcGIS Python APIで利用可能なモジュール6.1.2　ArcGIS Proライセンス保有者向けのインストール手順6.1.3　環境を設定する6.1.4　パッケージのインストール6.2　ArcGIS Python APIへの接続6.2.1　匿名ユーザでArcGIS Onlineに接続する方法6.2.2　ArcGISユーザアカウントへの認証情報による接続6.3　画像レイヤの探索：都市部のヒートアイランドマップ6.4　ラスタ関数6.5　画像属性の詳細6.5.1　画像の改善6.5.2　複数の時間軸における位置の比較6.5.3　レイヤのフィルタリング6.6　まとめ
7章　GeoPandasと空間統計学
7.1　GeoPandasのインストール7.2　GeoJSONファイルの操作7.3　GeoDataFrameの作成7.4　米国国勢調査のデータを処理する：ロサンゼルス人口密度地図7.4.1　国勢調査データAPIとFTPによる地域および人口データへのアクセス7.4.2　ブラウザで国勢調査データAPIのデータにアクセスする7.4.3　データプロファイルの使用7.4.4　地図の作成7.5　まとめ
8章　データのクリーニング
8.1　欠損データのチェック8.1.1　Colabへのアップロード空白をアンダースコアに変換する8.1.2　NULLと非NULL8.1.3　データ型8.1.4　メタデータ8.1.5　要約統計量8.1.6　欠損値の置き換え8.2　missingnoによりデータを可視化する8.3　マッピングのパターン8.3.1　緯度と経度8.3.2　シェイプファイル8.4　まとめ
9章　GDALを試す
9.1　GDALの設定9.1.1　Spyderのインストール9.1.2　GDALのインストール9.2　コマンドラインでのGDALの使用方法ディレクトリを理解する9.3　GDALでデータを編集する9.3.1　warp関数9.3.2　入力ラスタバンドのキャプチャ9.4　PythonでのGDALライブラリの使用方法9.4.1　Spyderを使いこなすために9.4.2　Spyderでデータを調べる9.4.3　GDALでファイルを変換する9.4.4　GDALにおけるバイナリマスクの使用法9.4.5　スクリプト全体9.5　オープンソースのラスタファイル9.5.1　USGS EarthExplorer9.5.2　Copernicus Open Access Hub9.5.3　GEE（Google Earth Engine）9.6　まとめ
10章　Pythonによる気候データの測定
10.1　例1：降水量データによる気候予測の検証10.1.1　目標10.1.2　データのダウンロード10.1.3　Xarrayで作業する10.1.4　2015年と2021年のデータセットの結合10.1.5　画像の生成10.1.6　さらなる探索10.2　例2：WTSSシリーズを用いたアマゾン熱帯雨林の森林破壊と炭素排出量の測定10.2.1　設定10.2.2　地図の作成10.2.3　分析10.2.4　結果の見直し10.3　例3：Forest at Riskを用いたグアドループの森林破壊のモデリングと予測10.3.1　設定10.3.2　データのプロット10.3.3　データのサンプリング10.3.4　相関プロット10.3.5　iCARモデルによる森林破壊の確率のモデリング10.3.6　MCMC距離行列10.3.7　predict_raster_binomial_iCARによる森林破壊の空間的確率のモデリング10.3.8　炭素排出量10.3.9　分析10.4　まとめ
付録A　その他のリソース
A.1　地理空間データ分析用PythonライブラリA.2　さらなる探索のリソース
付録B　参考文献
著者・訳者紹介
奥付

Content preview from Pythonによる地理空間データ分析 ―例題で学ぶロケーションインテリジェンス

8章データのクリーニング

データを扱う際の普遍的な問題は、データの完全性を理解することです。データエンジニアリングは、データをクリーニングし、処理し、可視化する能力に依存しています。Jupyter NotebookやGoogle ColabなどのNotebookベースのコードエディタによるデータの統合や基本的な機能については理解できたと思いますので、次はデータをクリーニングする方法を学びましょう。データには、「雑然データ」と呼ばれる問題があり、不完全（欠損）であったり、不整合な形式であったり、あるいは不正確であったりします。データクリーニングとは、このような問題に対処し、分析に必要なデータを準備するプロセスです。

本章では、一般に公開されているデータセットをいくつか調査し、Colab Notebookに読み込めるいくつかのパッケージを用いて乱雑なデータを発見し、クリーニングします。ここでは、ニューヨーク市のオープンデータポータル（https://opendata.cityofnewyork.us/）が提供するデータセットであるNYPD_Complaint_Data_Historic（2023年6月17日に更新）を使用します。ここでは、フィルタにより2020年のデータを抽出し、さらに表示および操作しやすくなるようにしました。利用するデータ項目に基づきフィルタリング†1し、CSVファイルとしてエクスポート（https://oreil.ly/7J4Kj）します。本章では、データの管理、削除、更新、統合を行い、いくつかの便利なPythonパッケージで処理する方法を紹介します。

[†1] 訳注：画面右側のFilterを選択、カラムにCMPLNT_FR_DT、値に01/01/2000-12/31/2020の間（is ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

システム運用アンチパターン ―エンジニアがDevOpsで解決する組織・自動化・コミュニケーション

Publisher Resources

ISBN: 9784814400324Publisher Website

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Pythonによる地理空間データ分析 ―例題で学ぶロケーションインテリジェンス

by Bonny P. McClain, 廣川類

8章データのクリーニング

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.