book

高性能 Python、第 3 版

Name: 高性能 Python、第 3 版
ISBN: 9798341651951

by Micha Gorelick, Ian Ozsvald

May 2025

Intermediate to advanced

524 pages

8h 30m

Japanese

O'Reilly Media, Inc.

Read now

Unlock full access

序文
序文
この本は誰のためにあるのか？この本が向いていない人何を学ぶかPython 3ライセンス属性の作り方コード例を使う正誤表とフィードバック本書で使用されている慣例オライリー・オンライン・ラーニング問い合わせ先謝辞
1.パフォーマントPythonを理解する
コンピュータの基本システムコンピューティング・ユニットメモリーユニット通信レイヤー理想化されたコンピューティングとPython仮想マシンの比較理想化されたコンピューティングPythonの仮想マシンでは、なぜPythonを使うのか？パフォーマンスの高いプログラマになる方法優れた労働慣行コードブロックではなくチームに最適化するリモート・パフォーマント・プログラマ良いノートの使い方についての考察あなたの仕事Pythonの未来GILはどこへ行ったのか？PythonにJITはあるのか？まとめ
2.ボトルネックを発見するためのプロファイリング
効率的なプロファイリングユリア集合の紹介完全ジュリア集合を計算するタイミングプリントとデコレーターへのシンプルなアプローチUnix timeコマンドを使った簡単な計時cProfileモジュールを使うSnakeVizでcProfileの出力を視覚化する行ごとの測定にline_profilerを使うメモリ使用量を診断するためにmemory_profilerを使うScaleneでCPUとメモリのプロファイリングを組み合わせるPySpyで既存のプロセスを調べるVizTracerによるインタラクティブなタイムベースの呼び出しスタックバイトコードアンダー・ザ・フッドdisモジュールを使ってCPythonバイトコードを調べるスペシャリストでバイトコード特殊化を掘り下げる異なるアプローチ、異なる複雑性正しさを維持するための最適化中の単体テストノープ@プロフィールデコレーターコードのプロファイリングを成功させるための戦略まとめ
3.リストとタプル
より効率的な検索リスト対タプル動的配列としてのリスト静的配列としてのタプルまとめ
4.辞書とセット
辞書とセットはどのように機能するのか？挿入と取り出し削除サイズ変更ハッシュ関数とエントロピーまとめ
5.イテレーターとジェネレーター
無限級数の反復子レイジー・ジェネレーターの評価まとめ
6.行列とベクトルの計算
問題の紹介Pythonのリストで十分ではないか？多すぎる割り当ての問題点メモリの断片化完璧を理解する完璧なアウトプットで決断を下すnumpyを入力する拡散問題にnumpyを適用するメモリ割り当てとin-place演算子選択的最適化：修正すべき点を発見するnumexpr：in-place演算子をより速く簡単にするグラフィックス・プロセッシング・ユニット（GPU）動的グラフPyTorchGPUのスピードと数値精度GPU固有の演算子基本的なGPUプロファイリングGPUの性能に関する考察GPUをいつ使うかディープラーニングのパフォーマンスに関する考察注意すべき物語：最適化」を検証する (scipy)マトリックス最適化の教訓まとめ
7.パンダ、ダスク、ポーラー
パンダパンダの内部モデルアローとNumPy多くの行のデータに関数を適用するPandasのためにNumPyをコンパイルするNumba連結するのではなく、部分的な結果から構築する仕事をする方法は1つではない（そしてより速くできる可能性もある効果的なパンダ開発のためのアドバイス分散データ構造とデータフレームのためのDask診断DaskでPandasを並列化するDask上のSwifterでアプリケーションを並列化する高速データフレームの極まとめ
8.Cにコンパイルする
どのようなスピードアップが可能なのか？JITコンパイラとAOTコンパイラの比較なぜ型情報はコードの高速化に役立つのか？Cコンパイラを使うジュリア集合の例を見直すサイソンCythonを使って純粋なPythonバージョンをコンパイルするピキシムポートCythonアノテーションでコードのブロックを分析する型アノテーションを追加するCythonとnumpy台のマシンでOpenMPを使ってソリューションを並列化するヌンバPyPyガベージコレクションの違いPyPyの実行とモジュールのインストールスピード向上の概要それぞれの技術をいつ使うか外部関数インタフェースタイプcffif2pyCPython 拡張：CCPythonの拡張：Rustまとめ

9.非同期I/O
非同期プログラミング入門async/awaitはどのように機能するのか？シリアル・ウェブ・クローラー非同期ウェブクローラ共有CPU-I/OワークロードシリアルCPUワークロードバッチCPUワークロード完全非同期CPUワークロードまとめ
10.マルチプロセッシング・モジュール
マルチプロセッシング・モジュールの概要モンテカルロメソッドで円周率を推定するプロセスとスレッドを使って円周率を見積もるPythonオブジェクトを使うマルチプロセシングをJoblibに置き換える並列システムにおける乱数numpyを使う素数の発見仕事のキュー非同期でキューにジョブを追加するプロセス間通信を使ったプライムの検証シリアライゼーションナイーブ・プール・ソリューションナイーブでないプール・ソリューションmanager.Valueをフラグとして使用するRedisをフラグとして使うRawValueをフラッグとして使うmmapをフラグとして使うmmapをフラグとして使う Reduxマルチプロセッシングでnumpyデータを共有するファイルアクセスと変数アクセスの同期化ファイルロック値をロックするまとめ
11.クラスターとジョブキュー
クラスタリングの利点クラスタリングの欠点ウォール街で4億6200万ドルの損失、クラスターのアップグレード戦略の失敗が招いたスカイプの24時間グローバル障害一般的なクラスターデザインクラスター化ソリューションの開始方法クラスター使用時の痛みを避ける方法つのクラスタリング・ソリューションIPythonパラレルを使って研究をサポートするメッセージブローカーによるクラスタ効率化その他のクラスタリングツールDockerDockerのパフォーマンスDockerの利点まとめ
12.RAMの使用量を減らす
プリミティブ用オブジェクトは高価であるarrayモジュールは多くのプリミティブなオブジェクトを安価に格納する。NumExprを使用してNumPyでより少ないRAMを使用するコレクションで使用されるRAMを理解するバイト対ユニコード大量のテキストを効率的にRAMに保存する1100万トークンでこれらのアプローチを試すscikit-learnのFeatureHasherでより多くのテキストをモデリングするDictVectorizerとFeatureHasherの紹介実際の問題でDictVectorizerとFeatureHasherを比較するSciPyの疎行列より少ないRAMを使うためのヒント確率的データ構造1バイトモリスカウンタによる超近似カウントK最小値ブルームフィルターログログカウンタ実例まとめ
13.現場からの教訓
高性能機械学習アルゴリズムの開発ジャーナリズムにおけるハイパフォーマンス・コンピューティングサイバー再保険の現場からの教訓クオンツファイナンスにおけるPython高いパフォーマンスを達成するために柔軟性を維持するFeature-engineでフィーチャーエンジニアリングのパイプラインを効率化する（2020年パフォーマンスの高いデータサイエンスチーム（2020年）ヌンバ（2020年）最適化と思考の比較（2020年）RadimRehurek.comでディープラーニングを飛躍させる（2014年スメッシュでの大規模ソーシャルメディア分析（2014年）
インデックス
著者について

Content preview from 高性能 Python、第 3 版

第10章マルチプロセッシング・モジュールマルチプロセッシング・モジュール

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

CPython はデフォルトではマルチCPUを使わない。これはPythonがシングルコアの時代に設計されたからでもあるし、並列化を効率的に行うのが実はかなり難しいからでもある。Pythonはそれを行うためのツールを与えてはくれるが、私たち自身の選択に委ねられている。とはいえ、マルチコアマシンで1つのCPUだけを使って長時間処理をするのはつらいので、この章ではマシンのすべてのコアを一度に使う方法を検討する。

注

先ほどCPythonについて触れたが、これは私たち全員が使っている一般的な実装である。Python言語にはマルチコアシステムを使うことを止めるものはない。CPythonの実装はマルチコアを効率的に使うことができないが、将来の実装はこの制限に縛られないかもしれない。

ノートPCでは6コアが一般的で、96コアのデスクトップ構成もある。もしあなたの仕事が、それほど多くのエンジニアリングを必要とせずに、複数のCPUで動作するように分割できるのであれば、これは賢明な方向性である。

Pythonを使ってCPUのセット上で問題を並列化すると、nコアで最大n倍（ntimes）のスピードアップが期待できる。クアッドコアのマシンを持っていて、4つのコアすべてをタスクに使うことができれば、元の実行時間の4分の1で実行できるかもしれない。4倍以上のスピードアップが見られる可能性は低く、実際には3倍から4倍のスピードアップが見られるだろう。

プロセスが追加されるたびに通信オーバーヘッドが増え、使用可能なRAMが減少するため、n倍のスピードアップが得られることはほとんどない。どの問題を解くかにもよるが、通信オーバーヘッドが非常に大きくなり、大幅な速度低下が見られることさえある。この種の問題は、並列プログラミングの複雑さの原因であることが多く、、通常はアルゴリズムの変更が必要になる。これが、並列プログラミングがしばしば芸術とみなされる理由である。

アムダールの法則（）をご存じない方は、背景を読み取っておく価値がある。この法則は、コードのごく一部しか並列実行できない場合、CPUをどれだけ投入しても、全体としてはそれほど速く実行できないことを示している。たとえ実行時間の大部分を並列実行できたとしても、全体的な処理を高速化するために効率的に使用できるCPUの数には限りがある。

multiprocessing モジュールを使えば、プロセスベースやスレッドベースの並列処理を使ったり、キュー上で作業を分担したり、プロセス間でデータを共有したりできる。このモジュールは、主にシングルマシンのマルチコア並列処理に焦点を当てている（マルチマシン並列処理には、より優れたオプションがある）。非常に一般的な使い方は、CPUに負荷のかかる問題に対して、プロセスセット上でタスクを並列化することである。OpenMP ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341651951

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

高性能 Python、第 3 版

by Micha Gorelick, Ian Ozsvald

第10章マルチプロセッシング・モジュールマルチプロセッシング・モジュール

注

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.