Skip to Content
Java クックブック、第 4 版
book

Java クックブック、第 4 版

by Ian F. Darwin
May 2025
Intermediate to advanced
638 pages
10h 22m
Japanese
O'Reilly Media, Inc.
Content preview from Java クックブック、第 4 版

第11章. データサイエンスとR

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

データ・サイエンスは比較的新しい学問分野であり、オライリーのマイク・ルーキデスによるこの記事()で初めて多くの人の注目を集めた。この分野には多くの定義があるが、ルーキデスはこの分野の詳細な観察と参加をこの定義に集約した:

データ・アプリケーションは、データそのものからその価値を獲得し、その結果としてより多くのデータを作成する。単なるデータ・アプリケーションではなく、データ製品なのだ。データ・サイエンスはデータ製品の創造を可能にする。

データサイエンスソフトウェアの主要なオープンソースエコシステムの1つがApacheで、Hadoop(HDFS分散ファイルシステム、HadoopMap/Reduceを含む)、Cassandra分散データベース、Sparkコンピュートエンジンを含む、1 最新のリストについては、Hadoopページの「モジュールとリレーショナル・ツール」のセクションを読もう。

ここで興味深いのは、データサイエンティストにとって当たり前のこのインフラの多くが、JavaとScala(JVM言語)で書かれていることだ。 残りの多くは、Javaを補完する言語であるPythonで書かれている。

データサイエンスの問題には多くの設定が必要な場合があるので、ここでは従来のDSからSparkフレームワークを使った例を1つだけ紹介する。 SparkはScalaで書かれているので、Javaコードから直接使うことができる。

Rは広く使われており、知っておくと便利である。Rの主な実装はJavaで書かれたものではなく、C言語とFortranとR自身の混合言語である。 しかし、RはJavaの中で使うことができ、JavaはRの中で使うことができる。Rのいくつかの実装とその選び方について話し、RからJavaを使うテクニックとJavaからRを使うテクニック、そしてウェブアプリケーションでRを使うテクニックを紹介する。

11.1 Javaによるマシン学習

問題

機械学習やデータサイエンスにJavaを使いたいのに、みんなPythonを使えと言う。

解決策

無料でダウンロードできる数多くの強力なJavaツールキットのいずれかを使用する。

ディスカッション

機械学習(ML)や深層学習(Deep Learning)は、効率化のためにC++で、あるいはソフトウェアの豊富さのためにPythonでやらなければならないと言われることがある。 これらの言語には利点があり、支持者もいるが、これらの目的にJavaを使うことは確かに可能だ。 しかし、これらのパッケージをセットアップし、短いデモを紹介するとなると、本書の典型的なレシピ形式では収まらない長さになりがちだ。

業界大手のAmazonが、本書の出版と同時にJavaベースのDeep Java Learning (DJL)ライブラリをリリースしたし、他にも多くの優れたライブラリが利用できる(GPUベースの処理を高速化するためにCUDAをサポートしているものもかなりある)ので(表11-1参照)、MLにJavaを使わない理由はない。 DJLを除いて、現在も保守が続けられていて、ユーザの間でそれなりの評判があるパッケージをリストアップしてみた。

表11-1. いくつかのJavaマシン学習パッケージ
図書館名 説明 情報URL ソースURL

ADAMS

データドリブンでリアクティブなワークフローを構築/維持するためのワークフローエンジン。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

最新の Java レシピ

最新の Java レシピ

Ken Kousen
Javaによる関数型プログラミング ―Java 8ラムダ式とStream

Javaによる関数型プログラミング ―Java 8ラムダ式とStream

Venkat Subramaniam, 株式会社プログラミングシステム社
MySQL クックブック、第 4 版

MySQL クックブック、第 4 版

Sveta Smirnova, Alkin Tezuysal

Publisher Resources

ISBN: 9798341650336