2章ディープラーニング

ディープラーニングの基本的な定義から始めることにしましょう。

ディープラーニングは、構造化されていないデータの高レベルな表現を学習するため、積み重なった複数の処理ノードの層を用いる機械学習のアルゴリズムの一種です。

ディープラーニングを十分に理解する、特に、それがなぜ生成モデリングで非常に役に立つのかを理解するには、この定義を少し掘り下げる必要があります。最初に「構造化されていないデータ」と、それと対照をなす「構造化されたデータ」について説明しましょう。

2.1 構造化されたデータと構造化されていないデータ

多くの種類の機械学習のアルゴリズムは、構造化された表形式のデータの入力が必要です。表形式のデータはそれぞれの観測を記述する特徴の列から成ります。例えば、ある人の年齢、収入、先月閲覧したWebサイトの数はすべて、その人が来月ある特定のオンラインサービスを契約するかどうかを予測するのに役に立つ特徴です。私たちは、これらの特徴量から成る構造化された表を用いて、ロジスティクス回帰、ランダムフォレスト、XGBoostモデルを訓練することで、2値の結果、すなわち、この人は契約する(1)、契約しない(0)を予測できるようになります。この場合、個々の特徴量は観測に関する小さな情報の塊を含んでおり、モデルはこれらの特徴量が結果とどのように影響するかを学習します。

構造化されていないデータは、そのままでは特徴量の列に配置されないデータ、例えば、画像、音声、テキストなどを指します。もちろん、画像には空間的構造があり、録音した音声には時間的構造があり、動画データにはその両方の構造がありますが、これらのデータは特徴量の並びという形にはならないため、構造化されていないと考えられます( ...

Get 生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.