7章作曲する
視覚芸術や作文と並んで、作曲もまた、人間に固有だと考えられている主な創作活動の1つです。
私たちの耳に心地よい音楽を機械が作曲するためには、前章で作文に関して見てきたのと同じ多くの技術的課題を克服する必要があります。具体的にはそのモデルは、音楽から学習して音楽の時系列構造を再作成できなければならず、さらにそれに続く音符を確率の離散集合から選択できなければなりません。
しかし音楽の生成には、テキストの生成では必要のなかった課題も存在します。すなわち、音程とリズムです。音楽は多くの場合ポリフォニック(多声)です。つまり、異なる楽器で同時に演奏される複数の音符の流れがあり、それが組み合わさって協和音(調和)や不協和音(衝突)のハーモニーが作られます。テキスト生成で扱う必要があるのはテキストの単独の流れだけで、音楽にあるような並行する和音の流れはありませんでした。
さらに、テキスト生成は一度に1単語ずつ処理することができます。これが音楽データを処理する方法として適切かどうかは、注意深い検討が必要です。音楽を聴くことから起こる興趣の多くは、アンサンブル中のさまざまなリズムの相互作用の中にあるからです。例えば、ピアニストが和音を長くサスティーンさせている間、ギタリストは速い音符を立て続けに弾くかもしれません。このように、たいていの場合すべての楽器が同時に音符を変えることは望ましくないので、1音符ずつ音楽を生成する方法では複雑になるのです。
この章はこの問題を単純化して、始めはモノフォニック(単旋律)な音楽の生成に焦点を当てます。テキスト生成と音楽生成には共通の主題がたくさんあるため、前章のRNN技法の多くが音楽生成にも使えます。この章は、アテンション機構(注意機構)についても紹介します。これにより、以前のどの音符に注目すべきかを選んで次にどの音符が現れるかを予測できるRNNを作成できます。最後に、ポリフォニックな音楽の生成に取り組み、複数の旋律から成る音楽を作るためにGANに基づいたアーキテクチャをどのように展開できるかを検討します。 ...
Get 生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.