September 2020
Intermediate to advanced
272 pages
7h 34m
German
Eine (oder gleich mehrere) der erfolgreichsten Deep-Learning-Anwendungen tragen die meisten von uns jeden Tag mit sich herum: Ob Siri, Google Now oder Amazons Alexa – sie alle basieren auf neuronalen Netzen. In diesem Kapitel werfen wir einen Blick auf PyTorchs torchaudio-Paket. Sie werden lernen, wie man eine Pipeline mit einem Konvolutionsmodell zur Klassifizierung von Tondateien entwickeln kann. Danach werde ich Ihnen noch einen anderen Ansatz zeigen, der es Ihnen erlaubt, einige der zuvor bei Bilddaten erlernten Tricks anzuwenden und eine hohe Genauigkeit auf dem ESC-50-Audiodatensatz zu erzielen.
Doch sehen wir uns zunächst an, was genau ein Ton ist. Wie wird er in Datenform dargestellt? Liefert ...
Read now
Unlock full access