Kapitel 12. Bild- und Texterzeugung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bislang haben wir uns in diesem Buch auf Bildverarbeitungsmethoden konzentriert, die auf Bilder wirken. In diesem Kapitel werden wir uns mit Bildverarbeitungsmethoden beschäftigen, die Bilder erzeugen können. Bevor wir jedoch zur Bilderzeugung kommen, müssen wir lernen, wie man ein Modell trainiert, um zu verstehen, was in einem Bild ist, damit es weiß, was es erzeugen soll. Außerdem werden wir uns mit dem Problem der Texterstellung (Bildunterschriften) auf der Grundlage des Bildinhalts befassen.

Tipp

Der Code für dieses Kapitel befindet sich im Ordner 12_generation im GitHub-Repository des Buches. Wir geben die Dateinamen für die Codebeispiele und die Notizbücher an, wenn sie zutreffen.

Bild Verstehen

Es ist eine Sache zu wissen, welche Komponenten in einem Bild enthalten sind, aber es ist eine ganz andere, zu verstehen, was in dem Bild passiert und diese Informationen für andere Aufgaben zu nutzen. In diesem Abschnitt werden wir kurz die Einbettungen rekapitulieren und uns dann verschiedene Methoden (Autokoder und Variationsautokoder) ansehen, um ein Bild zu kodieren und etwas über seine Eigenschaften zu erfahren.

Einbettungen

Ein häufiges Problem bei Deep Learning-Anwendungsfällen ist der Mangel an ausreichenden Daten oder an Daten von ausreichender Qualität. In Kapitel 3 haben wir das Transfer-Lernen besprochen, ...

Get Praktisches maschinelles Lernen für Computer Vision now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.