Kapitel 8. Standardpraktiken für die Bilderzeugung mit Midjourney

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel wendest du standardisierte Techniken an, um die Ausgabe und die Formate von Diffusionsmodellen zu optimieren. Du beginnst damit, die Eingabeaufforderungen so anzupassen, dass du alle gängigen Verfahren zur Bilderzeugung kennenlernst. Alle Bilderzeugungen werden mit Midjourney v5 erstellt, sofern nicht anders angegeben. Die besprochenen Techniken wurden so entwickelt, dass sie auf jedes zukünftige oder alternative Modell übertragbar sind.

Format Modifier

Die grundlegendste Vorgehensweise bei der Bilderzeugung besteht darin, das Format des Bildes anzugeben. KI-Modelle sind in der Lage, eine Vielzahl von Formaten zu verwenden, von Stockfotos über Ölgemälde bis hin zu alten ägyptischen Hieroglyphen. Je nach Format sieht das Bild oft ganz anders aus, auch was den Stil der Objekte oder Personen angeht, die auf dem Bild zu sehen sind. Viele der Bilder in den Trainingsdaten sind Stockfotos, und dies ist auch eine der kommerziell wichtigsten Bildkategorien für die Bilderzeugung.

Eingabe:

a stock photo of a business meeting

Abbildung 8-1 zeigt die Ausgabe.

pega 0801
Abbildung 8-1. Archivfoto eines Geschäftstreffens

Die Möglichkeit, mit Open-Source-Modellen wie Stable Diffusion unendlich ...

Get Prompt Engineering für generative KI now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.