October 2025
Intermediate to advanced
434 pages
12h 13m
German
Den meisten Menschen würde im Zusammenhang mit Large Language Models (LLMs) vermutlich nicht als Erstes in den Sinn kommen, dass diese auch multimodal sein können. Schließlich handelt es sich um Sprachmodelle! Wenn man sich jedoch der vielfältigen Anwendungsmöglichkeiten bewusst wird, die sich durch die Möglichkeit zur Verarbeitung anderer Datentypen als Text ergeben, erkennt man schnell, dass sie dann noch weitaus nützlicher sind. Es ist beispielsweise ausgesprochen hilfreich, wenn man einem Sprachmodell ein Bild zeigen kann und es in der Lage ist, dazu Fragen zu beantworten. Ein Modell, das sowohl Texte als auch Bilder (also verschiedene Modalitäten) verarbeiten kann, wird als multimodal bezeichnet ...
Read now
Unlock full access