KAPITEL 9

Ansätze bei wenigen bis keinen Labels

Eine Frage ist so tief in den Köpfen der Data Scientists verankert, dass sie in der Regel die erste ist, die zu Beginn eines neuen Projekts gestellt wird: Gibt es denn überhaupt gelabelte Daten? Meistens lautet die Antwort »nein« oder »ein paar«, einhergehend mit der Erwartung des Kunden, dass die ausgefallenen Machine-Learning-Modelle Ihres Teams dennoch gut funktionieren sollten. Da Modelle, die nur mit sehr kleinen Datensätzen trainiert wurden, in der Regel keine guten Ergebnisse erzielen, besteht eine naheliegende Lösung darin, schlicht mehr Daten zu annotieren bzw. zu labeln. Dies ist jedoch zeitaufwendig und kann sehr kostspielig sein, vor allem dann, wenn die Annotationen Fachwissen erfordern, ...

Get Natural Language Processing mit Transformern now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.