Rozdział 9. Jak radzić sobie z nielicznymi etykietami lub brakiem etykiet

Istnieje pytanie, które jest tak głęboko wdrukowane w umysł każdego specjalisty data science, że zwykle zadaje je on na początku każdego nowego projektu: czy mamy dane opatrzone etykietami? Często odpowiedź brzmi „nie” albo „trochę”, a klient oczekuje, że Twoje wyszukane modele uczenia maszynowego będą mimo to działać dobrze. Ponieważ trenowanie modeli na bardzo małych zbiorach danych zwykle nie przynosi dobrych rezultatów, oczywistym rozwiązaniem jest adnotowanie większej ilości danych. Zajmuje to jednak czas i bywa bardzo kosztowne, zwłaszcza jeśli każda adnotacja musi zostać zweryfikowana przez eksperta dziedzinowego.

Na szczęście istnieje kilka metod, które można zastosować ...

Get Przetwarzanie języka naturalnego z wykorzystaniem transformerów now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.