Rozdział 4. Wielojęzyczne rozpoznawanie nazwanych encji

Dotychczas w tej książce stosowaliśmy transformery do realizowania zadań NLP na korpusach angielskich, ale co robić, jeśli Twoje dokumenty są napisane w języku greckim, suahili albo klingońskim? Jedną z możliwości jest wyszukanie odpowiedniego wstępnie wytrenowanego modelu w witrynie Hugging Face Hub i dostrojenie go do bieżącego zadania. Jednak takie wstępnie wytrenowane modele zwykle istnieją tylko dla języków, które mają dużo zasobów piśmienniczych dostępnych w internecie, takich jak niemiecki, rosyjski lub mandaryński. Inny typowy problem pojawia się, kiedy Twój korpus jest wielojęzyczny; utrzymywanie wielu jednojęzycznych modeli w środowisku produkcyjnym byłoby wątpliwą przyjemnością ...

Get Przetwarzanie języka naturalnego z wykorzystaniem transformerów now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.