Rozdział 4. Pozyskiwanie początkowego zbioru danych
Po opracowaniu planu spełnienia wymagań produktowych i zbudowaniu prototypu weryfikującego przydatność zaproponowanego procesu i modelu, można dokładniej przyjrzeć się zbiorowi danych. Uzyskane wnioski wykorzystamy do podjęcia decyzji dotyczących modelowania. Często dokładna znajomość danych pozwala wprowadzić duże usprawnienia.
W tym rozdziale zaczniemy od przejrzenia sposobów skutecznego oceniania jakości zbioru danych. Następnie zajmiemy się metodami wektoryzacji danych i wykorzystaniem reprezentacji wektorowej do efektywnego znakowania i badania zbioru. Na koniec na podstawie wyników badań określimy strategię generowania cech.
Zacznijmy od badania zbioru danych i oceniania jego jakości. ...
Get Uczenie maszynowe w aplikacjach now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.