Rozdział 4. Filtry spamu, naiwny Bayes i obróbka danych
Współautorem tego rozdziału jest Jake Hofman. Jake pracuje w Microsoft Research, dokąd przeniósł się niedawno z Yahoo! Research. Zrobił doktorat z fizyki na Columbia University i systematycznie prowadzi tam fantastyczny wykład[58] z modelowania sterowanego danymi, a także nowszy kurs z socjologii obliczeniowej.
Podobnie jak w przypadku innych naszych prezenterów, przejrzałyśmy najpierw profil Jake’a jako badacza danych. Okazało się, że jest ekspertem w kategorii, którą włączył do profilu nauki o danych pod nazwą „obrabianie danych” (ociosywanie danych, ang. data wrangling)[59]. Przyznał się, że nie potrafi określić, czy poświęca temu aż tak dużo czasu, bo jest w tym dobry, czy dlatego, że ...
Get Badanie danych. Raport z pierwszej linii działań now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.