O'Reilly logo

Badanie danych. Raport z pierwszej linii działań by Cathy O'Neil, Rachel Schutt

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

Rozdział 4. Filtry spamu, naiwny Bayes i obróbka danych

Współautorem tego rozdziału jest Jake Hofman. Jake pracuje w Microsoft Research, dokąd przeniósł się niedawno z Yahoo! Research. Zrobił doktorat z fizyki na Columbia University i systematycznie prowadzi tam fantastyczny wykład[58] z modelowania sterowanego danymi, a także nowszy kurs z socjologii obliczeniowej.

Podobnie jak w przypadku innych naszych prezenterów, przejrzałyśmy najpierw profil Jake’a jako badacza danych. Okazało się, że jest ekspertem w kategorii, którą włączył do profilu nauki o danych pod nazwą „obrabianie danych” (ociosywanie danych, ang. data wrangling)[59]. Przyznał się, że nie potrafi określić, czy poświęca temu aż tak dużo czasu, bo jest w tym dobry, czy dlatego, że ...

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, interactive tutorials, and more.

Start Free Trial

No credit card required