Rozdział 3. Zasada danych jako produktu

Do długoletnich wyzwań istniejących architektur danych analitycznych należą duży opór i koszt wykorzystywania danych: wykrywanie, rozumienie, obdarzanie zaufaniem, badanie i ostatecznie konsumowanie danych o wysokiej jakości. Przeprowadzono liczne badania dotyczące tego oporu. W niedawnym raporcie Anacondy (firmy dostarczającej platformę badania danych) The State of Data Science 2020 (https://oreil.ly/S8XMz) można znaleźć stwierdzenie, że badacz danych prawie połowę czasu poświęca na przygotowywanie danych — ich ładowanie i oczyszczanie. Jeśli ten problem nie zostanie rozwiązany, zastosowanie siatki danych tylko go pogłębi z uwagi na wzrost liczby miejsc i zespołów dostarczających dane, czyli dziedzin. ...

Get Siatka danych now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.