Siatka danych

Book description

Dostęp do danych jest warunkiem rozwoju niejednej organizacji. Aby w pełni skorzystać z ich potencjału i uzyskać dzięki nim konkretną wartość, konieczne jest odpowiednie zarządzanie danymi. Obecnie stosowane rozwiązania w tym zakresie nie nadążają już za złożonością dzisiejszych organizacji, rozprzestrzenianiem się źródeł danych i rosnącymi aspiracjami inżynierów, którzy rozwijają techniki sztucznej inteligencji i analizy danych. Odpowiedzią na te potrzeby może być siatka danych, jednak praktyczna implementacja tej koncepcji wymaga istotnej zmiany myślenia.

Ta książka szczegółowo wyjaśnia paradygmat siatki danych, a przy tym koncentruje się na jego praktycznym zastosowaniu. Zgodnie z tym nowatorskim podejściem dane należy traktować jako produkt, a dziedziny - jako główne zagadnienie. Poza wyjaśnieniem paradygmatu opisano tu zasady projektowania wysokopoziomowej architektury komponentów siatki danych, a także przedstawiono wskazówki i porady dotyczące ewolucyjnej realizacji siatki danych w organizacji. Tematyka ta została potraktowana wszechstronnie: omówiono kwestie technologiczne, organizacyjne, jak również socjologiczne i kulturowe. Dzięki temu jest to cenna lektura zarówno dla architektów i inżynierów, jak i dla badaczy, analityków danych, wreszcie dla liderów i kierowników zespołów.

W książce:

wyczerpujące wprowadzenie do paradygmatu siatki danych
siatka danych i jej komponenty
projektowanie architektury siatki danych
opracowywanie i realizacja strategii siatki danych
zdecentralizowany model własności danych
przejście z hurtowni i jezior danych do rozproszonej siatki danych

Siatka danych: kolejny etap rozwoju technologii big data!

Table of contents

  1. Opinie o książce
  2. Przedmowa
  3. Wstęp
    1. Dlaczego napisałam tę książkę i dlaczego teraz?
    2. Dla kogo przeznaczona jest ta książka?
    3. Jak czytać tę książkę?
    4. Konwencje stosowane w tej książce
    5. Podziękowania
  4. Prolog. Wyobraź sobie siatkę danych
    1. Siatka danych w działaniu
      1. Kultura ciekawości danych i eksperymentów
        1. Kultura danych przed wprowadzeniem siatki danych
      2. Osadzone partnerstwo z danymi i uczeniem maszynowym
        1. Praca z danymi przed siatką danych
      3. Niewidzialna platforma i reguły
      4. Nieograniczone skalowanie z autonomicznymi produktami danych
      5. Pozytywny efekt sieciowy
    2. Dlaczego warto dokonać transformacji w kierunku siatki danych?
    3. Droga ku przyszłości
  5. Część I. Czym jest siatka danych?
  6. Rozdział 1. Siatka danych w pigułce
    1. Rezultaty
    2. Transformacje
    3. Zasady
      1. Zasada własności dziedziny
      2. Zasada danych jako produktu
      3. Zasada samoobsługowej platformy danych
      4. Zasada sfederowanego zarządzania obliczeniowego
    4. Wzajemne oddziaływanie zasad
    5. Spojrzenie na model siatki danych
    6. Dane
      1. Dane operacyjne
      2. Dane analityczne
    7. Pochodzenie
  7. Rozdział 2. Zasada własności dziedziny
    1. Krótkie wprowadzenie do projektowania dziedzinowego
    2. Zastosowanie projektowania strategicznego DDD do danych
    3. Archetypy danych dziedzinowych
      1. Dane dziedzinowe dostosowane do źródła
      2. Zagregowane dane dziedzinowe
      3. Dane dziedzinowe dostosowane do konsumenta
    4. Przechodzenie w kierunku własności dziedzinowej
      1. Przekazuj własność danych upstreamowo
      2. Definiuj wiele połączonych modeli
      3. Wykorzystaj dane najbardziej odpowiedniej dziedziny: nie oczekuj jednego źródła prawdy
      4. Ukrywaj potoki danych jako wewnętrzną implementację dziedzin
    5. Podsumowanie
  8. Rozdział 3. Zasada danych jako produktu
    1. Zastosowanie do danych myślenia w kategoriach produktu
      1. Podstawowe atrybuty użyteczności produktu danych
        1. Wykrywalny
        2. Adresowalny
        3. Zrozumiały
        4. Godny zaufania i zgodny z prawdą
        5. Natywnie dostępny
        6. Interoperacyjny
        7. Cenny sam w sobie
        8. Bezpieczny
    2. Przechodzenie do zasady danych jako produktu
      1. Uwzględnij własność produktu danych w dziedzinach
      2. Przeformułuj nomenklaturę, aby zainicjować zmiany
      3. Traktuj dane jako produkt, a nie zwykły zasób
      4. Kształtuj kulturę danych opartą na zasadzie „ufaj, ale sprawdzaj”
      5. Łącz dane i obliczaj je jako pojedynczą jednostkę logiczną
    3. Podsumowanie
  9. Rozdział 4. Zasada samoobsługowej platformy danych
    1. Porównanie platformy siatki danych z innymi rozwiązaniami
      1. Dostosowanie do autonomicznych zespołów opartych na dziedzinach
      2. Zarządzanie autonomicznymi i interoperacyjnymi produktami danych
      3. Zintegrowana platforma dla funkcjonalności operacyjnych i analitycznych
      4. Dostosowanie do generalistów
      5. Faworyzowanie technologii zdecentralizowanych
      6. Niezależność dziedzinowa
    2. Myślenie w kategoriach platformy siatki danych
      1. Umożliwienie autonomicznym zespołom uzyskiwania wartości z danych
        1. Zapewnienie odpowiednich narzędzi twórcom produktu danych
        2. Zapewnienie odpowiednich narzędzi użytkownikom produktu danych
      2. Wymiana wartości za pomocą autonomicznych i interoperacyjnych produktów danych
        1. Tworzenie wartości wyższego rzędu przez komponowanie produktów danych
      3. Przyspieszenie wymiany wartości przez zmniejszenie obciążenia poznawczego
        1. Tworzenie abstrakcji złożoności przez modelowanie deklaratywne
        2. Tworzenie abstrakcji złożoności przez automatyzację
      4. Poziome skalowanie udostępniania danych
      5. Wspieranie kultury wbudowanych innowacji
    3. Przechodzenie na samoobsługową platformę siatki danych
      1. Najpierw zaprojektuj interfejsy API i protokoły
      2. Przygotuj się na dostosowanie do generalistów
      3. Przeprowadź inwentaryzację i dokonaj uproszczenia
      4. Utwórz wysokopoziomowe interfejsy API do zarządzania produktami danych
      5. Buduj doświadczenia, a nie mechanizmy
      6. Zacznij od najprostszych fundamentów, a potem zbieraj plony, aby ewoluować
    4. Podsumowanie
  10. Rozdział 5. Zasada sfederowanego zarządzania obliczeniowego
    1. Zastosowanie myślenia systemowego do zarządzania siatką danych
      1. Utrzymywanie dynamicznej równowagi między autonomią dziedzinową a globalną interoperacyjnością
        1. Pętle informacji zwrotnych
        2. Punkty dźwigni
      2. Przyjęcie topologii dynamicznej jako stanu domyślnego
      3. Wykorzystanie automatyzacji i architektury rozproszonej
    2. Zastosowanie federacji do modelu zarządzania
      1. Zespół sfederowany
        1. Przedstawiciele dziedzin
        2. Przedstawiciele platformy danych
        3. Eksperci merytoryczni
        4. Koordynatorzy i menedżerowie
      2. Wartości przewodnie
        1. Decyzje i odpowiedzialność umieść blisko źródła
        2. Zidentyfikuj przekrojowe problemy, które wymagają globalnego standardu
        3. Globalizuj decyzje ułatwiające interoperacyjność
        4. Zidentyfikuj spójne doświadczenia, które wymagają globalnego standardu
        5. Wykonuj decyzje lokalnie
      3. Reguły
        1. Reguły lokalne
        2. Reguły globalne
      4. Zachęty
        1. Zachęty lokalne
        2. Zachęty globalne
    3. Zastosowanie obliczeń do modelu zarządzania
      1. Standardy jako kod
      2. Reguły jako kod
      3. Zautomatyzowane testy
      4. Zautomatyzowane monitorowanie
    4. Przechodzenie na sfederowane zarządzanie obliczeniowe
      1. Delegowanie odpowiedzialności do dziedzin
      2. Osadzanie wykonywania reguł w poszczególnych produktach danych
      3. Automatyzacja zapewniania możliwości oraz monitorowania zamiast interweniowania
      4. Modelowanie luk
      5. Pomiar efektu sieciowego
      6. Przyjęcie zmian w miejsce stałości
    5. Podsumowanie
  11. Część II. Dlaczego siatka danych?
  12. Rozdział 6. Punkt przegięcia
    1. Wielkie oczekiwania wobec danych
    2. Wielki podział danych
    3. Skala — bliskie spotkania z nowym gatunkiem
    4. Nie tylko porządek
    5. Zbliżanie się do punktu zwrotu
    6. Podsumowanie
  13. Rozdział 7. Po punkcie przegięcia
    1. Płynne reagowanie na zmiany w złożonym biznesie
      1. Wzajemne dostosowanie biznesu, technologii i danych analitycznych
      2. Wypełnienie luki między danymi analitycznymi i operacyjnymi
      3. Lokalizowanie zmian danych w dziedzinach biznesowych
      4. Zmniejszenie przypadkowej złożoności potoków i kopiowania danych
    2. Utrzymanie zwinności w obliczu wzrostu
      1. Usunięcie scentralizowanych i monolitycznych wąskich gardeł
      2. Zmniejszenie koordynacji potoków danych
      3. Zmniejszenie koordynacji zarządzania danymi
      4. Zapewnienie autonomii
    3. Zwiększenie współczynnika wartości z danych w stosunku do inwestycji
      1. Tworzenie warstwy abstrakcji dla złożoności technicznej za pomocą platformy danych
      2. Wszechobecne stosowanie myślenia w kategoriach produktowych
      3. Przekraczanie granic
    4. Podsumowanie
  14. Rozdział 8. Przed punktem przegięcia
    1. Ewolucja architektur danych analitycznych
      1. Pierwsza generacja — architektura hurtowni danych
      2. Druga generacja — architektura jeziora danych
      3. Trzecia generacja — multimodalna architektura chmury
    2. Charakterystyka architektury danych analitycznych
      1. Monolityzm
        1. Architektura monolityczna
        2. Technologia monolityczna
        3. Organizacja monolityczna
        4. Skomplikowany monolit
      2. Scentralizowana własność danych
      3. Wykorzystanie technologii
        1. Architektura partycjonowania technicznego
        2. Dekompozycja zespołów na podstawie działań
    3. Podsumowanie
  15. Część III. Jak zaprojektować architekturę siatki danych?
    1. Zakres
    2. Dojrzałość
  16. Rozdział 9. Architektura logiczna
    1. Dziedzinowe interfejsy udostępniania danych analitycznych
      1. Projekt interfejsu operacyjnego
      2. Projekt interfejsu danych analitycznych
      3. Międzydziedzinowe zależności danych analitycznych
    2. Produkt danych jako kwant architektury
      1. Komponenty strukturalne produktu danych
        1. Kod
        2. Dane i metadane
        3. Zależności platformy
      2. Interakcje współdzielenia danych przez produkty danych
        1. Porty danych wejściowych
        2. Porty danych wyjściowych
      3. Interfejsy API wykrywania i obserwowalności danych
    3. Wielopłaszczyznowa platforma danych
      1. Płaszczyzna platformy
      2. (Narzędziowa) płaszczyzna infrastruktury danych
      3. Płaszczyzna doświadczenia produktu danych
      4. Płaszczyzna doświadczenia siatki
      5. Przykład
    4. Osadzone reguły obliczeniowe
      1. Przyczepa produktu danych
        1. Wykonywanie reguł
        2. Znormalizowane protokoły i interfejsy
      2. Kontener obliczeniowy produktu danych
      3. Port sterowania
        1. Konfigurowanie reguł
        2. Operacje z wysokim poziomem uprawnień
    5. Podsumowanie
  17. Rozdział 10. Architektura wielopłaszczyznowej platformy danych
    1. Projekt platformy oparty na podróżach użytkowników
    2. Podróż twórcy produktu danych
      1. Rozpoczęcie projektowania, eksplorowanie, wstępne uruchamianie i określanie źródeł
      2. Budowanie, testowanie, wdrażanie i uruchamianie
      3. Utrzymywanie, ewoluowanie i wycofywanie
    3. Podróż konsumenta produktu danych
      1. Rozpoczęcie projektowania, eksplorowanie, wstępne uruchamianie i określanie źródeł
      2. Budowanie, testowanie, wdrażanie i uruchamianie
      3. Monitorowanie, ewoluowanie i wycofywanie
    4. Podsumowanie
  18. Część IV. Jak zaprojektować architekturę produktu danych?
  19. Rozdział 11. Projektowanie produktu danych według afordancji
    1. Afordancje produktu danych
    2. Charakterystyka architektury produktu danych
    3. Projektowanie inspirowane prostotą złożonych systemów adaptacyjnych
      1. Zachowanie wynikające z prostych reguł lokalnych
      2. Brak centralnej orkiestracji
    4. Podsumowanie
  20. Rozdział 12. Projektowanie konsumowania, przekształcania i serwowania danych
    1. Serwowanie danych
      1. Potrzeby użytkowników danych
      2. Właściwości projektowania serwowania danych
        1. Dane multimodalne
        2. Dane niemutowalne
        3. Dane bitemporalne
        4. Dostęp w trybie „tylko do odczytu”
      3. Projektowanie serwowania danych
    2. Konsumowanie danych
      1. Archetypy źródeł danych
        1. Współpracujące systemy operacyjne jako źródła danych
        2. Inne produkty danych jako źródła danych
        3. Własne dane jako źródło danych
      2. Lokalizacja konsumpcji danych
      3. Projektowanie konsumowania danych
    3. Przekształcanie danych
      1. Przekształcanie programowe i nieprogramowe
      2. Transformacja oparta na przepływie danych
      3. Uczenie maszynowe jako transformacja
      4. Transformacja niestacjonarna
      5. Projekt transformacji
    4. Podsumowanie
  21. Rozdział 13. Projektowanie wykrywania, rozumienia i komponowania danych
    1. Wykrywanie, rozumienie, obdarzanie zaufaniem i eksplorowanie
      1. Rozpocznij wykrywanie od samorejestracji
      2. Wykrywanie globalnego identyfikatora URI
      3. Zrozumienie modeli semantycznych i składniowych
      4. Ustanowienie zaufania za pomocą gwarancji danych
      5. Eksplorowanie kształtu danych
      6. Nauka na podstawie dokumentacji
      7. Wykrywanie, eksplorowanie i rozumienie projektu
    2. Komponowanie danych
      1. Właściwości projektu konsumowania danych
      2. Tradycyjne podejście do kompozycyjności danych
      3. Projekt komponowania danych
    3. Podsumowanie
  22. Rozdział 14. Projektowanie organizowania i obserwowania danych oraz zarządzania nimi
    1. Zarządzanie cyklem życia
      1. Projektowanie zarządzania cyklem życia
      2. Komponenty manifestu produktu danych
    2. Zarządzanie danymi
      1. Projektowanie zarządzania danymi
      2. Normalizacja reguł
        1. Szyfrowanie
        2. Kontrola dostępu i tożsamość
        3. Prywatność i zgoda na przetwarzanie danych osobowych
      3. Integracja danych i reguł
      4. Linkowanie reguł
    3. Obserwowanie, debugowanie i audytowanie
      1. Projektowanie obserwowalności
        1. Obserwowalne dane wyjściowe
        2. Śledzenie między płaszczyzną operacyjną i płaszczyzną danych
        3. Ustrukturyzowane i znormalizowane dane dotyczące obserwowalności
        4. Dziedzinowe dane dotyczące obserwowalności
    4. Podsumowanie
  23. Część V. Od czego zacząć?
    1. Zakres
  24. Rozdział 15. Strategia i wykonywanie
    1. Czy należy przyjąć siatkę danych już dziś?
    2. Siatka danych jako element strategii danych
    3. Framework wykonywania siatki danych
      1. Wykonywanie oparte na biznesie
        1. Korzyści z wykonywania opartego na biznesie
        2. Wyzwania związane z wykonywaniem opartym na biznesie
        3. Wytyczne dotyczące realizacji biznesowej
        4. Przykład wykonywania opartego na biznesie
      2. Wykonywanie kompleksowe i iteracyjne
      3. Wykonywanie ewolucyjne
        1. Model ewolucji wielofazowej
        2. Fazy ewolucji własności dziedzinowej
        3. Dane jako fazy ewolucji produktu
        4. Fazy ewolucji platformy samoobsługowej
        5. Fazy ewolucji sfederowanego zarządzania obliczeniowego
        6. Ewolucja kierowana za pomocą funkcji przystosowania
        7. Funkcje przystosowania dla własności dziedzinowej
        8. Funkcje przystosowania dla danych jako produktu
        9. Funkcje przystosowania dla platformy samoobsługowej
        10. Funkcje przystosowania dla sfederowanego zarządzania obliczeniowego
        11. Migracja ze starszych systemów
        12. Brak scentralizowanej architektury danych współistniejącej z siatką danych, chyba że w okresie przejściowym
        13. Technologie danych scentralizowanych mogą być używane z siatką danych
        14. Obchodzenie jeziora i hurtowni i przechodzenie bezpośrednio do źródła
        15. Używanie hurtowni danych jako konsumującego węzła brzegowego
        16. Migracja z hurtowni lub jeziora w niepodzielnych etapach ewolucji
    4. Podsumowanie
  25. Rozdział 16. Organizacja i kultura
    1. Zmiana
    2. Kultura
      1. Wartości
        1. Za dane analityczne odpowiadają wszyscy
        2. Łączenie danych z pominięciem granic, aby uzyskać wartość
        3. Zadowolenie użytkowników danych
        4. Doceniaj wpływ danych
        5. Budowanie produktów danych dla zmian, trwałości i niezależności
        6. Równoważenie lokalnego udostępniania danych z globalną interoperacyjnością
        7. Wypełnienie luki związanej ze współpracą z danymi za pomocą udostępniania danych w trybie peer-to-peer
        8. Automatyzacja w celu zwiększania szybkości i jakości udostępniania danych
    3. Nagroda
      1. Motywacje wewnętrzne
      2. Motywacje zewnętrzne
    4. Struktura
      1. Założenia struktury organizacyjnej
        1. Topologie zespołów siatki danych
        2. Dziedzinowe zespoły produktów danych jako zespoły dostosowane do strumienia
        3. Zespoły platformy danych jako zespoły platformy
        4. Sfederowane zespoły zarządzające jako zespoły wspomagające
      2. Wykrywanie granic produktów danych
        1. Zacznij od istniejących dziedzin i poddziedzin biznesowych
        2. Produkty danych wymagają długoterminowej własności
        3. Produkty danych muszą mieć niezależne cykle życia
        4. Produkty danych są niezależnie znaczące
        5. Granica produktów danych Złotowłosa strefa
        6. Produkty danych bez użytkowników nie istnieją
    5. Ludzie
      1. Role
        1. Rola właściciela produktu danych
        2. Twórca dziedzinowego produktu danych domeny
        3. Właściciel produktu platformy
        4. Zmiana roli istniejącego działu zarządzania danymi
        5. Zmiana roli dyrektora ds. danych i analiz
      2. Rozwój zestawów umiejętności
        1. Edukacja jest motorem napędowym demokratyzacji
        2. Elastyczne organizacje wymagają elastycznych osób
    6. Proces
      1. Zmiany kluczowych procesów
    7. Podsumowanie
    8. O autorce
    9. Kolofon

Product information

  • Title: Siatka danych
  • Author(s): Zhamak Dehghani
  • Release date: April 2023
  • Publisher(s): Helion
  • ISBN: 9788383220383