Data Governance – Data Product i Data Mesh

 

Data Mesh i Data Product – innowacyjne podejście do Data Governance 

W świecie, gdzie dane stały się jednym z najcenniejszych zasobów, efektywne zarządzanie nimi to klucz do sukcesu. Jak zmienić chaos danych w uporządkowane, użyteczne informacje? Data Mesh (sieć danych) i Data Governance (ład danych) to nowoczesne podejścia, które nie tylko usprawniają zarządzanie danymi, ale także pomagają firmom w pełni wykorzystać ich potencjał. Dowiedz się, jak Data Products (produkty danych) rewolucjonizują tradycyjne podejście do pracy z informacjami.

Data Governance – czy tylko dla korporacji?

Data Governance – w wolnym tłumaczeniu ład danych kojarzy się bardziej z wielkimi korporacjami i regulacjami niż zwinną firmą Business Intelligence, zamieniającą chaos danych w uporządkowane informacje.

Naturalnym więc jest pytanie: skąd w QBICO zainteresowanie Data Governance?

Data Governance w QBICO – połączenie biznesu i technologii.

QBICO powstało, aby wspierać Organizacje w przetwarzaniu i rozumieniu posiadanych danych. Przez kilkanaście lat realizacji różnych projektów z tego obszaru (hurtownie danych, narzędzia raportowe, systemy billingowe, wdrożenia systemów klasy Business Intelligence itp.) zdaliśmy sobie sprawę, że w przetwarzaniu danych aspekty biznesowe (procesy, właściwa komunikacja, bezpieczeństwo danych, dostępność, zgodność z przepisami itp.) są nie mniej ważne niż technologia. Z naszych doświadczeń wynika, że zastosowanie zasad Data Governance zdecydowanie zwiększa prawdopodobieństwo sukcesu wdrażanych przez nas projektów, a co więcej ułatwia ich bezproblemowe utrzymanie i wieloletni rozwój.

Zmiany w otoczeniu biznesowym i rozwój usług opartych o przetwarzanie danych sprawiają, że wciąż zwiększa się świadomość wartości danych dla organizacji. Ogromne zbiory danych, tworzone przez podmioty gospodarcze, mogą być zarówno błogosławieństwem jak i przekleństwem. Wiele zależy od tego, czy i jak jesteśmy w stanie wykorzystać dane, które wytworzyliśmy lub do których mamy dostęp.

Data Governance w pytaniach i odpowiedziach.

Zanim rozpoczniemy pracę nad projektem, zadajemy klientowi pytania, mające pomóc nam zrozumieć jego sytuację, aby wdrożyć rozwiązania adekwatne do potrzeb.

Przykładowo: 

  • Kto dostarcza dane? 
  • Kto konsumuje dane? 
  • Do czego służy ta tabela? 
  • Skąd biorą się dane na tym wykresie? 
  • Kto używa tego raportu? 
  • Kto musi się zgodzić na zmiany w tym raporcie? 

Często spotykamy się z tym, że wywołują one konsternację i zakłopotanie. Może to wskazywać na to, że obszar wykorzystania i przetwarzania danych pozostaje w dużym stopniu niezabezpieczony, a potencjał w nich drzemiący – niewykorzystany.

Uświadomienie sobie tego, jak ważnym zasobem są dane często sprawia, że Klienci poszukują sposobów na zagospodarowanie tego obszaru. Bazując na swoim doświadczeniu, QBICO proponuje w takiej sytuacji wdrożenie Data Governance – koncepcji zarządzania, maksymalizującej wykorzystanie danych w organizacji.

Data Governance w rozumieniu praktyków z QBICO.

Istnieje wiele mniej lub bardziej skomplikowanych definicji tworzonych przez teoretyków Data Governance. Dla nas jako praktyków najlepiej przemawia propozycja, której autorką jest Laura Madsen, a którą najkrócej można zamknąć w następującej definicji:

Data Governance to sposób zarządzania danymi, który ma realizować 4 podstawowe cele: 

  • Zwiększ wykorzystanie danych 
  • Chroń je 
  • Stale poprawiaj ich jakość 
  • Zapewnij przejrzystość przepływu danych przez organizację (ang. data lineage)

Produkty Danych – nowa era zarządzania informacją. 

Produkt danych rozumiemy jako zbiór komponentów cyfrowych przetwarzających dane analityczne z określonej domeny (obszaru w organizacji) i udostępniający je konsumentom.  

Przykłady produktów danych: 

  • Tabela zawierająca dane o pracownikach, stanowiąca zweryfikowane źródło danych, pochodzących z różnych źródeł.
  • Dashboard menadżerski oferujący przystępne wizualizacje kluczowych wskaźników, będących podstawą podejmowania decyzji operacyjnych i strategicznych.
  • Interfejs danych umożliwiający dostęp do zestawów danych wykorzystywanych na potrzeby różnych aplikacji i systemów. 

Jak widać powyżej produkty danych mogą pełnić dwojaką rolę: być użyteczne samodzielnie lub stanowić składnik innych, bardziej złożonych produktów.

Przykładowo: jedna z wizualizacji dostępnych w dashboardzie menadżerskim może czerpać dane z tabeli o pracownikach. Z kolei dane o pracownikach gromadzone przez tabelę pracowników a zawarte w systemie kadrowo-płacowym mogą być dostępne za pomocą interfejsu danych. 

Przełom w myśleniu związany jest z następującymi aspektami: 

  • Producenci danych i osoby odpowiedzialne za produkt muszą znać konsumentów i ich potrzeby; 
  • Dane przestają być aktywami zamkniętymi w organizacyjnych silosach; 
  • Rola działu IT w przetwarzaniu danych ulega zmniejszeniu; 
  • Producentom i właścicielom musi zależeć na zadowoleniu klientów. Można to osiągnąć kładąc nacisk np. na prostotę, ergonomię, wydajność, bezpieczeństwo oraz monitorowanie i wykrywanie usterek. 

Od produktu danych do Data Mesh

Konsekwencją wprowadzenia pojęcia Produkt danych jest powstanie Data Mesh (sieć danych).

Każdy produkt danych jest traktowany jako niezależny węzeł sieci. Oznacza to, że dane są zdecentralizowane – odpowiedzialność za nie przynależy do domen, a zarządzanie nimi jest realizowane przez dedykowane zespoły. Dzięki temu produkty danych są obsługiwane przez osoby z nimi związane. Wpływa to pozytywnie na skalowalność i elastyczność oraz przyspiesza procesy analityczne i decyzyjne.

Funkcjonowanie produktów w ramach Data Mesh umożliwia ewolucyjne tworzenie kolejnych nowych produktów.

Przykładowo: dane o pracownikach łączone z kilku systemów do produktu danych ‘tabela pracowników’ w domenie HR. Staje się on źródłem danych dla produktu ‘raport rezerwy na niewykorzystane urlopy’ w domenie Controlling. Z kolei ten produkt jest źródłem dla podsumowania w ‘raporcie wykonania budżetu’ funkcjonującego w domenie Zarząd.

To podejście pozwala niemal na składanie różnych elementów z gotowych modułów, zamiast bezpośredniego przetwarzania danych u źródła. W podanym przykładzie, przy tworzeniu ‘raportu wykonania budżetu’, nie musimy sięgać do systemu urlopowego po informacje o niewykorzystanych dniach urlopu ani do systemu płacowego po dane o wynagrodzeniach. Korzystamy z gotowego półproduktu, jakim jest ‘raport rezerwy na niewykorzystane urlopy’. Dzięki temu oszczędzamy czas i mamy pewność, że korzystamy z prawidłowych danych. Dane źródłowe często są przechowywane w specyficznej formie, najlepiej zrozumiałej dla specjalistów w danej dziedzinie. Z punktu widzenia biznesowego, np. nazewnictwo kolumn może być mniej intuicyjne i prowadzić do nieporozumień.

Jak QBICO wdraża Data Governance i Data Mesh?

Wdrożenie Data Mesh i Data Governance dzielimy w praktyce zwykle na 4 etapy:

1. Definicja zakresu i celów

Celem jest inwentaryzacja danych w domenach działalności organizacji.

Efektem prac powinien być rejestr zbiorów danych w podziale na domeny.

Poniżej fragment rejestru dla przykładowej firmy: 

Domena Właściciel biznesowy Zbiory danych Cel gromadzenia i przetwarzania danych Narzędzia do przetwarzania, analizy i wizualizacji
Finanse i Controlling Dział controllingu Przychody i koszty w ujęciu księgowym Analiza bieżących wyników System finansowo-księgowy, Power BI, time tracker
Budżet (plany i wykonania) Weryfikacja planów finansowych
Pracownik HR Wynagrodzenia, urlopy i absencje, oceny okresowe, dane rekrutacyjne Naliczanie wynagrodzeń, planowanie nieobecności, weryfikacja zatrudnienia hrNest, time tracker, SDF, system kadrowo-płacowy
Analiza czasu pracy Weryfikacja i planowanie prac

 

2. Identyfikacja produktów i ról

Celami są:

  • identyfikacja produktów danych; 
  • określenie ról i odpowiedzialności związanych z produktami

Efektem prac powinna być zmiana kultury organizacyjnej w zakresie zarządzania danymi.

Przykładowe produkty danych: 

Pulpit Menedżerski Raport statyczny Raport ad-hoc Model uczenia maszynowego API do eksportu danych
Zbiór pulpitów używanych przez Zarząd Zbiór predefiniowanych raportów z wynikami sprzedaży w ujęciu kwartalnym, miesięcznym itp. Tabela przestawna w Excelu z wynikami audytów bezpieczeństwa w przedsiębiorstwie Model przewidujący odejście klienta na postawie interakcji z Biurem Obsługi Klienta Moduł programistyczny udostępniający stany magazynowe zewnętrznym aplikacjom klienckim.

 

Przykładowe role występujące w produktach opartych o dane:

Właściciel produktu Konsument Producent danych Data product developer Data custodian
Osoba odpowiedzialna za dane i powstały z nich produkt Osoba korzystająca z danych dostępnych w produkcie Osoba odpowiedzialna za zasilanie produktu danymi Osoba odpowiedzialna za wytworzenie produktu Przedstawiciel IT odpowiedzialny za administrowanie i utrzymanie danych i produktu, który z nich powstał

 

3. Definicje i procedury 

Celami są:

  • Definicja cyklu życia produktu uwzględniająca również wdrażanie nowego produktu; 
  • Określenie interakcji pomiędzy rolami zdefiniowanymi w poprzednim etapie; 
  • Inwentaryzacja infrastruktury i procedur, weryfikacja czy odpowiadają podejściu produktowemu i jakie ewentualne zmiany należy wprowadzić. 

Efektem pracy powinna być gotowość do wdrażania produktów danych. 

Przykładowa macierz interakcji (RACI)* pomiędzy rolami zdefiniowanymi w etapie 2: 

Właściciel produktu Konsument Producent danych Data product developer Data custodian
Zdefiniowanie nowych wymagań biznesowych A C C I I
Zdefiniowanie nowych wymagań technicznych A C C I R
Zmiana modelu danych A I C R C
Zmiana źródeł danych A I C C C
Skierowanie zmian do realizacji A C C I I
Testowanie nowej wersji produktu A R C I I
Wdrażanie nowej wersji produktu A I I I R

*Macierz interakcji (RACI)
Narzędzie przydatne w określaniu poziomu odpowiedzialności i ról w zespołach projektowych. Zwykle ma postać tabeli, w której nagłówki określają osoby lub role, natomiast w pierwszej kolumnie znajduje się lista zadań.
Zawartość komórki znajdującej się na przecięciu osoba/rola i zadanie określa rolę danej osoby przy realizacji wskazanego zadania.
Do wyboru są:

R (responsible) – osoba bezpośrednio odpowiedzialna za zadanie. Wskazane jest, aby dla każdego zadania była tylko jedna osoba z tą rolą.
A (accountable) – osoba nadzorująca prace, niekoniecznie wykonawca. Zwykle jest to kierownik projektu lub przełożony wyższego szczebla, odpowiedzialny za zatwierdzenie prac. Wskazane jest, aby dla każdego zadania była jedna osoba z tą rolą. 
C (consulted) – kontrybutor, osoba dokonująca przeglądu i zatwierdzająca pracę przed jej dostarczeniem. W każdym zadaniu może być więcej niż jeden kontrybutor. 
I (informed) – osoba informowana o postępie prac lub ich zakończeniu. Dla każdego zadania może być przypisane więcej niż jedna osoba z tą rolą.

4. Automatyzacja i usprawnianie

Celami są:

  • Definicja metryk użycia; 
  • Definicja metryk dotyczących jakości. 

Efektem pracy powinien być w pełni wdrożony Data Governance. 

Poniżej przykładowe metryki użycia produktów danych: 

Nazwa Opis
Uruchomienia Liczba uruchomień w okresie
Użytkownicy Liczba unikalnych użytkowników
Sesja Średni czas trwania sesji
Rekordy Liczba dodanych rekordów
Czas Czas generowania raportu rocznego
Źródła Liczba źródeł danych

 

Przykładowe metryki jakości danych:

Nazwa Opis
Poprawność Współczynnik błędu=liczba wykrytych błędów/liczba uruchomionych testów automatycznych
Kompletność Kompletność kolumn = liczba rekordów z kolumnami null / liczba rekordów
Spójność Spójność = liczba niespójnych rekordów / liczba rekordów
Unikalność Unikalność = liczba unikalnych rekordów / liczba rekordów

 

Automatyzacja – klucz do ciągłej poprawy

Automatyzacja monitorowania użycia produktów i jakości danych ułatwia wyciąganie wniosków dotyczących użyteczności i wiarygodności.

Również w tym obszarze QBICO wspiera Klientów tworząc intuicyjne narzędzia do raportowania oparte o hurtownie danych i Power BI. Dzięki temu możliwe są dalsze usprawnienia i ciągła poprawa wykorzystania danych w praktyce.

Podsumowanie

Data Governance, Data Mesh i Data Product to koncepcje odbiegające od tradycyjnego rozumienia obsługi i wykorzystania danych w organizacji. Zmiana podejścia pozwala jednak na pełne wykorzystanie potencjału drzemiącego w danych, co zwykle skutkuje możliwością szybszego podejmowania trafnych decyzji biznesowych. 

Ułożenie procesu i wdrożenie Data Governance nie należy do łatwych zadań, ale korzyści z jego funkcjonowania są nie do przecenienia. Projekty z tym związane zwykle wymagają zaangażowania wielu działów organizacji. W związku z tym wskazane jest, aby zarządzający projektem miał doświadczenie i spójną wizję celu zrozumiałego dla wszystkich domen.

Na Państwa życzenie QBICO podejmie się tego zadania, wykorzystując dotychczasowe doświadczenie i dostosowując się do Państwa potrzeb.

Autor wpisu: Michał Domaraczenko