Narzędzia OLAP w Business Intelligence – wykorzystanie Apache Superset

monotype.pl

Narzędzia OLAP w Business Intelligence – wykorzystanie Apache Superset

Jeśli zapytasz CTO dowolnej organizacji jakie zestawy danych, pochodzących z działania firmy, powinny być zbierane, odpowiedzią będzie — wszystkie, natomiast na pytanie, które dane powinny zostać usunięte, odpowiedzią będzie — żadne. Dlaczego? Ponieważ określenie potencjalnej wartości danych jest trudne, dane, które zostaną usunięte, mogą okazać się wyjątkowo cenne dla przyszłych koncepcji marketingowych / rozwojowych firmy.

Informację generowane przez rozwiązania i technologie w firmie mają wartość marketingową, dane te mogą również posłużyć do utworzenia bazy wiedzy dla uczenia maszynowego.

Największe współczesne organizacje generują nawet powyżej 5 petabajtów miesięcznie, czyli tyle ile zajmowałoby 320 Wikipedii. 

Przy takiej ilości danych pojawia się trudność w zarządzaniu nimi. Na przeciw wychodzą tutaj techniki takie jak Event Sourcing i segregacja odpowiedzialności za polecenia (CQRS), oraz zaawansowane narzędzie służące do przetwarzania danych takie jak Apache Kafka ( używany m.in. przez Netflix, Airbnb, Cisco i Adobe).

Tradycyjne raportowanie w systemach IT

W porządku, wiesz już, że duże organizacje muszą zarządzać ogromną ilością danych, teraz czas skupić się na mniejszych graczach.

W mniejszych organizacjach, gdy ilość informacji zaczyna wzrastać, dodawanie nowych raportów do statycznego systemu BI w panelu administratora, staje się kosztowne i powolne.

Często spotykam się z tym, że podczas rozpoczęcia budowania MVP dla klienta, tworzy się dwa, trzy stałe raporty, które są przejrzyste i oczywiste dla klienta, ale tylko na początku.

Wraz ze wzrostem ilości danych w systemie, zwłaszcza danych, pochodzących z różnych źródeł (np. zachowanie użytkowników na stronie, dane od partnerów klienta, dane dotyczące działań marketingowych), liczba potrzebnych do analizy danych raportów rośnie wykładniczo.

Czas potrzebny na zarządzanie tymi danymi również wzrasta, spowalniając działanie firmy.

Można powiedzieć, że jest to moment, w którym należy zrezygnować z tradycyjnego podejścia do magazynowania danych i tworzenia raportów, a należy sięgnąć po nowoczesne, bardziej efektywne narzędzia.

Czym jest OLAP?

OLAP (Online Analytical Processing) to programy umożliwiające analizę i wizualizację danych z różnych źródeł i o różnych formatach.

OLAP może pracować z danymi na oddzielnych serwerach, w sposób niewpływający znacząco na system. Może wykonywać zlecone mu zadania w czasie rzeczywistym, prezentując wyniki (np. liczbę aktualnie otwartych koszyków w sklepie internetowym) w postaci przyjaznej wartości na pulpicie.

Zalety OLAP:

  • nie musisz budować każdego raportu osobno,
  • nie musisz samemu budować funkcjonalności w systemie,
  • narzędzia OLAP mogą pracować na tym samym zestawie danych, co system podstawowy.

Czym jest Apache Superset?

Apache Superset to nowoczesna aplikacja internetowa, służąca do analizy danych biznesowych, zaliczana do grupy narzędzi OLAP.

Apache Superset przeznaczony jest do interaktywnego eksplorowania danych biznesowych. Początkowo stworzony do wysyłania zapytań do Druida, obecnie obsługuje szeroki zakres baz danych SQL i NoSQL.

Posiada prostą warstwę semantyczną, która umożliwia użytkownikom kontrolę  prezentacji danych w interfejsie, użytkownik może określić, które pola mają pojawiać się, w którym rozwijanym menu oraz które dane udostępnione są konkretnemu użytkownikowi.

Apache Superset ma rozbudowany system wizualizacji danych, dostępny dla użytkowników poprzez prosty interfejs aplikacji. Użytkownicy mogą tworzyć wizualizację wyników zapytań w postaci wykresów, map, map ciepła oraz tabel przestawnych.

Zalety Apache Superset: 

  • redukcja kosztów tworzenia tradycyjnych raportów PDF,
  • zwiększone możliwości łączenia wielu źródeł danych w jeden raport,
  • pozwala tworzyć raporty samodzielnie, lub przekazać to zadanie pracownikom,
  • nie wymaga pracy programistów.

Użytkownicy mogą tworzyć wizualizację wycinków danych, które składają się z wielu slajdów, a następnie mogą wyświetlać je w pulpitach nawigacyjnych.

Mój oryginalny wpis w języku angielskim znajdziecie pod tym linkiem.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *