Jak uniknąć błędów zaczynając przygodę z IBM Db2 BLU
Cel prezentacji:
Przedstawienie uczestnikom konferencji podstawowych błędów i zagadnień związanych z rozpoczęciem korzystania i implementacji Db2 BLU w systemach typu OLAP/Warehouse oraz podstawowych błędów popełnianych w trakcie tworzenia i użytkowania Db2 BLU.
W trakcie prezentacji przedstawię podstawowe zagadnienia związane z użytkowaniem Db2 BLU w systemach analitycznych. Wskażę doświadczenia w kwestii poszukiwania błędów na wszystkich etapach przejmowania aktualnie istniejących systemów analitycznych i naprawiania błędów odziedziczonych po twórcach systemu.
Etapy prezentacji:
I. Wstęp:
1. Powitanie i przedstawienie prezentera oraz dotychczasowego doświadczenia z Db2.
2. Opis środowiska na którym działa Db2 BLU i na podstawie którego powstała prezentacja.
II. Podstawowa teoria:
1. Krótkie wprowadzenie do systemów typu Warehouse
Czym charakteryzują się systemy typu OLAP, czym różnią się od OLTP i jakie jest ich przeznaczenie.
2. Krótkie wprowadzenie do Db2 BLU i tabel kolumnowych
Czym są tabele kolumnowe, czym różnią się od tabel wierszowych i krótka charakterystyka Db2 BLU.
III. Część główna:
1. Intra-Parallel – czy jest i na jakim poziomie jest definiowany. Jak weryfikować gdy wygląda, że go nie ma.
2. Kompresja – jak działa, czy naprawdę jest i jak weryfikować jej skuteczność, co robić aby ją poprawić.
3. Sortowanie danych – dlaczego warto to robić.
4. Null vs not null – wpływ na performance definicji kolumn dopuszczających null.
5. Tabele kolumnowe i wierszowe – dlaczego nie wszystko warto wrzucać w tabele kolumnowe – update/insert w BLU (upsert).
6. Tablespace – dlaczego nie warto trzymać wszystkich tabel w jednym tablespace
7. Ograniczenia tabel kolumnowych – zwłaszcza w zarządzaniu i operacje jakich już nie możemy na nich robić.
8. Automatyczne Reorgi i runstaty – dlaczego nie warto ich wyłączać i parę słów o profilach statystyk w BLU.
9. Tabele tymczasowe – dlaczego dobrze pamiętać o CGTT.
10. Wersja Db2 – dlaczego aktualizacje Db2 są ważne – paralel insert i jego wpływ na funkcjonowanie bazy BLU.
11. ETL – dlaczego warto część operacji na danych wykonać poza bazą – weryfikacja jakości danych oraz usuwania znaków narodowych.
12. Użycie Truncate zamiast delete
13. Użycie Load zamiast insert
14. Rozdzielenie workload wg typu – dlaczego jest ważne.
15. Indeksy – czy warto je stosować w tabelach kolumnowych?
IV. Zakończenie
Podsumowanie i lista „best practice” wynikająca z prezentacji.
V. Questions and answers
VI. Bibligrafia
Languages : Polski Session Category : Warszawa 2019