hurtownie danych. od przetwarzania analitycznego do raportowania full scan.pdf

(7390 KB) Pobierz
787378793.011.png
Hurtownie danych. Od
przetwarzania analitycznego
do raportowania
Idź do
• Spis treści
• Skorowidz
Autor: Adam Pelikant
ISBN: 978-83-24 6 -2977- 0
Format: 158×235, stron: 400
Katalog książek
Spec od hurtowni danych? Zawsze będzie pilnie potrzebny!
• Jak stworzyć strukturę hurtowni danych i dokonać ich integracji?
• Jak przeprowadzić analizę danych z wykorzystaniem rozszerzenia MDX SQL?
• Do czego potrzebne jest raportowanie?
Idea hurtowni danych ściśle wiąże się z ich kolosalnymi ilościami, gromadzonymi podczas tysięcy
różnych sytuacji – przy dowolnej transakcji, w urzędzie, na lotnisku, w internecie… Nawet nasze
połączenia telefoniczne są przechowywane przez operatora. Te wszystkie dane trzeba gdzieś
pomieścić, sensownie posegregować i zapewnić sobie możliwość sięgnięcia do wybranego ich
zakresu bez długotrwałych poszukiwań. Taką możliwość dają właśnie hurtownie danych –
przemyślane, bardzo pojemne bazy, oferujące zarówno integrację wprowadzanych danych,
jak i znakomite mechanizmy ich przeszukiwania. Jeśli chcesz poszerzyć swoją wiedzę na temat
tworzenia i przeglądania zawartości hurtowni danych, trałeś pod właściwy adres!
Książka „Hurtownie danych. Od przetwarzania analitycznego do raportowania” zawiera materiał
przeznaczony nie tylko dla studentów wydziałów informatycznych, ale także dla pasjonatów tej
tematyki oraz specjalistów zainteresowanych poszerzeniem wiedzy. W możliwie najprostszy,
praktyczny sposób opisano w niej składnię i postać zapytań analitycznych, strukturę hurtowni
danych oraz kwestię ich integracji i wizualnego tworzenia elementów hurtowni. Znajdziesz tu
także omówienie analizy danych z wykorzystaniem rozszerzenia MDX SQL oraz zastosowań
raportowania. Zapoznanie się z tymi informacjami oraz prześledzenie zgromadzonych tu
przykładów pozwoli Ci zrozumieć problemy powstające przy budowie hurtowni danych
i wykorzystać tę wiedzę we własnych projektach.
• Zapytania analityczne
• Struktura hurtowni danych
• Integracja danych
• Wizualne tworzenie elementów hurtowni danych
• Analiza danych z wykorzystaniem rozszerzenia MDX SQL
• Raportowanie
Od bazy do hurtowni danych… Skocz na głęboką wodę!
Twój koszyk
Cennik i informacje
o nowościach
Czytelnia
• Fragmenty książek
online
Kontakt
Helion SA
ul. Kościuszki 1c
44-100 Gliwice
tel. 32 230 98 63
© Helion 1991–2011
787378793.012.png 787378793.013.png 787378793.014.png 787378793.001.png 787378793.002.png 787378793.003.png 787378793.004.png 787378793.005.png 787378793.006.png 787378793.007.png 787378793.008.png 787378793.009.png 787378793.010.png
 
Spis treci
Od autora ......................................................................................... 5
Rozdzia 1. Wstp .............................................................................................. 7
Rozdzia 2. Zapytania analityczne .................................................................... 13
Podstawy skadni ............................................................................................................ 13
Grupowanie w SQL ........................................................................................................ 18
Grupowanie nad oknem logicznym ................................................................................ 28
Operator COMPUTE ...................................................................................................... 32
Funkcje agregujce zdefiniowane przez uytkownika .................................................... 35
Rozdzia 3. Struktura hurtowni danych ............................................................... 43
Rola hurtowni danych w procesie przetwarzania ............................................................ 43
Proces integracji danych ................................................................................................. 46
Elementy hurtowni danych ............................................................................................. 48
Rozdzia 4. Integracja danych .......................................................................... 57
Wprowadzenie do Integration Services .......................................................................... 57
Prosta migracja danych ................................................................................................... 59
Kontener FOR LOOP ..................................................................................................... 72
Kontener FOREACH LOOP .......................................................................................... 83
Sprawdzanie zgodnoci danych ze sownikiem .............................................................. 94
Uruchamianie pakietów integracyjnych ....................................................................... 104
Wykorzystywanie zapyta SQL do migracji danych .................................................... 109
Rozdzia 5. Wizualne tworzenie elementów hurtowni danych ........................... 119
Wstp do Analysis Services .......................................................................................... 119
Tworzenie podstawowej struktury hurtowni danych .................................................... 132
Modyfikacja struktury hurtowni danych ......................................................................... 146
Kostka o strukturze patka niegu ................................................................................. 160
Tworzenie hurtowni danych z zastosowaniem tabel porednich .................................. 163
Definiowanie zaawansowanych elementów kostki ....................................................... 173
Struktura uprawnie do korzystania z hurtowni danych ............................................... 184
Dodatkowe funkcjonalnoci Analysis Services ............................................................ 187
4
Hurtownie danych. Od przetwarzania analitycznego do raportowania
Rozdzia 6. Analiza danych z wykorzystaniem rozszerzenia MDX SQL ............... 203
Podstawy skadni zapyta MDX ................................................................................... 203
Operacje na zbiorach atrybutów ................................................................................... 212
Definiowanie miar ad hoc ............................................................................................. 218
Definiowanie ad hoc zbiorów atrybutów ........................................................................ 225
Zastosowanie wskazania poziomu hierarchii do wyznaczania miar ............................. 230
Wywietlanie wielu poziomów hierarchii .................................................................... 234
Wyznaczanie miar jako wyrae dla rónych elementów i poziomów hierarchii ........ 236
Filtrowanie w zapytaniach MDX .................................................................................. 246
Wyznaczanie przedziaów i zakresów dla wymiarów ................................................... 251
Zastosowanie instrukcji warunkowych ......................................................................... 260
Zastosowanie funkcji agregujcych w zapytaniach MDX ............................................ 262
Definiowanie zoonej struktury dla wymiaru czasu .................................................... 267
Definiowanie operacji na zbiorach atrybutów .............................................................. 270
Funkcje analityczne i statystyczne w MDX .................................................................. 273
Podsumowanie wiadomoci o zapytaniach wybierajcych MDX ................................. 278
Tworzenie i testowanie nietrwaych struktur wielowymiarowych ................................ 287
Rozdzia 7. Raportowanie ............................................................................... 317
Zastosowanie MS Excel do tworzenia raportów dla hurtowni danych ......................... 317
Zastosowanie jzyków wyszego rzdu do tworzenia raportów ................................... 324
Zastosowanie Reporting Services — podstawy ............................................................ 331
Konfigurowanie serwera http dla potrzeb Reporting Services ...................................... 339
Synchronizowanie raportów ......................................................................................... 346
Raporty o strukturze macierzowej ................................................................................ 356
Definiowanie akcji dla raportów ................................................................................... 361
Definiowanie grup hierarchicznych .............................................................................. 365
Raportowanie dla danych pochodzcych z hurtowni .................................................... 369
Rozdzia 8. Podsumowanie.
Co dalej z analitycznym przetwarzaniem danych? .......................... 383
Skorowidz .................................................................................... 387
Rozdzia 4. Integracja danych
109
Wykorzystywanie zapyta SQL
do migracji danych
Na zakoczenie tego rozdziau troch przekornie mona powiedzie, e w zasadzie
omawiane w nim narzdzie nie jest w ogóle potrzebne. Kady „twardy” programista
powie, e prawdziw warto ma tylko takie rozwizanie, w którym widoczny jest
kod. Doda jeszcze, e oprogramowa mona wszystko. Zwolennicy baz danych i ich
rozszerze proceduralnych stwierdz, e niepotrzebne s jzyki wyszego rzdu i e
wystarczy samo rodowisko serwera. Niestety, maj duo racji. Sam wol programowa
ni „klika ikony” czy przeciga je i tworzy „adne obrazki”. Co mona zapropo-
nowa w zamian? Aby zrealizowa przykad konkurencyjnego rozwizania, utwórzmy
dwie tabele: Product , opisujc towary i ich przynaleno do kategorii, przeznaczo-
n na dane docelowe, oraz tabel Blady , opisujc proces kopiowania. Druga z tabel
zawiera „zdublowane” kolumny tabeli docelowej, raz poprzedzone prefiksem Existing ,
a drugi raz New . Midzy tymi grupami wprowadzono znakow kolumn o nazwie
ActionTaken .
CREATE TABLE Product (
PK_Product int PRIMARY KEY,
Product_Name varchar(50),
Category int,
Category_Name varchar(50)
);
GO
CREATE TABLE Blady (
ExistingProduct_PK int,
ExistingProduct_Name nvarchar(50),
ExistingCategory int,
ExistingCategory_Name nvarchar(50),
ActionTaken nvarchar(10),
NewProduct_PK int,
NewProduct_Name nvarchar(50),
NewCategory int,
NewCategory_Name nvarchar(50)
);
Waciw akcj bdzie przepisanie danych pochodzcych z dwóch tabel do tabeli
Product . Zastosowane zostanie polecenie MERGE , a tabela docelowa bdzie opatrzo-
na aliasem Target . Po sowie kluczowym USING zdefiniowano zapytanie wybierajce
kopiowane dane z tabel Towary i Kategorie . Dopuszczalne jest stosowanie wszyst-
kich elementów skadniowych wystpujcych w tego typu zapytaniach.
MERGE Product AS Target
USING (
SELECT IdTowaru, NazwaTowaru, Kategorie.IdKategorii, NazwaKategorii
FROM Towar JOIN Kategorie
ON Towar.IdKategorii=Kategorie.IdKategorii
WHERE IdTowaru<=10
)
Zgłoś jeśli naruszono regulamin