Pomalu se Měnící Rozměry (SCD) – Typy | Data Warehouse

posted in: Articles | 0

Pomalu Mění Rozměry: Pomalu mění rozměry jsou rozměry, ve kterých se data změní pomalu, spíše než měnit pravidelně na základě času.
například můžete mít zákaznický rozměr v maloobchodní doméně. Řekněme, že zákazník je v Indii a každý měsíc dělá nějaké nákupy. Nyní je vytvoření zprávy o prodeji pro zákazníky snadné. Nyní předpokládejme, že zákazník je převeden do Spojených států a nakupuje tam. Jak zaznamenat takovou změnu v dimenzi zákazníka?,
můžete sčítat nebo průměr prodeje provedené zákazníky. V tomto případě nebudete mít přesné srovnání prodeje provedené zákazníky. Vzhledem k tomu, plat zákazníka se zvyšuje po převodu, on/ona by mohla dělat více nakupování ve Spojených státech ve srovnání s v Indii. Pokud sečtete celkový prodej, pak prodej provedený zákazníkem může vypadat silněji, i když je dobrý. Můžete vytvořit druhý zákaznický záznam a zacházet s převedeným zákazníkem jako s novým zákazníkem. To však také způsobí problémy.,
řešení těchto problémů zahrnuje metodiky řízení SCD, které se označují jako typ 1 až typ 3. Různé typy pomalu se měnících rozměrů jsou podrobně vysvětleny níže.
SCD Type 1: metodika SCD type 1 se používá, když není třeba ukládat Historická data do tabulky dimenzí. Tato metoda přepíše stará data v tabulce dimenzí novými daty. Používá se k opravě chyb dat v dimenzi.
jako příklad mám zákaznickou tabulku s níže uvedenými údaji.

surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marspton Illions

zde je název zákazníka nesprávně napsán., Měl by to být Marston místo Marsptona. Pokud používáte metodu type1, jednoduše přepíše data. Údaje v aktualizované tabulce budou.

surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marston Illions

výhodou type1 je snadná údržba a méně místa. Nevýhodou je, že v datovém skladu nejsou uchovávány žádné historické údaje.
SCD typ 3: v metodě typu 3 je v tabulce zachován pouze aktuální stav a předchozí stav řádku. Pro sledování těchto změn jsou v tabulce vytvořeny dva samostatné sloupce., Zákazník rozměr stolu v typ 3 metoda bude vypadat jako

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Illions NULL 

řekněme, zákazník se pohybuje od Miliardy do Seattlu a aktualizovaná tabulka bude vypadat jako

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Seattle Illions

Nyní znovu, pokud se zákazník přestěhuje ze seattlu do new yorku, pak aktualizované tabulky budou

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston NewYork Seattle

typ 3 metoda bude mít omezenou historii a to závisí na počtu sloupců, které vytvoříte.
SCD Type 2: SCD type 2 ukládá celou historii dat v tabulce rozměrů. S typem 2 můžeme v tabulce rozměrů ukládat neomezenou historii., V typu 2 můžete data ukládat třemi různými způsoby. Jsou

  • Versioning
  • Flagging
  • datum účinnosti

Scd Type 2 Versioning: v metodě verzování se pro změnu používá pořadové číslo. Poslední pořadové číslo vždy představuje aktuální řádek a předchozí pořadová čísla představují minulá data.
jako příklad použijeme stejný příklad zákazníka, který změní umístění. Zpočátku je Zákazník v poloze Illions a data v tabulce dimension budou vypadat jako.,

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 1

zákazník se pohybuje od Miliardy do Seattlu a číslo verze se zvýší. Tabulka rozměrů bude vypadat jako

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 12 1 Marston Seattle 2

pokud je zákazník přesunut na jiné místo, bude do tabulky dimenzí vložen nový záznam s dalším číslem verze.
Scd Type 2 Flagging: v metodě flagging je v tabulce dimension vytvořen sloupec flag. Aktuální záznam bude mít hodnotu vlajky jako 1 a předchozí záznamy budou mít vlajku jako 0.
nyní poprvé bude rozměr zákazníka vypadat jako.,

surrogate_key customer_id customer_name Location flag--------------------------------------------------------1 1 Marston Illions 1

Nyní, když se zákazník přesune na nové místo, budou staré záznamy aktualizovány s hodnotou vlajky jako 0 a nejnovější záznam bude mít hodnotu vlajky jako 1.

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 02 1 Marston Seattle 1

SCD Typu 2 Datum účinnosti: Datum účinnosti metody, období změna je sledována pomocí začátek a end_date sloupce v tabulce dimenze.
NULL v End_Date označuje aktuální verzi dat a zbývající záznamy ukazují poslední data.,
Doporučená literatura:
SCD typ 4 – Rychle rostoucí rozměr
Datový Sklad Dimenzionální Modelování (Typy Schémat)
Typy Faktů v datovém Skladu
Typy Dimenze v datovém skladu
Logický a Fyzický Návrh Datového Skladu
Pokud se vám líbí tento článek, pak prosím sdílet nebo klepněte na tlačítko google +1.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *