powoli zmieniające się Wymiary: powoli zmieniające się wymiary są wymiarami, w których dane zmieniają się powoli, a nie regularnie w czasie.
na przykład możesz mieć wymiar klienta w domenie detalicznej. Powiedzmy, że klient jest w Indiach i co miesiąc robi zakupy. Teraz tworzenie raportu sprzedaży dla klientów jest łatwe. Teraz Załóżmy, że klient jest przenoszony do Stanów Zjednoczonych i robi tam zakupy. Jak zarejestrować taką zmianę w wymiarze klienta?,
można zsumować lub uśrednić sprzedaż dokonaną przez klientów. W takim przypadku nie otrzymasz dokładnego porównania sprzedaży dokonanej przez klientów. Ponieważ wynagrodzenie klienta wzrasta po transferze, może on / ona zrobić więcej zakupów w Stanach Zjednoczonych w porównaniu do Indii. Jeśli zsumujesz całkowitą sprzedaż, sprzedaż dokonana przez Klienta może wyglądać silniej, nawet jeśli jest dobra. Możesz utworzyć drugi rekord klienta i traktować przeniesionego klienta jako nowego klienta. Jednak to również stworzy problemy.,
rozwiązywanie tych problemów wiąże się z metodologią zarządzania SCD, określaną jako typ 1 do typu 3. Różne rodzaje powoli zmieniających się wymiarów zostały szczegółowo wyjaśnione poniżej.
SCD Typ 1: metodologia SCD typ 1 jest stosowana, gdy nie ma potrzeby przechowywania danych historycznych w tabeli wymiarów. Metoda ta nadpisuje stare dane w tabeli wymiarów nowymi danymi. Służy do korygowania błędów danych w wymiarze.
jako przykład mam tabelę klientów z poniższymi danymi.
surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marspton Illions
tutaj nazwa klienta jest błędnie zapisana., To powinien być Marston zamiast Marspton. Jeśli używasz metody type1, po prostu nadpisuje dane. Dane w zaktualizowanej tabeli będą.
surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marston Illions
zaletą type1 jest łatwość konserwacji i mniej zajmowanego miejsca. Wadą jest brak danych historycznych przechowywanych w hurtowni danych.
SCD Typ 3: w metodzie typ 3 w tabeli utrzymywany jest tylko bieżący i poprzedni stan wiersza. Aby śledzić te zmiany, w tabeli tworzone są dwie oddzielne kolumny., Tabela wymiarów klienta w metodzie type 3 będzie wyglądać następująco:
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Illions NULL
powiedzmy, że klient przenosi się z Illions do Seattle, a zaktualizowana tabela będzie wyglądać następująco:
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Seattle Illions
Teraz ponownie jeśli klient przeniesie się z seattle do NewYork, zaktualizowana tabela będzie
iv id=”d217564e04″
metoda Type 3 będzie miała ograniczoną historię i zależy od liczby utworzonych kolumn.
SCD Typ 2: SCD typ 2 przechowuje całą historię danych w tabeli wymiarów. Dzięki type 2 możemy przechowywać nieograniczoną historię w tabeli wymiarów., W type 2 można przechowywać dane na trzy różne sposoby. Są one
- wersjonowanie
- oznaczanie
- data wejścia w życie
wersjonowanie SCD typu 2: w metodzie wersjonowania, numer sekwencji jest używany do reprezentowania zmiany. Najnowszy numer sekwencji zawsze reprezentuje bieżący wiersz, a poprzednie numery sekwencji reprezentuje poprzednie dane.
jako przykład użyjmy tego samego przykładu klienta, który zmienia lokalizację. Początkowo klient znajduje się w lokalizacji Illions, a dane w tabeli wymiarów będą wyglądały tak.,
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 1
klient przenosi się z Illions do Seattle, a Numer wersji zostanie zwiększony. Tabela wymiarów będzie wyglądać następująco:
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 12 1 Marston Seattle 2
jeśli Klient zostanie przeniesiony do innej lokalizacji, do tabeli wymiarów zostanie wstawiony nowy rekord z następnym numerem wersji.
znaczniki typu SCD 2: w metodzie znaczników tworzona jest kolumna znaczników w tabeli wymiarów. Bieżący rekord będzie miał wartość flagi jako 1, A poprzednie rekordy będą miały flagę jako 0.
Teraz po raz pierwszy wymiar klienta będzie wyglądał tak.,
surrogate_key customer_id customer_name Location flag--------------------------------------------------------1 1 Marston Illions 1
Teraz, gdy klient przeniesie się do nowej lokalizacji, stare rekordy zostaną zaktualizowane o wartość flagi jako 0, a najnowszy rekord będzie miał wartość flagi jako 1.
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 02 1 Marston Seattle 1
SCD Typ 2 Data wejścia w życie: w metodzie Data wejścia w życie okres zmiany jest śledzony za pomocą kolumn start_date i end_date w tabeli wymiarów.
NULL w End_Date wskazuje bieżącą wersję danych, a pozostałe rekordy wskazują dane z przeszłości.,
zalecane Czytanie:
Typ SCD 4-szybko rosnący wymiar
Modelowanie wymiarowe hurtowni danych (typy schematów)
typy faktów w hurtowni danych
typy wymiarów w hurtowni danych
logiczne i fizyczne projektowanie hurtowni danych
Jeśli podoba ci się ten artykuł, udostępnij go lub kliknij przycisk google +1.
Dodaj komentarz