Langsomt skiftende dimensioner ( SCD) – typer | data Warehousearehouse

posted in: Articles | 0

langsomt skiftende dimensioner: langsomt skiftende dimensioner er de dimensioner, hvor dataene ændres langsomt, snarere end at ændre regelmæssigt på tidsbasis.
for eksempel kan du have en kundedimension i et detaildomæne. Lad os sige, at kunden er i Indien, og hver måned handler han. Nu er det nemt at oprette salgsrapporten for kunderne. Antag nu, at kunden overføres til USA, og han handler der. Sådan registreres en sådan ændring i din kundedimension?,
Du kan opsummere eller gennemsnit salget udført af kunderne. I dette tilfælde får du ikke den nøjagtige sammenligning af salget udført af kunderne. Da kundelønnen øges efter overførslen, kan han/hun gøre mere shopping i USA sammenlignet med i Indien. Hvis du opsummerer det samlede salg, kan det salg, som kunden foretager, se stærkere ud, selvom det er godt. Du kan oprette en anden kundepost og behandle den overførte kunde som den nye kunde. Men dette vil også skabe problemer.,
håndtering af disse problemer involverer SCD-styringsmetoder, der benævnes Type 1 til type 3. De forskellige typer langsomt skiftende dimensioner forklares detaljeret nedenfor.
SCD type 1: SCD type 1 metode anvendes, når der ikke er behov for at gemme Historiske data i dimensionstabellen. Denne metode overskriver de gamle data i dimensionstabellen med de nye data. Det bruges til at rette datafejl i dimensionen.
som et eksempel har jeg kundetabellen med nedenstående data.

surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marspton Illions

her er kundenavnet stavet forkert., Det burde være Marston i stedet for Marspton. Hvis du bruger type1-metoden, overskriver den simpelthen dataene. Dataene i den opdaterede tabel vil være.

surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marston Illions

fordelen ved type1 er let vedligeholdelse og mindre plads besat. Ulempen er, at der ikke er nogen Historiske data, der opbevares i datalageret.
SCD type 3: I type 3-metoden opretholdes kun den aktuelle status og den tidligere status for rækken i tabellen. For at spore disse ændringer oprettes to separate kolonner i tabellen., Kunden dimension i tabellen i den type 3 metode vil se som

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Illions NULL 

Lad os sige, at kunden flytter fra Illions til Seattle, og de opdateres tabellen vil se ud som

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Seattle Illions

Nu igen hvis kunden flytter fra seattle til NewYork, så er den opdateret bordet vil være

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston NewYork Seattle

type 3 metode vil have en begrænset historie, og det afhænger af antallet af kolonner, som du opretter.
SCD type 2: SCD type 2 gemmer hele historikken dataene i dimensionstabellen. Med type 2 kan vi gemme ubegrænset historie i dimensionstabellen., I type 2 kan du gemme dataene på tre forskellige måder. De er

  • Versionering
  • Markering
  • Dato

SCD Type 2-Versionering: I versionering metode, en sekvens nummer, der anvendes til at repræsentere den forandring. Det seneste sekvensnummer repræsenterer altid den aktuelle række, og de foregående sekvensnumre repræsenterer de tidligere data.
Lad os som eksempel bruge det samme eksempel på kunde, der ændrer placeringen. Oprindeligt er kunden i Illions placering, og dataene i dimensionstabellen vil se ud som.,

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 1

kunden flytter fra Illions til Seattle, og versionsnummeret øges. Dimensionstabellen vil se ud som

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 12 1 Marston Seattle 2

nu igen Hvis kunden flyttes til et andet sted, indsættes en ny post i dimensionstabellen med det næste versionsnummer.
SCD type 2-markering: i markeringsmetode oprettes en flagkolonne i dimensionstabellen. Den aktuelle post vil have flagværdien som 1 og de tidligere poster vil have flag som 0.
nu for første gang vil kundedimensionen se ud som.,

surrogate_key customer_id customer_name Location flag--------------------------------------------------------1 1 Marston Illions 1

nu, når kunden flytter til en ny placering, opdateres de gamle poster med flagværdi som 0, og den seneste post har flagværdien som 1.

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 02 1 Marston Seattle 1

SCD type 2 ikrafttrædelsesdato: i effektiv Datometode spores perioden for ændringen ved hjælp af kolonner start_date og end_date i dimensionstabellen.
NULL i End_Date angiver den aktuelle version af dataene, og de resterende poster angiver de tidligere data.,
Anbefalet Læsning:
SCD type 4 – Hurtigt voksende dimension
datawarehouse, Dimensionelle Modeller (Typer af Skemaer)
Former for Fakta i Data Warehouse
Typer af Dimensioner i data warehouse
Logisk og Fysisk Design af Data Warehouse
Hvis du kan lide denne artikel, så kan du dele den, eller klik på google +1 knappen.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *