Sakte Endre Dimensjoner (SCD) – Types | Data Warehouse

posted in: Articles | 0

Sakte Skiftende Mål: Sakte skiftende mål er mål som data endres sakte, snarere enn å endre regelmessig på en tid basis.
du kan For eksempel ha en kunde dimensjon i en detaljhandel domene. La oss si at kunden er i India og hver måned han gjør litt shopping. Nå skaper salg rapport for kunder er enkel. Anta nå at kunden er overført til Usa, og han gjør shopping der. Hvordan å spille inn en slik endring i din kunde dimensjon?,
Du kan summen eller gjennomsnittet salg gjort av kunder. I dette tilfellet vil du ikke få nøyaktig sammenligning av alle salg gjort av kunder. Som kunde lønn er økt etter overføringen, han/hun kan gjøre mer shopping i Usa i forhold til i India. Hvis du summerer det totale salget, da salg gjort av kunden kan se sterkere, selv om det er bra. Du kan opprette en annen kunde ta opp og behandle de overførte kunden som ny kunde. Imidlertid vil dette skape problemer for.,
Håndtering av disse problemene innebærer SCD management metoder som referert til som Type 1 til Type 3. De ulike typer sakte skiftende mål er forklart i detalj nedenfor.
SCD Type 1: SCD type 1-metodikk brukes når det ikke er behov for å lagre historiske data i dimensjon bord. Denne metoden overskriver den gamle data i dimensjon tabell med de nye dataene. Den brukes til å rette feil i dimensjon.
Som et eksempel, jeg har kunden tabellen nedenfor data.

surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marspton Illions

Her kundens navn er feilstavede., Det bør være Marston i stedet for Marspton. Hvis du bruker type1 metode, er det bare rett og slett overskriver data. Dataene i den oppdaterte tabellen vil bli.

surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marston Illions

fordel av type1 er enkelt vedlikehold og mindre plass okkupert. Ulempen er at det ikke finnes historiske data holdt i data warehouse.
SCD-Type 3: I type 3 metode, bare gjeldende status og tidligere status på rad er opprettholdt i tabellen. For å spore disse endringene to separate kolonner er opprettet i tabellen., Kunden dimensjon bord i type 3 metode vil se ut som

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Illions NULL 

La oss si, kunden beveger seg fra Illions til Seattle og den oppdaterte tabellen vil se ut som

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Seattle Illions

Nå igjen dersom kunden flytter fra seattle til new york, så den oppdaterte tabellen vil være

surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston NewYork Seattle

Den type 3 metode vil ha begrenset historie, og det avhenger av antall kolonner du vil opprette.
SCD Type 2: SCD type 2 butikker hele historien data i dimensjon bord. Med type 2 vi kan lagre ubegrenset historie i dimensjon bord., I type 2, kan du lagre dataene i tre forskjellige måter. De er

  • Versjonskontroll
  • Flagging
  • Effektiv Dato

SCD Type 2 Versjonskontroll: I versjonskontroll metode, en sekvens nummer som brukes til å representere endre. Den siste sekvensen antall alltid representerer den aktuelle raden og den forrige sekvensen tallene representerer den tidligere data.
Som et eksempel, la oss bruke samme eksempel på en kunde som endrer plassering. I utgangspunktet kunden er i Illions beliggenhet og data dimensjon i tabellen vil se ut som.,

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 1

kunden beveger seg fra Illions til Seattle og versjonsnummeret vil økes. Dimensjonen tabellen vil se ut som

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 12 1 Marston Seattle 2

Nå igjen dersom kunden er flyttet til et annet sted, en ny rekord vil bli satt inn i den dimensjon bord med neste versjon nummeret.
SCD Type 2 Flagging: I flagging metode, et flagg kolonnen er opprettet i dimensjon bord. Den nåværende rekorden vil ha flagget verdi som 1 og tidligere rekorder vil ha flagget som 0.
Nå for første gang, kunden dimensjon vil se ut som.,

surrogate_key customer_id customer_name Location flag--------------------------------------------------------1 1 Marston Illions 1

Nå når kunden flytter til et nytt sted, den gamle poster vil bli oppdatert med flagg verdien til 0, og den siste posten vil ha flagget verdi som 1.

surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 02 1 Marston Seattle 1

SCD Type 2 ikrafttredelse: I Effektiv Dato metode, den perioden endringen er sporet ved hjelp av start_date og end_date kolonner i dimensjon bord.
NULL i End_Date angir den gjeldende versjonen av dataene og de øvrige postene tyder på tidligere data.,
Anbefalt Lesing:
SCD type 4 – Raskt voksende dimensjon
Data Warehouse Dimensjonal Modellering (Typer av Skjemaer)
Typer Fakta i Data Warehouse
Typer Dimensjoner i data warehouse
Logiske og Fysiske Utformingen av Data Warehouse
Hvis du liker denne artikkelen, så vær så snill å dele det, eller klikk på google +1-knappen.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *