langzaam veranderende dimensies: langzaam veranderende dimensies zijn de dimensies waarin de gegevens langzaam veranderen, in plaats van regelmatig te veranderen op tijd basis.
bijvoorbeeld, u kunt een klantendimensie hebben in een retaildomein. Laten we zeggen dat de klant is in India en elke maand doet hij wat winkelen. Nu het maken van de verkoop rapport voor de klanten is eenvoudig. Neem nu aan dat de klant wordt overgebracht naar de Verenigde Staten en hij doet winkelen daar. Hoe een dergelijke verandering in uw klantdimensie vast te leggen?,
U kunt de omzet van de klanten optellen of gemiddeld berekenen. In dit geval krijgt u niet de exacte vergelijking van de verkoop gedaan door de klanten. Als de klant salaris wordt verhoogd na de overdracht, hij/zij zou kunnen doen meer winkelen in de Verenigde Staten in vergelijking met in India. Als u de som van de totale verkoop, dan is de verkoop gedaan door de klant sterker zou kunnen kijken, zelfs als het goed is. U kunt een tweede klantrecord aanmaken en de overgedragen klant behandelen als de nieuwe klant. Maar dit zal ook problemen veroorzaken.,
bij de behandeling van deze problemen worden SCD-beheersmethoden gebruikt die Type 1 tot Type 3 worden genoemd. De verschillende typen langzaam veranderende dimensies worden hieronder in detail uitgelegd.
SCD type 1: SCD type 1-methodologie wordt gebruikt wanneer het niet nodig is Historische gegevens in de dimensietabel op te slaan. Deze methode overschrijft de oude gegevens in de dimensietabel met de nieuwe gegevens. Het wordt gebruikt om gegevensfouten in de dimensie te corrigeren.
als voorbeeld heb ik de klantentabel met onderstaande gegevens.
surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marspton Illions
hier wordt de naam van de klant verkeerd gespeld., Het zou Marston moeten zijn in plaats van Marspton. Als u type1 methode gebruikt, overschrijft het gewoon de gegevens. De gegevens in de bijgewerkte tabel worden.
surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marston Illions
het voordeel van type1 is onderhoudsgemak en minder ruimte. Het nadeel is dat er geen Historische gegevens worden bewaard in het datawarehouse.
SCD type 3: In de methode type 3 wordt alleen de huidige status en de vorige status van de rij behouden in de tabel. Om deze wijzigingen bij te houden worden in de tabel twee afzonderlijke kolommen gemaakt., De klantdimensie tabel in de type 3 Methode ziet er als
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Illions NULL
laten we zeggen, de klant verhuist van Illions naar Seattle en de bijgewerkte tabel ziet er als
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Seattle Illions
nu opnieuw als de klant verhuist van seattle naar New York, dan is de bijgewerkte tabel
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston NewYork Seattle
de methode type 3 heeft een beperkte geschiedenis en is afhankelijk van het aantal kolommen dat u maakt.
SCD type 2: SCD type 2 slaat de volledige geschiedenis van de gegevens op in de dimensietabel. Met type 2 kunnen we onbeperkte geschiedenis opslaan in de dimensietabel., In type 2 kunt u de gegevens op drie verschillende manieren opslaan. Ze zijn
- versiebeheer
- markering
- effectieve datum
SCD type 2 versiebeheer: In versiebeheermethode wordt een volgnummer gebruikt om de verandering weer te geven. Het Laatste volgnummer staat altijd voor de huidige rij en de vorige volgnummers staan voor de gegevens uit het verleden.
als voorbeeld, laten we hetzelfde voorbeeld gebruiken van de klant die de locatie verandert. In eerste instantie is de klant in Illions locatie en de gegevens in dimensie tabel zal kijken als.,
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 1
de klant verhuist van Illions naar Seattle en het versienummer wordt verhoogd. De dimensietabel ziet er nu weer uit als
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 12 1 Marston Seattle 2
als de klant naar een andere locatie wordt verplaatst, zal er een nieuw record in de dimensietabel worden ingevoegd met het volgende versienummer.
SCD type 2 Flagging: In flagging methode wordt een flag kolom gemaakt in de dimensietabel. Het huidige record heeft de vlagwaarde als 1 en de vorige records hebben de vlag als 0.
nu voor de eerste keer, de klant dimensie zal kijken als.,
surrogate_key customer_id customer_name Location flag--------------------------------------------------------1 1 Marston Illions 1
wanneer de klant naar een nieuwe locatie verhuist, zullen de oude records worden bijgewerkt met de vlagwaarde als 0 en de laatste record zal de vlagwaarde als 1 hebben.
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 02 1 Marston Seattle 1
SCD type 2 ingangsdatum: in ingangsdatum methode wordt de periode van de verandering gevolgd met behulp van de kolommen start_date en end_date in de dimensietabel.
De NULL in de einddatum geeft de huidige versie van de gegevens aan en de resterende records geven de gegevens uit het verleden aan.,
aanbevolen lezing:
SCD type 4-snelgroeiende dimensie
Data Warehouse dimensionale modellering (typen schema ‘ s)
soorten feiten in datawarehouse
soorten dimensies in datawarehouse
logisch en fysiek ontwerp van datawarehouse
Als u dit artikel leuk vindt, deel het dan of klik op de google +1 knop.
Geef een reactie