lassan változó méretek: a lassan változó méretek azok a méretek, amelyekben az adatok lassan változnak, nem pedig rendszeresen változnak.
például lehet, hogy egy ügyfél dimenziója van egy kiskereskedelmi domainben. Tegyük fel, hogy az ügyfél Indiában van, és minden hónapban vásárol. Most könnyű elkészíteni az értékesítési jelentést az ügyfelek számára. Tegyük fel, hogy az ügyfél átkerül az Egyesült Államokba, és ott vásárol. Hogyan lehet rögzíteni egy ilyen változást az ügyfél dimenziójában?,
összegezheti vagy átlagolhatja az ügyfelek által végzett értékesítéseket. Ebben az esetben nem kapja meg az ügyfelek által végzett értékesítés pontos összehasonlítását. Mivel az átutalás után nő az ügyfelek fizetése, az Egyesült Államokban több vásárlást végezhet, mint Indiában. Ha összegzi a teljes értékesítést, akkor az ügyfél által végzett értékesítés erősebbnek tűnhet, még akkor is, ha jó. Létrehozhat egy második ügyfélrekordot, amely az átadott ügyfelet új ügyfélként kezeli. Ez azonban problémákat is okoz.,
ezeknek a problémáknak a kezelése magában foglalja az SCD-kezelési módszereket, amelyeket 1-es típusnak a 3-as típusnak neveznek. A lassan változó méretek különböző típusait az alábbiakban részletesen ismertetjük.
SCD Type 1: az SCD type 1 módszertant akkor alkalmazzák, ha a dimenziótáblában nincs szükség történelmi adatok tárolására. Ez a módszer felülírja a dimenzió táblázatban szereplő régi adatokat az új adatokkal. A dimenzió adathibáinak kijavítására szolgál.
példaként az alábbi adatokkal rendelkezem az ügyféltáblával.
surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marspton Illions
itt az ügyfél neve hibás., Marstonnak kell lennie a Marspton helyett. Ha type1 módszert használ, egyszerűen felülírja az adatokat. A frissített táblázatban szereplő adatok lesznek.
surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marston Illions
a type1 előnye a könnyű karbantartás és a kevesebb hely elfoglalása. Hátránya, hogy az adattárházban nem tárolnak történelmi adatokat.
SCD Type 3: a 3-as típusú metódusban csak a sor aktuális és korábbi állapota marad meg a táblázatban. A változások nyomon követéséhez két külön oszlop jön létre a táblázatban., A customer dimension table in the type 3 method will look as
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Illions NULL
Let say, the customer moves from Illions to Seattle and the updated table will look as
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Seattle Illions
Ha az ügyfél seattle-ből NewYork-be költözik, akkor a frissített táblázat
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston NewYork Seattle
a 3-as típusú metódus története korlátozott lesz, és a létrehozott oszlopok számától függ.
SCD Type 2: SCD type 2 tárolja a teljes történelem az adatokat a dimenzió táblázatban. A 2-es típusú tárolhatjuk korlátlan történelem a dimenzió táblázat., A 2. típusban az adatokat három különböző módon tárolhatja. Ők
- Verziószámozás
- Lanyhuló
- Tényleges Időpontja
SCD 2-es Típusú Verziószámozás: A verziószámozás módszer, a sorozat számot használja, hogy képviselje a változás. A legutóbbi sorozatszám mindig az aktuális sort, az előző sorozatszámok pedig a múltbeli adatokat jelöli.
példaként használjuk ugyanazt a példát az ügyfélre, aki megváltoztatja a helyet. Kezdetben az ügyfél Illions helyen, az adatok dimenzió táblázat fog kinézni.,
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 1
az ügyfél az Illionokból Seattle-be költözik, a verziószám pedig növekszik. A dimenzió táblázat fog kinézni
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 12 1 Marston Seattle 2
most ismét, Ha az ügyfél átkerül egy másik helyre, egy új rekord kerül beillesztésre a dimenzió táblázat a következő verziószámot.
SCD Type 2 megjelölés: a jelölési módszerben a dimenziótáblában egy zászlóoszlop jön létre. A jelenlegi rekord lesz a zászló értéke 1, az előző rekordok lesz a zászló 0.
most először, az ügyfél dimenziója fog kinézni.,
surrogate_key customer_id customer_name Location flag--------------------------------------------------------1 1 Marston Illions 1
Most, amikor az ügyfél új helyre költözik, a régi rekordok 0-as zászlóértékkel frissülnek, a legújabb rekord pedig 1-es zászlóértékkel rendelkezik.
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 02 1 Marston Seattle 1
SCD 2-es Típusú hatálybalépés Dátuma: A hatálybalépés napja a módszer, az időszak a változás nyomon, amelyek a start_date, valamint end_date oszlopok a dimenzió táblázat.
A NULL az End_Date-ben az adatok aktuális verzióját, a fennmaradó rekordok pedig a múltbeli adatokat jelzik.,
ajánlott olvasmány:
SCD type 4-Fast growing dimension
Data Warehouse Dimensional Modelling(típusú sémák)
típusú tények adattárház
típusú méretek adattárház
logikai és fizikai tervezés adattárház
Ha tetszik ez a cikk, akkor kérjük, ossza meg, vagy kattintson a google +1 gombra.
Vélemény, hozzászólás?