dimensões em mudança lenta: dimensões em mudança lenta são as dimensões em que os dados mudam lentamente, em vez de mudar regularmente numa base temporal.por exemplo, você pode ter uma dimensão de cliente em um domínio de varejo. Digamos que o cliente está na Índia e todos os meses faz algumas compras. Agora criar o relatório de vendas para os clientes é fácil. Agora suponha que o cliente é transferido para os Estados Unidos e ele faz compras lá. Como registrar tal mudança na dimensão do cliente?,
você pode somar ou mediar as vendas feitas pelos clientes. Neste caso você não vai obter a comparação exata das vendas feitas pelos clientes. Como o salário do cliente é aumentado após a transferência, ele / ela pode fazer mais compras nos Estados Unidos em comparação com na Índia. Se você somar o total de vendas, em seguida, as vendas feitas pelo cliente pode olhar mais forte, mesmo se for bom. Você pode criar um segundo registro de cliente e tratar o cliente transferido como o novo cliente. No entanto, isso também irá criar problemas.,
O tratamento destas questões envolve metodologias de gestão de SCD que se referem como tipo 1 ao tipo 3. Os diferentes tipos de dimensões lentamente em mudança são explicados em detalhes abaixo.
SCD Type 1: SCD type 1 methodology is used when there is no need to store historical data in the dimension table. Este método sobrepõe os dados antigos na tabela dimensão com os novos dados. É usado para corrigir erros de dados na dimensão.como exemplo, tenho a tabela de clientes com os dados abaixo.
surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marspton Illions
aqui o nome do cliente é mal escrito., Devia ser o Marston em vez do Marspton. Se você usar o método type1, ele simplesmente substitui os dados. Os dados na tabela atualizada serão.
surrogate_key customer_id customer_name Location------------------------------------------------1 1 Marston Illions
a vantagem do type1 é a facilidade de manutenção e menos espaço ocupado. A desvantagem é que não há dados históricos mantidos no armazém de dados.
SCD Tipo 3: no método do tipo 3, apenas o estado atual e o estado anterior da linha é mantido na tabela. Para acompanhar estas mudanças, duas colunas separadas são criadas na tabela., O cliente tabela de dimensão no tipo 3 método vai olhar como
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Illions NULL
Vamos dizer, o cliente move-se a partir de Illions para Seattle e a tabela atualizada vai olhar como
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston Seattle Illions
Agora, novamente, se o cliente move-se a partir de seattle para Nova iorque, em seguida, a tabela atualizada será
surrogate_key customer_id customer_name Current_Location previous_location--------------------------------------------------------------------------1 1 Marston NewYork Seattle
O tipo 3 método tem limitação de história e depende do número de colunas que você criar.
SCD tipo 2: SCD tipo 2 armazena todo o histórico dos dados na tabela dimensão. Com o tipo 2 podemos armazenar história ilimitada na tabela dimensão., No tipo 2, você pode armazenar os dados de três maneiras diferentes. Eles são
- controle de versão
- Sinalização
- Data Efectiva
SCD Tipo 2, o controle de versão: método de controle De versão, um número de seqüência é utilizado para representar a mudança. O último número de sequência representa sempre a linha actual e os números de sequência anteriores representam os dados passados.como exemplo, vamos usar o mesmo exemplo do cliente que muda de local. Inicialmente o cliente está em posição Illions e os dados na tabela dimension parecerão como.,
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 1
O cliente muda de Illions para Seattle e o número da versão será aumentado. The dimension table will look as
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 12 1 Marston Seattle 2
Now again if the customer is moved to another location, a new record will be inserted into the dimension table with the next version number.
SCD Type 2 Flagging: In flagging method, a flag column is created in the dimension table. O registo actual terá o valor da bandeira como 1 e os registos anteriores terão a bandeira como 0.
agora, pela primeira vez, a dimensão do cliente vai parecer como.,
surrogate_key customer_id customer_name Location flag--------------------------------------------------------1 1 Marston Illions 1
agora quando o cliente se muda para um novo local, os registros antigos serão atualizados com o valor da bandeira como 0 e o último registro terá o valor da bandeira como 1.
surrogate_key customer_id customer_name Location Version--------------------------------------------------------1 1 Marston Illions 02 1 Marston Seattle 1
SCD tipo 2 data efetiva: no método da data efetiva, o período da alteração é seguido usando as colunas start_date e end_date na tabela dimensão.
O NULL no End_Date indica a versão atual dos dados e os registros restantes indicam os dados passados.,
Leitura recomendada:
SCD Tipo 4 – Dimensão de crescimento rápido
Data Warehouse Dimensional Modelling (Types of Schemas)
tipos de factos no Data Warehouse
tipos de dimensões no data warehouse
concepção lógica e física do Data Warehouse
Se gostar deste artigo, então por favor partilhe-o ou clique no botão google +1.
Deixe uma resposta