Добро пожаловать в форум, Guest  >>   Войти | Регистрация | Поиск | Правила | В избранное | Подписаться
Все форумы / OLAP и DWH Новый топик    Ответить
 Может ли hub в data vault иметь два sat'a  [new]
x17.mstu
Member

Откуда:
Сообщений: 312
Может ли hub в data vault иметь два sat'a ?
15 сен 20, 20:01    [22197769]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
Полковник.
Member

Откуда:
Сообщений: 1901
x17.mstu
Может ли hub в data vault иметь два sat'a ?


Может и больше. Можно сделать по сателиту на атрибут. Жёстких правил в этой методике нет.
15 сен 20, 20:41    [22197798]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
a_voronin
Member

Откуда: Москва
Сообщений: 4806
x17.mstu
Может ли hub в data vault иметь два sat'a ?

да и можете хоть каждое поле в отдельный сат положить -- получите якорную модель
16 сен 20, 10:06    [22198126]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
Voyager_lan
Member

Откуда:
Сообщений: 1492
x17.mstu,

Конечно. Вы еще сами так сделаете, чтобы сгруппировать описательные атрибуты с разной скоростью изменений
17 сен 20, 23:49    [22199678]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
Критик
Member

Откуда: Москва / Калуга
Сообщений: 34263
Блог
Эх, ну зачем вы применяете эту модель, ведь чтобы потом собрать тех же клиентов, нужно будет сделать несколько десятков джойнов )
18 сен 20, 00:19    [22199684]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
a_voronin
Member

Откуда: Москва
Сообщений: 4806
Критик,

Смысл может быть в том, что некоторые поля меняются часто, а некоторые нет. Например, ФИО и телефон никогда не меняется, а время последнего логина все время.

Что касается джойнов, то возможно есть поля, которые кране редко используются и их есть смысл убрать в отдельные сателит. Или могут быть громоздкие поля, которые стоит отделить от легких часто используемых.

Версионировать каждый сателит можно отдельно. У одного 2 версии, у другого 200.
18 сен 20, 11:42    [22199837]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
Критик
Member

Откуда: Москва / Калуга
Сообщений: 34263
Блог
a_voronin,

Всё вами перечисленное можно применить и в "стандартной архитектуре". Например, ту же историю изменения почты клиента можно вынести в отдельную SCD2 таблицу, а в справочнике клиента хранить только последнюю почту.

Также в data vault фактически обязателен отдельный бизнес-слой витрин, где всё равно придется джойнить то, что разложили чуть ранее, чтобы получить структуру, с которой смогут работать BI-приложения и пользователи.
18 сен 20, 14:13    [22199974]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
.Евгений
Member

Откуда:
Сообщений: 574
Критик,

ускорение и упрощение загрузки - только insert, без update и delete.
18 сен 20, 15:20    [22200052]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
Критик
Member

Откуда: Москва / Калуга
Сообщений: 34263
Блог
.Евгений,

В моей практике были случаи расчета "дельты" для фактов в модели Кимбала-Инмона, там технически ничего сложного нет. Эта дельта затем падала в таблицу с колоночным индексом. Все работало очень быстро. Потом через N месяцев эта дельта схопывалась в периоды низкой нагрузки.

А справочники обычно не создают какую-то чрезмерную нагрузку своим обновлением (удаления там нет).
18 сен 20, 16:34    [22200098]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
.Евгений
Member

Откуда:
Сообщений: 574
Критик
.Евгений,

В моей практике были случаи расчета "дельты" для фактов в модели Кимбала-Инмона, там технически ничего сложного нет. Эта дельта затем падала в таблицу с колоночным индексом. Все работало очень быстро. Потом через N месяцев эта дельта схопывалась в периоды низкой нагрузки.

А справочники обычно не создают какую-то чрезмерную нагрузку своим обновлением (удаления там нет).

С одним подобным ХД (имеющим прямое отношение к недавно приведенному вами примеру Сетелема) мне приходилось иметь дело: внутри Stage данные проходили сквозь 4 таблицы: входная таблица, последний загруженный снапшот, архив снапшотов и дельта для загрузки в Detail Store. Работало это, мягко говоря, не очень быстро.
18 сен 20, 17:29    [22200137]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
Полковник.
Member

Откуда:
Сообщений: 1901
Критик
Эх, ну зачем вы применяете эту модель, ведь чтобы потом собрать тех же клиентов, нужно будет сделать несколько десятков джойнов )


Эта модель применяется там, где изменения в бизнес-процессах имеют место быть постоянно, где нет понятия наговнокодил звезду/снежинку по тому, что собрал аналитик один раз и ушел, здесь проект вечен и бесконечен, здесь легче добавлять, удалять сущности и их атрибуты, пристегивать или отстёгивать таблицы, аджилитити и 6-сигма. А джойнами сейчас редко кого можно напугать.
18 сен 20, 18:15    [22200160]     Ответить | Цитировать Сообщить модератору
 Re: Может ли hub в data vault иметь два sat'a  [new]
Voyager_lan
Member

Откуда:
Сообщений: 1492
Вставлю свои 5 копеек...
DV весьма удобно применять при data-driven-подходе с ELT, используя метаданные источника на первоначальном этапе, можно автоматизировать создание объектов слоя и процедур. А вот при report-driven подходе обратная картинка, там всё должно идти от оценки бизнес-процессов (которые,зачастую, устоявшиеся) и отчетности.
18 сен 20, 19:53    [22200198]     Ответить | Цитировать Сообщить модератору
Все форумы / OLAP и DWH Ответить