ПРОГРАММА КУРСА АРХИТЕКТУРА ДАННЫХ
ДЕНЬ 1-2
Архитектура данных как часть реализации стратегии Data Centric на уровне предприятия.
Роль и задачи архитектора данных. Data Governance.
- Data Driven подход. Успехи. Проблемы. Эволюция. Внедрение Data Lake: что может пойти не так?
- Application Centric vs Data Centric. Когда, внедряя Big Data мы приближаемся к Data Centric, а когда отдаляемся?
- Какие проблемы мы не можем решить на уровне Data Lake/DWH. Задачи Data Governance.
- Корпоративная модель данных (EDM) как часть Data Governance
- Архитектор данных. Роли и задачи.
- Стандартизация работы с данными предприятия.
- Внедрение практик культуры работы с данными. Задачи. Процессы. Сложности.
ДЕНЬ 3-4
Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений.
- Обобщенная схема архитектур -решений. Требования к компонентам и моделям данных.
- Понятие модели данных. Виды моделей данных. Их назначение и особенности.
- Реляционная модель данных. Нормализация и денормализация.
- Классическая концептуальная модель “сущность-связь” и ее расширения.
- Нотации и инструменты моделирования данных. Концептуальная, логическая и физическая модели данных.
- Ключевое отличие к построению моделей данных аналитических систем – работа со временем. Поддержка истории изменений.
- BEAM (Business Event Activity Modeling) – подход к проектированию моделей для аналитических задач
- Design-паттерны проектирования моделей данных
- Моделирования ядра. Подход Data Vault. Его преимущества и ограничения. Развитие подхода.
ДЕНЬ 5-6
Основные подходы к проектированию моделей данных ключевых компонентов Big Data-решений. Метаданные. Эффективная загрузка данных.
- Итеративное развитие модели данных ядра
- Моделирование аналитических витрин. Подход Р. Кимбалла и его развитие.
- Отраслевые примеры моделей данных.
- Виды метаданных для аналитических систем.
- Эффективное обновление данных. Управление загрузкой.