Хранилище данных - OLAP

Онлайновый сервер аналитической обработки (OLAP) основан на многомерной модели данных. Это позволяет менеджерам и аналитикам получать информацию, используя быстрый, согласованный и интерактивный доступ к информации. В этой главе рассматриваются типы OLAP, операции над OLAP, различия между OLAP, а также статистические базы данных и OLTP.

Типы OLAP-серверов

У нас есть четыре типа серверов OLAP -

  • Реляционный OLAP (ROLAP)
  • Многомерный OLAP (MOLAP)
  • Гибридный OLAP (HOLAP)
  • Специализированные SQL-серверы

Реляционный OLAP

Серверы ROLAP размещаются между реляционным внутренним сервером и клиентскими интерфейсными инструментами. Для хранения данных хранилища и управления ими ROLAP использует реляционные или расширенно-реляционные СУБД.

ROLAP включает в себя следующее -

  • Реализация агрегации навигационной логики.
  • Оптимизация для каждой серверной части СУБД.
  • Дополнительные инструменты и услуги.

Многомерный OLAP

MOLAP использует многомерное хранилище на основе массива для многомерного представления данных. В многомерных хранилищах данных использование хранилища может быть низким, если набор данных является разреженным. Поэтому многие серверы MOLAP используют два уровня представления хранилища данных для обработки плотных и разреженных наборов данных.

Гибридный OLAP

Гибридный OLAP представляет собой комбинацию ROLAP и MOLAP. Он предлагает более высокую масштабируемость ROLAP и более быстрое вычисление MOLAP. Серверы HOLAP позволяют хранить большие объемы данных подробной информации. Агрегации хранятся отдельно в магазине MOLAP.

Специализированные SQL-серверы

Специализированные серверы SQL обеспечивают расширенный язык запросов и поддержку обработки запросов для запросов SQL по схемам типа «звезда» и «снежинка» в среде только для чтения.

OLAP Операции

Поскольку серверы OLAP основаны на многомерном представлении данных, мы обсудим операции OLAP в многомерных данных.

Вот список операций OLAP -

  • Свернуть
  • Дрель-вниз
  • Ломтик и кости
  • Поворот (поворот)

Свернуть

Свертывание выполняет агрегацию в кубе данных любым из следующих способов:

  • Поднимаясь по иерархии понятий для измерения
  • По уменьшению размеров

Следующая диаграмма иллюстрирует, как работает свертка.

Свернуть
  • Свертывание выполняется путем подъема иерархии понятий для местоположения измерения.

  • Первоначально концепция иерархии была «улица <город <провинция <страна».

  • При свертывании данные агрегируются в порядке возрастания иерархии местоположений от уровня города до уровня страны.

  • Данные сгруппированы по городам, а не по странам.

  • При выполнении свертки одно или несколько измерений из куба данных удаляются.

Дрель-вниз

Развертка - это обратная операция свертки. Это выполняется одним из следующих способов -

  • Пошаговая иерархия понятий для измерения
  • Вводя новое измерение.

Следующая диаграмма иллюстрирует, как работает детализация -

Drill-Down
  • Развертка выполняется путем понижения иерархии понятий для времени измерения.

  • Первоначально концепция иерархии была «день <месяц <квартал <год».

  • При детализации измерение времени спускается с уровня квартала до уровня месяца.

  • При выполнении детализации добавляются одно или несколько измерений из куба данных.

  • Он перемещает данные от менее подробных данных к очень подробным данным.

Кусочек

Операция среза выбирает одно конкретное измерение из данного куба и предоставляет новый вложенный куб. Рассмотрим следующую диаграмму, которая показывает, как работает слайс.

Кусочек
  • Здесь Slice выполняется для измерения «время» с использованием критерия time = «Q1».

  • Он сформирует новый вложенный куб, выбрав одно или несколько измерений.

Игральная кость

Кости выбирает два или более измерений из данного куба и предоставляет новый вложенный куб. Рассмотрим следующую диаграмму, которая показывает операцию игры в кости.

Игральная кость

Операция с кубиками на кубе на основе следующих критериев выбора включает три измерения.

  • (location = "Торонто" или "Ванкувер")
  • (время = "Q1" или "Q2")
  • (item = "Mobile" или "Modem")

стержень

Операция поворота также называется вращением. Он вращает оси данных в поле зрения, чтобы обеспечить альтернативное представление данных. Рассмотрим следующую диаграмму, которая показывает операцию поворота.

стержень

OLAP против OLTP

Sr.No. Хранилище данных (OLAP) Оперативная база данных (OLTP)
1 Включает историческую обработку информации. Включает ежедневную обработку.
2 OLAP-системы используются работниками умственного труда, такими как руководители, менеджеры и аналитики. Системы OLTP используются клерками, администраторами баз данных или специалистами по базам данных.
3 Полезно при анализе бизнеса. Полезно для ведения бизнеса.
4 Это сосредотачивается на Информации. Он фокусируется на данных в.
5 На основе схемы «Звезда», «Снежинка», «Схема и схема фактов». На основе модели отношений сущностей.
6 Содержит исторические данные. Содержит текущие данные.
7 Предоставляет обобщенные и консолидированные данные. Предоставляет примитивные и очень подробные данные.
8 Предоставляет обобщенный и многомерный вид данных. Предоставляет подробный и плоский реляционный вид данных.
9 Количество или пользователей исчисляется сотнями. Количество пользователей в тысячах.
10 Количество обращений к записи в миллионах. Количество записей достигло десятков.
11 Размер базы данных от 100 ГБ до 1 ТБ Размер базы данных от 100 МБ до 1 ГБ.
12 Очень гибкий. Обеспечивает высокую производительность.