Хранение данных - Вопросы для интервью

Уважаемые читатели, эти вопросы для интервью по хранилищу данных были разработаны специально для того, чтобы познакомить вас с характером вопросов, с которыми вы можете столкнуться во время интервью по теме хранилища данных .

Q: Определить хранилище данных?

A : Хранилище данных - это предметно-ориентированный, интегрированный, изменяющийся во времени и энергонезависимый сбор данных, который поддерживает процесс принятия решений руководством.

В: Что означает предметно-ориентированное хранилище данных?

A : Субъектно-ориентированный означает, что хранилище данных хранит информацию вокруг определенного предмета, такого как продукт, клиент, продажи и т. Д.

В: Перечислите любые пять приложений хранилища данных.

A : Некоторые приложения включают финансовые услуги, банковские услуги, потребительские товары, розничные секторы, контролируемое производство.

В: Что означают OLAP и OLTP?

О : OLAP - это аббревиатура для онлайн-аналитической обработки, а OLTP - это аббревиатура для онлайн-транзакции.

В: Какова основная разница между хранилищем данных и оперативными базами данных?

A : Хранилище данных содержит историческую информацию, которая доступна для анализа бизнеса, тогда как оперативная база данных содержит текущую информацию, необходимую для ведения бизнеса.

В: Перечислите схему, которую может реализовать система хранилища данных.

A : Хранилище данных может реализовать схему типа «звезда», схему «снежинка» и схему группировки фактов.

Q: Что такое хранилище данных?

A : Хранилище данных - это процесс создания и использования хранилища данных.

В: Перечислите процессы, которые задействованы в хранилищах данных.

A : Хранилище данных включает в себя очистку данных, интеграцию данных и консолидацию данных.

В: Перечислите функции инструментов и утилит хранилища данных.

О : Функции, выполняемые инструментом и утилитами хранилища данных: извлечение данных, очистка данных, преобразование данных, загрузка и обновление данных.

Q: Что вы подразумеваете под извлечением данных?

A : Извлечение данных означает сбор данных из нескольких разнородных источников.

Q: Определить метаданные?

A : Метаданные просто определяются как данные о данных. Другими словами, мы можем сказать, что метаданные - это обобщенные данные, которые приводят нас к подробным данным.

В: Что содержится в метаданных дыхательных путей?

Ответ : Респиратор метаданных содержит определение хранилища данных, бизнес-метаданные, операционные метаданные, данные для отображения из операционной среды в хранилище данных и алгоритмы для суммирования.

В: Как помогает куб данных?

A : Куб данных помогает нам представлять данные в нескольких измерениях. Куб данных определяется измерениями и фактами.

Q: Определить размерность?

A : Измерения - это объекты, в отношении которых предприятие ведет учет.

Q: Объясните данные витрины.

A : витрина данных содержит подмножество общеорганизационных данных. Это подмножество данных является ценным для конкретных групп организации. Другими словами, мы можем сказать, что витрина данных содержит данные, специфичные для конкретной группы.

Q: Что такое виртуальный склад?

A : Вид на оперативное хранилище данных называется виртуальным хранилищем.

Q: Перечислите фазы, вовлеченные в процесс доставки хранилища данных.

A : Этапы: ИТ-стратегия, образование, анализ бизнес-кейсов, технический проект, сборка версии, загрузка истории, специальный запрос, эволюция требований, автоматизация и расширение области действия.

Q: Определите менеджер нагрузки.

A : Менеджер загрузки выполняет операции, необходимые для извлечения и загрузки процесса. Размер и сложность диспетчера нагрузки варьируются между конкретными решениями от хранилища данных до хранилища данных.

Q: Определите функции менеджера загрузки.

A : Менеджер загрузки извлекает данные из исходной системы. Быстрая загрузка извлеченных данных во временное хранилище данных. Выполните простые преобразования в структуру, похожую на структуру хранилища данных.

Q: Определите менеджера склада.

Ответ : Менеджер склада отвечает за процесс управления складом. Менеджер хранилища состоит из стороннего системного программного обеспечения, программ на C и сценариев оболочки. Размер и сложность менеджера склада варьируются в зависимости от конкретных решений.

Q: Определите функции менеджера склада.

A : Менеджер хранилища выполняет проверки целостности и ссылочной целостности, создает индексы, бизнес-представления, представления разделов на основе базовых данных, преобразовывает и объединяет исходные данные во временное хранилище в опубликованное хранилище данных, создает резервные копии данных в хранилище данных. и архивирует данные, которые достигли конца своей захваченной жизни.

Q: Что такое сводная информация?

A : Сводная информация - это область в хранилище данных, где хранятся предопределенные агрегаты.

В: За что отвечает менеджер запросов?

A : Диспетчер запросов отвечает за направление запросов к подходящим таблицам.

Q: Перечислите типы серверов OLAP

О : Существует четыре типа серверов OLAP, а именно: реляционный OLAP, многомерный OLAP, гибридный OLAP и специализированные серверы SQL.

Вопрос: Какой из них быстрее, многомерный OLAP или реляционный OLAP?

A : Многомерный OLAP работает быстрее, чем Реляционный OLAP.

Q: Перечислите функции, выполняемые OLAP.

A : OLAP выполняет такие функции, как свертывание, детализация, срез, игральные кости и поворот.

Q: Сколько измерений выбрано в операции среза?

A : Для операции среза выбрано только одно измерение.

Q: Сколько размеров выбрано в игре в кости?

A : Для работы с кубиками для данного куба выбраны два или более измерения.

В: Сколько таблиц фактов имеется в схеме типа «звезда»?

A : В звездообразной схеме есть только одна таблица фактов.

Q: Что такое нормализация?

A : Нормализация разбивает данные на дополнительные таблицы.

Вопрос: Чья таблица измерений нормализована из схемы «звезда» и «снежинка»?

A : В схеме Snowflake используется концепция нормализации.

В: В чем выгода нормализации?

A : Нормализация помогает уменьшить избыточность данных.

Вопрос: Какой язык используется для определения определения схемы?

A : Data Mining Query Language (DMQL) используется для определения схемы.

Q: Какой язык является основой DMQL?

A : DMQL основан на языке структурированных запросов (SQL).

В: Каковы причины разбиения?

A : Разбиение выполняется по разным причинам, таким как простое управление, помощь в восстановлении резервной копии, повышение производительности.

Вопрос: Какие затраты связаны с мартингом данных?

Ответ : Data Marting включает стоимость аппаратного и программного обеспечения, стоимость доступа к сети и время.