Agile Data Science - Роль Предсказаний

В этой главе мы узнаем о роли предсказаний в гибкой науке о данных. Интерактивные отчеты раскрывают различные аспекты данных. Предсказания формируют четвертый слой проворного спринта.

Четвертый слой

Делая прогнозы, мы всегда ссылаемся на прошлые данные и используем их как выводы для будущих итераций. В этом полном процессе мы переводим данные из пакетной обработки исторических данных в данные о будущем в реальном времени.

Роль прогнозов включает в себя следующее -

  • Предсказания помогают в прогнозировании. Некоторые прогнозы основаны на статистическом выводе. Некоторые из прогнозов основаны на мнениях ученых мужей.

  • Статистический вывод связан с предсказаниями всех видов.

  • Иногда прогнозы точны, а иногда неточны.

Прогнозная аналитика

Прогнозная аналитика включает в себя различные статистические методы от прогнозирующего моделирования, машинного обучения и интеллектуального анализа данных, которые анализируют текущие и исторические факты для прогнозирования будущих и неизвестных событий.

Прогнозная аналитика требует данных обучения. Обучаемые данные включают в себя независимые и зависимые функции. Зависимые характеристики - это значения, которые пользователь пытается предсказать. Независимые функции - это функции, описывающие вещи, которые мы хотим предсказать на основе зависимых функций.

Изучение особенностей называется характеристикой; это важно для прогнозирования. Визуализация данных и анализ разведочных данных являются частями разработки функций; они составляют ядро гибкой науки о данных .

Характеристика

Делать прогнозы

Есть два способа делать прогнозы в гибкой науке о данных -

  • регрессия

  • классификация

Построение регрессии или классификации полностью зависит от требований бизнеса и его анализа. Прогнозирование непрерывной переменной приводит к модели регрессии, а предсказание категориальных переменных - к модели классификации.

регрессия

Регрессия рассматривает примеры, которые содержат признаки и, таким образом, производят числовой вывод.

классификация

Классификация принимает входные данные и производит категориальную классификацию.

Примечание . Примерный набор данных, который определяет входные данные для статистического прогнозирования и позволяет машине учиться, называется «обучающими данными».