Agile Data Science - Введение

Agile Data Science - это подход использования Data Science с гибкой методологией для разработки веб-приложений. Он сфокусирован на результатах процесса обработки данных, пригодного для осуществления изменений в организации. Наука о данных включает создание приложений, которые описывают процесс исследования с помощью анализа, интерактивной визуализации, а также прикладного машинного обучения.

Основная цель гибкой науки о данных -

документируйте и проводите объяснительный анализ данных, чтобы найти и следовать критическому пути к привлекательному продукту

Наука гибких данных организована со следующим набором принципов -

Непрерывная итерация

Этот процесс включает в себя непрерывную итерацию с созданием таблиц, диаграмм, отчетов и прогнозов. Построение прогнозирующих моделей потребует много итераций разработки функций с извлечением и получением информации.

Промежуточный выход

Это список треков сгенерированных выходов. Говорят даже, что неудачные эксперименты также имеют выход. Отслеживание результатов каждой итерации поможет создать лучший результат на следующей итерации.

Эксперименты с прототипами

Эксперименты с прототипами включают в себя назначение задач и генерирование результатов в соответствии с экспериментами. В данной задаче мы должны выполнить итерацию, чтобы достичь понимания, и эти итерации лучше всего объяснить как эксперименты.

Интеграция данных

Жизненный цикл разработки программного обеспечения включает в себя различные фазы с данными, необходимыми для -

  • клиенты

  • разработчики и

  • бизнес

Интеграция данных прокладывает путь для улучшения перспектив и результатов.

Значение данных пирамиды

Значение данных пирамиды

Приведенное выше значение пирамиды описывает уровни, необходимые для развития «гибкой науки о данных». Он начинается с сбора записей на основе требований и учета отдельных записей. Графики создаются после очистки и агрегирования данных. Агрегированные данные могут быть использованы для визуализации данных. Отчеты создаются с правильной структурой, метаданными и тегами данных. Второй слой пирамиды сверху включает прогнозный анализ. Слой прогнозирования - это место, где создается большая ценность, но помогает в создании хороших прогнозов, ориентированных на проектирование объектов.

Самый верхний уровень включает действия, в которых ценность данных определяется эффективно. Лучшая иллюстрация этой реализации - «Искусственный интеллект».