Учебник по Hadoop

Hadoop - это платформа с открытым исходным кодом, которая позволяет хранить и обрабатывать большие данные в распределенной среде на кластерах компьютеров с использованием простых моделей программирования. Он предназначен для масштабирования от отдельных серверов до тысяч машин, каждый из которых предлагает локальные вычисления и хранилище.

Этот краткий учебник дает краткое представление о больших данных, алгоритме MapReduce и распределенной файловой системе Hadoop.

Аудитория

Это руководство было подготовлено для профессионалов, стремящихся изучить основы аналитики больших данных с помощью Hadoop Framework и стать разработчиком Hadoop. Профессионалы в области программного обеспечения, специалисты по аналитике и разработчики ETL являются ключевыми бенефициарами этого курса.

Предпосылки

Прежде чем приступить к изучению этого руководства, мы предполагаем, что вы уже знакомы с Core Java, концепциями баз данных и любыми разновидностями операционной системы Linux.