HCatalog Tutorial

HCatalog - это инструмент управления табличным хранилищем для Hadoop, который отображает табличные данные метасторака Hive для других приложений Hadoop. Это позволяет пользователям с различными инструментами обработки данных (Pig, MapReduce) легко записывать данные в сетку. HCatalog гарантирует, что пользователям не нужно беспокоиться о том, где и в каком формате хранятся их данные. Это небольшой учебник, который объясняет только основы HCatalog и как его использовать.

Аудитория

Это руководство предназначено для профессионалов, стремящихся сделать карьеру в Big Data Analytics с использованием Hadoop Framework. Разработчики ETL и профессионалы, которые занимаются аналитикой в целом, могут также использовать этот учебник с хорошим эффектом.

Предпосылки

Прежде чем приступить к этому учебному пособию, вам необходимо получить базовые знания о базовой Java, концепциях баз данных SQL, файловой системе Hadoop и любых разновидностях операционной системы Linux.