Учебник по Apache Pig

Apache Pig - это абстракция над MapReduce. Это инструмент / платформа, которая используется для анализа больших наборов данных, представляющих их как потоки данных. Свинья обычно используется с Hadoop ; мы можем выполнять все операции с данными в Hadoop, используя Pig.

Аудитория

Это руководство предназначено для всех тех специалистов, работающих с Hadoop, которые хотели бы выполнять операции MapReduce без необходимости вводить сложные коды в Java.

Предпосылки

Чтобы максимально использовать этот учебник, вы должны хорошо разбираться в основах команд Hadoop и HDFS. Это, безусловно, поможет, если вы хорошо разбираетесь в SQL.