Учебное пособие TIKA

Это руководство дает базовое представление о библиотеке Apache Tika, поддерживаемых форматах файлов, а также об извлечении контента и метаданных с помощью Apache Tika.

Аудитория

Это руководство предназначено для всех энтузиастов Java, которые хотят изучить обнаружение типов документов и извлечение контента с помощью Apache Tika.

Предпосылки

Чтобы максимально использовать этот учебник, читатели должны предварительно ознакомиться с программированием на Java с использованием JDK 1.6 и концепций ввода-вывода в Java.