Это руководство дает базовое представление о библиотеке Apache Tika, поддерживаемых форматах файлов, а также об извлечении контента и метаданных с помощью Apache Tika.
Аудитория
Это руководство предназначено для всех энтузиастов Java, которые хотят изучить обнаружение типов документов и извлечение контента с помощью Apache Tika.
Предпосылки
Чтобы максимально использовать этот учебник, читатели должны предварительно ознакомиться с программированием на Java с использованием JDK 1.6 и концепций ввода-вывода в Java.