Учебники

TIKA — Форматы файлов

В следующей таблице приведены форматы файлов, которые поддерживает Tika.

org.apache.tika.parser.microsoft

org.apache.tika.parser.microsoft.ooxml и использует библиотеку Apache Poi

OfficeParser (OLE2)

OOXMLParser (ooxml)