Учебники

jsoup — Обзор

jsoup — это библиотека на основе Java для работы с контентом на основе HTML. Он предоставляет очень удобный API для извлечения и обработки данных, используя лучшие методы DOM, CSS и jquery-подобные. Он реализует спецификацию WHATWG HTML5 и анализирует HTML в том же DOM, что и современные браузеры.

Библиотека jsoup реализует спецификацию WHATWG HTML5 и анализирует содержимое HTML в том же DOM, что и в современных браузерах.

Библиотека jsonp обеспечивает следующие функциональные возможности.

Поддержка множественного чтения — он читает и анализирует HTML, используя URL, файл или строку.

Селекторы CSS — могут находить и извлекать данные, используя обход DOM или селекторы CSS.

DOM Manipulation — может манипулировать HTML-элементами, атрибутами и текстом.

Предотвращать атаки XSS — он может очищать пользовательский контент от заданного безопасного белого списка, чтобы предотвратить атаки XSS.

Tidy — выводит чистый HTML.

Обрабатывает недействительные данные — jsoup может обрабатывать незамкнутые теги, неявные теги и может надежно создавать структуру документа.