LogValidator от World Wide Web Consortium (W3C) является отличным инструментом для веб-мастеров и администраторов для проверки действительности документов на веб-сайтах, больших или малых, на регулярной основе.
Инструмент доступен через CPAN в виде модуля W3C :: LogValidator, а также может быть загружен и установлен вручную (см. Список ссылок ниже).
LogValidator имеет несколько модулей и может быть запущен в cron по расписанию по вашему выбору. Модули включают проверку правильности HTML, XHTML и CSS. Используя обзор ваших веб-журналов, программа может быть настроена так, чтобы она возвращала самые популярные страницы на вашем сайте, при этом список файлов, признанных недействительными, запускается через валидатор (ы) W3C. Документы могут быть обновлены для проверки действительности вручную или с помощью инструмента, такого как Tidy , также доступного от W3C.
Для больших сайтов LogValidator может помочь выявить возможные проблемы с выводом механизма шаблонов, если ошибки продолжают возвращаться на новых публикуемых страницах. Кроме того, если ваш сайт большой и вы собираетесь регулярно просматривать все страницы, вы можете загрузить и установить валидаторы W3C локально в вашей сети и указать на него файл конфигурации LogValidator.
Файл конфигурации для LogValidator хорошо документирован и легко настраивается для ваших нужд. Поддержка вывода результатов включает в себя необработанные файлы, отчеты HTML или по электронной почте. Можно настроить инструмент и файлы конфигурации для сканирования нескольких сайтов и отправки отчетов по электронной почте на эти сайты соответствующим веб-администраторам.
Список ссылок:
Главная страница LogValidator -> http://www.w3.org/QA/Tools/LogValidator/
Руководство LogValidator -> http://www.w3.org/QA/Tools/LogValidator/Manual
Пример файла конфигурации LogValidator -> http://dev.w3.org/cvsweb/perl/modules/W3C/LogValidator/samples/logprocess.conf?only_with_tag=HEAD