Статьи

Комментируйте спам, скомпилированный и интерпретированный

Вслед за спамом из комментариев в блогах? и обратная связь (большое спасибо), решила, что я скомпилирую (и интерпретирую) некоторые из них в нечто более упорядоченное

Гномы или роботы?

Ответом на то, кто (или что) публикует спам в комментариях, кажется, являются грустные гномы с небольшим количеством жизни и автоматизированные сценарии / программы. Учитывая это, вывод, который я все еще имею, состоит в том, что требуются другие подходы, если мы хотим предотвратить спам, представленный человеком, и спам, отправленный сценарием (акцент на предотвращение — см. «Удалить стимул» ниже).

Мне еще предстоит найти какие-то точные цифры, но я также представляю, что более серьезной проблемой является автоматизация спама, основанная на неподтвержденных данных, связанных с атаками на некоторые из известных приложений для ведения блогов, а также на решениях, которые люди приняли, что оказало существенное влияние на сокращение спама. Очевидно, что любой автоматизированный процесс способен генерировать количества, значительно превышающие все возможные, посредством ручного ввода данных.

Нет баров для законного использования

… Или «Проклятие доступности». Кажется, существует общее согласие, что публикация комментария в блоге должна быть легальной для законных пользователей. На самом деле идеальный сценарий — это то, что законные пользователи не должны подвергаться воздействию каких-либо механизмов защиты от спама.

Некоторые люди хотят требовать регистрации пользователя / аутентификации и обнаружили, что этого уже достаточно, чтобы отговорить спамеров. Риск, однако, препятствует законному использованию. Кроме того, как обнаружили такие сайты, как Hotmail, вполне возможно автоматизировать регистрацию и вход в систему с помощью скриптов, хотя это намного больше работы. Действительно, подумайте, что это предлагает сделать API публикации ваших комментариев более сложным, чтобы обескуражить сегодняшнюю породу спамеров (подробнее об этом позже).

Был некоторый разговор об использовании капч , чтобы отсеять людей от сценариев. Основные аргументы против были сосредоточены на доступности для законных пользователей; действительно ли изображения читаемы? а как насчет слуха? Там есть пара ответов — ознакомьтесь с капчами, основанными на ASCII, которые Вез использует в своем блоге, — которые очень удобочитаемы, но для них требуется докторская степень в области компьютерных наук для программного анализа. Также ознакомьтесь с мыслями Колина о Тьюринге и аудио .

Еще один вопрос о капчах и гениальных способах их обхода был задан недавно здесь христианином . Люди, похоже, отреагировали на это как «Конец капчи!». На самом деле, я ожидаю, что это случается редко, и в любом случае это также не сложно остановить — либо исследовать предотвращение хотлинкинга, либо использовать капчи Wez ASCII, которые по своей природе не являются горячими.

Хотя это можно сделать безопасным и доступным способом, они по-прежнему являются дополнительным шагом для законных пользователей, и я считаю, что они излишни для этой проблемы. Требуется не отсеивать пользователей-людей, а отсеивать законных пользовательских агентов (веб-браузеры) из сценариев…

Предотвращение автоматизации

Для меня теперь достаточно анекдота, чтобы предположить, что сделать API публикации немного более сложным, чтобы блокировать сценарии, отправляющие спам автоматически.

В одном комментарии упоминается простое, но эффективное решение Пита Бойера , которое требует от пользователя с веб-браузером одного дополнительного шага, но для сценариев потребуется больше, чем просто LWP :: Simple.

В другом месте пользователь WordPress описал немедленный эффект простого переименования POST-URL-адреса на спам. Один из комментариев, вытекающих из этого, был особенно интересным;

Трюк с переименованием работает для большинства спам-роботов — если вы не забыли удалить wp-comments-post.php с вашего сервера, как уже упоминалось: p Однако есть несколько роботов, которые, кажется, анализируют весь индекс Файл .php, чтобы узнать, как называется файл комментариев, я также изменил переменные формы комментариев, но некоторые из них все же, вероятно, потому что робот анализирует форму комментариев и тоже получает имена переменных. Так что, как кто-то упомянул, это похоже на холодную войну, где вы должны адаптироваться, чтобы постоянно опережать спамеров.

Для тех, кто занимается анализом форм, Spam Stopgap Extreme ;

Это предотвращает автоматическую очистку формы спаммерами, потому что любой, кто хочет оставить комментарий, * должен * выполнить javascript md5.

Это приводит к тому, что спаммеры охотятся за средой исполнения Javascript, которую они могут использовать … Предлагая подобное, конечно, люди указали, что некоторые люди работают с отключенным Javascript. Другой угол может быть что-то вроде этого;

… с подобной формой;

Имя:

Эл. адрес:

Комментарий: