Вслед за спамом из комментариев в блогах? и обратная связь (большое спасибо), решила, что я скомпилирую (и интерпретирую) некоторые из них в нечто более упорядоченное
Гномы или роботы?
Ответом на то, кто (или что) публикует спам в комментариях, кажется, являются грустные гномы с небольшим количеством жизни и автоматизированные сценарии / программы. Учитывая это, вывод, который я все еще имею, состоит в том, что требуются другие подходы, если мы хотим предотвратить спам, представленный человеком, и спам, отправленный сценарием (акцент на предотвращение — см. «Удалить стимул» ниже).
Мне еще предстоит найти какие-то точные цифры, но я также представляю, что более серьезной проблемой является автоматизация спама, основанная на неподтвержденных данных, связанных с атаками на некоторые из известных приложений для ведения блогов, а также на решениях, которые люди приняли, что оказало существенное влияние на сокращение спама. Очевидно, что любой автоматизированный процесс способен генерировать количества, значительно превышающие все возможные, посредством ручного ввода данных.
Нет баров для законного использования
… Или «Проклятие доступности». Кажется, существует общее согласие, что публикация комментария в блоге должна быть легальной для законных пользователей. На самом деле идеальный сценарий — это то, что законные пользователи не должны подвергаться воздействию каких-либо механизмов защиты от спама.
Некоторые люди хотят требовать регистрации пользователя / аутентификации и обнаружили, что этого уже достаточно, чтобы отговорить спамеров. Риск, однако, препятствует законному использованию. Кроме того, как обнаружили такие сайты, как Hotmail, вполне возможно автоматизировать регистрацию и вход в систему с помощью скриптов, хотя это намного больше работы. Действительно, подумайте, что это предлагает сделать API публикации ваших комментариев более сложным, чтобы обескуражить сегодняшнюю породу спамеров (подробнее об этом позже).
Был некоторый разговор об использовании капч , чтобы отсеять людей от сценариев. Основные аргументы против были сосредоточены на доступности для законных пользователей; действительно ли изображения читаемы? а как насчет слуха? Там есть пара ответов — ознакомьтесь с капчами, основанными на ASCII, которые Вез использует в своем блоге, — которые очень удобочитаемы, но для них требуется докторская степень в области компьютерных наук для программного анализа. Также ознакомьтесь с мыслями Колина о Тьюринге и аудио .
Еще один вопрос о капчах и гениальных способах их обхода был задан недавно здесь христианином . Люди, похоже, отреагировали на это как «Конец капчи!». На самом деле, я ожидаю, что это случается редко, и в любом случае это также не сложно остановить — либо исследовать предотвращение хотлинкинга, либо использовать капчи Wez ASCII, которые по своей природе не являются горячими.
Хотя это можно сделать безопасным и доступным способом, они по-прежнему являются дополнительным шагом для законных пользователей, и я считаю, что они излишни для этой проблемы. Требуется не отсеивать пользователей-людей, а отсеивать законных пользовательских агентов (веб-браузеры) из сценариев…
Предотвращение автоматизации
Для меня теперь достаточно анекдота, чтобы предположить, что сделать API публикации немного более сложным, чтобы блокировать сценарии, отправляющие спам автоматически.
В одном комментарии упоминается простое, но эффективное решение Пита Бойера , которое требует от пользователя с веб-браузером одного дополнительного шага, но для сценариев потребуется больше, чем просто LWP :: Simple.
В другом месте пользователь WordPress описал немедленный эффект простого переименования POST-URL-адреса на спам. Один из комментариев, вытекающих из этого, был особенно интересным;
Трюк с переименованием работает для большинства спам-роботов — если вы не забыли удалить wp-comments-post.php с вашего сервера, как уже упоминалось: p Однако есть несколько роботов, которые, кажется, анализируют весь индекс Файл .php, чтобы узнать, как называется файл комментариев, я также изменил переменные формы комментариев, но некоторые из них все же, вероятно, потому что робот анализирует форму комментариев и тоже получает имена переменных. Так что, как кто-то упомянул, это похоже на холодную войну, где вы должны адаптироваться, чтобы постоянно опережать спамеров.
Для тех, кто занимается анализом форм, Spam Stopgap Extreme ;
Это предотвращает автоматическую очистку формы спаммерами, потому что любой, кто хочет оставить комментарий, * должен * выполнить javascript md5.
Это приводит к тому, что спаммеры охотятся за средой исполнения Javascript, которую они могут использовать … Предлагая подобное, конечно, люди указали, что некоторые люди работают с отключенным Javascript. Другой угол может быть что-то вроде этого;
… с подобной формой;
Знание того, какие поля формы фактически должны быть заполнены, содержится в CSS. Если они до этого дойдут, это может быть затруднено, если связать стили с тегами с помощью селекторов классов CSS. Уникальный идентификатор в URL-адресе POST определяет, какой набор полей содержит реальные данные, в то время как скрипт, который анализирует форму, может быть введен в заблуждение при отправке данных в неправильные поля, тем самым идентифицируя себя. Во всяком случае — служит еще одним возможным решением в гонке вооружений …
черный список
Благодаря подсказке от Amit оказывается, что уже есть центральная служба, которая поможет с черным списком, описанная здесь . Есть также этот плагин WordPress, который использует некоторые из RBL (Realtime Blackhole) сервисов, которые были разработаны для борьбы со спамом в электронной почте.
Если мы движемся в этом направлении, я думаю, что методы, которые использовались для борьбы со спамом в электронной почте (например, байесовские фильтры ), заслуживают изучения.
Что касается RBL и черных списков, этот документ (предметом является спам в электронной почте) освещает некоторые из проблем. Фактически, читая это, почти все описываемые проблемы, за исключением «Ущерб от ущерба и законных пользователей», относятся к тому, что RBL являются централизованными услугами.
Имея это в виду, предложение Маркуса вполне может быть способом пойти;
RSS предоставит распределенное решение.
Мало того, он добавляет имя к данным, позволяя «потребителям» выбирать, кому они доверяют, для своих черных списков, а не центральный сервис, где данные предоставляются анонимно.
Также имеется встроенный механизм для обновления данных и устранения узких мест. Каждый блоггер ведет свой собственный черный список, который периодически обновляется из каналов других людей. Там, вероятно, также скрыта проницательность веб-службы — что-то вроде: «Распределенная и масштабируемая сеть — это не нормализованная сеть», но это уже другая история…
Удалить Стимул
Саймон указал, как он использует перенаправления для устранения PageRank, в основном не давая роботам Google их индексировать.
Лично я все еще думаю, что устранение PageRank является лучшим решением просто потому, что оно борется с экономикой спама в комментариях. Как показал спам в электронной почте, пока существует экономический стимул, спамеры будут предпринимать все более и более продвинутые шаги, чтобы избежать фильтров и контрмер.
Подход Саймона, кажется, был очень эффективным, судя по отсутствию спама, который он получает. Технически я полагаю, что это нарушает принцип «без баров для законного использования» — что, если вы хотите, чтобы законные пользователи могли публиковать ссылки и иметь Google рейтинг страницы с ним? Это также предполагает, что вы имеете дело с «умными спаммерами», которые понимают, что вы сделали, — на самом деле это не предотвращает спам, и «глупый спамер» может в любом случае опубликовать.
Маркус сделал подобное замечание;
Здесь участвует третья сторона, которая может помочь. Если бы у нас был простой способ сообщить о спам-ссылках в Google, стимул мог бы быть уничтожен у источника. Google может отбросить любой продвигаемый спам сайт.
В некоторой степени это уже возможно, как Саймон описал здесь .
экономика
Диана С. рассказала историю о том, как она имела дело с одним спамером в комментариях (в конце );
В течение 24 часов я получил ответ от оптового поставщика таблеток, который объяснил, что они получили копии отправленных по электронной почте отзывов на веб-сайте диетических таблеток, и извинился за спам, и сказал, что они немедленно прекращают свои оптовые отношения с сайт диетических таблеток, потому что у них строгая антиспамовая политика.
Если это представитель спамеров комментариев, они просто действуют как (полуавторизованные) посредники в процессе маркетинга. Один из нетехнических подходов может заключаться в том, чтобы переложить давление на поставщиков с помощью «наименования и позора» для тех, кто не может поддерживать порядок в собственном доме.
Наконец-то забавное экономическое вращение для тех, кто ищет возможности, это котенок