Статьи

Как остановить комментарий спам

Спам больше не ограничивается электронной почтой. Если вы запускаете веб-сайт, на котором вы разрешаете пользователям оставлять комментарии, вы, несомненно, столкнулись с проблемой спама в комментариях.

Цель спамеров — не перенаправить часть вашего трафика на их сайт, что является очевидным первоначальным выводом; это повысить их (или их клиентов) рейтинг в поисковых системах. Большинство поисковых систем теперь считают в рейтинге сайта, сколько других сайтов ссылаются на него. Оставляя комментарии на вашем сайте, сайты спаммеров могут достичь немного более высокого рейтинга в поисковых системах.

Задача спамеров — обойти блокировщики спама и нацелиться на безопасность отдельных веб-сайтов; хотя иногда они делают это вручную, на сегодняшний день наиболее распространенные формы спама в комментариях достигаются с помощью «ботов» или сценариев спама. К сожалению, многие владельцы сайтов не уделяют внимание своим веб-сайтам как своей повседневной работе, что может затруднить адаптацию к спам-ботам.

Эмпирические правила

Когда вы обнаружите, что ваш сайт является жертвой спама в комментариях, легко реагировать сильно, в каждом конкретном случае, а не смотреть на картину в целом. Эти правила должны помочь вам держать вещи в перспективе.

Самое важное из этих правил: не принимайте это на свой счет. Спамеры не хотят ухудшать ваш сайт. Они просто хотят привлечь людей на свои сайты и получать большую прибыль.

1. Не запрещайте определенные IP-адреса

Не беспокойтесь о запрете IP-адресов. Хотя это наиболее логичная вещь, она редко очень помогает. Большинство спамеров, комментирующих комментарии, сбрасывают запросы с других компьютеров и серверов, поэтому вы, вероятно, никогда не сможете полностью удалить их со своего сайта.

Как пояснил Спаммер в своем интервью в The Register, «Сэм (спаммер с комментариями), как и другие спаммеры по ссылкам, использует тысячи« открытых прокси »в сети. Это машины, которые случайно (читай: clueless sysadmins») ) или дизайн (читай: невежественные менеджеры) настроены таким образом, что любой человек в любом месте может получить доступ к другому веб-сайту через них. Обычно предназначен для внутреннего использования, поэтому компании нужна только одна машина, обращенная к сети, их на самом деле трудно заблокировать полностью.»

2. Не позволяйте HTML

У пользователя вашего сайта нет причин писать HTML или JavaScript. Это должно быть очевидно, но есть много веб-сайтов, которые позволяют пользователям использовать один или оба этих языка.

Если вы чувствуете необходимость разрешить пользователю включать ссылки, существует ряд способов, с помощью которых вы можете кодировать, чтобы приспособить эту функциональность, не делая ваш сайт уязвимым для атак. Самый распространенный способ — сообщить пользователю, что все URL-адреса будут автоматически преобразованы в ссылки, а затем преобразовать любой контент, начинающийся с http: //, в ссылку.

3. Используйте неописательные имена форм

Хорошее программирование требует использования описательных имен, но во избежание спама в комментариях следует избегать имен, описывающих поля формы. Имена элементов формы, такие как «Комментарий», упрощают доступ спамеров к вашей системе комментариев.

4. Используйте rel = «nofollow» для всех ссылок

Если вы разрешаете пользователям сайта включать ссылки в свои комментарии, добавьте rel = «nofollow» в тег, как показано ниже:

<a href="http://www.sitepoint.com" rel="nofollow">SitePoint</a>

Этот метод позволяет роботам поисковых систем игнорировать ссылку, поэтому спамер не получает никакой выгоды от добавления ссылок на ваши комментарии.

Остановка спама

Вы можете остановить спам в комментариях двумя способами. Первый решает проблему до публикации комментария; второй адрес рассылки спама после свершившегося факта.

1. Различайте спамеров и обычных пользователей

Различие между спаммерами и обычными пользователями включает требование, чтобы ваши человеческие плакаты идентифицировали себя как таковые, хотя в процессе комментирования был добавлен дополнительный шаг. Это, пожалуй, наиболее широко используемый подход, позволяющий избежать спама в комментариях, и включает два варианта.

Тест Тьюринга

Наиболее часто используемый тест Тьюринга (названный в честь ученого-компьютерщика Алана Тьюринга) называется CAPTCHA (Полностью автоматизированный публичный тест Тьюринга, который отличает компьютеры и людей).

Это включает добавление в область комментариев вашего сайта изображения, которое содержит случайный фрагмент текста. Текст должен быть немного потускневшим или размытым, чтобы человек мог его прочитать, а компьютер — нет. Комментатора просят скопировать этот текст точно в поле формы, прежде чем они отправят форму.

Этот процесс позволяет легко гарантировать, что комментатор — это человек, а не бот. Это не решает проблему спама в комментариях вручную. Однако, поскольку большинство спам-сообщений выполняется автоматически роботами, этот метод должен остановить большинство спам-комментариев.

преимущества

Постоянное обновление вашего кода не требуется, так как этот метод не зависит от кода.

Недостатки

Пользователи вынуждены выполнять дополнительный шаг, который им не выгоден, чтобы оставлять свои комментарии. Это может привести к серьезным ошибкам, если ваш сайт только начинается, и вы пытаетесь поощрить людей комментировать.

Более подробную информацию о CAPTCHAS можно найти на Capcha.net . Бесплатный ресурс, который объясняет, как использовать CAPTCHAS на вашем сайте, доступен в Human Verify .

Аутентификация пользователя

Используя этот метод, владелец сайта требует, чтобы все пользователи установили имя пользователя и пароль, прежде чем они смогут комментировать сайт. Если затем администратор обнаружит, что пользователь спамит сайт, он может запретить это имя пользователя или адрес электронной почты.

Этот подход работает двумя способами. Во-первых, спамеры не хотят, чтобы их идентифицировали, и поэтому вряд ли зарегистрируются. Но, даже если они это сделают, препятствие необходимости тратить время на регистрацию для рассылки спама (и быть немедленно забаненным) может быть сильным сдерживающим фактором. В конце концов, есть много более простых целей в сети, чем сайт, на котором установлена ​​система аутентификации пользователей.

преимущества

Хотя это решение основано на коде, оно включает базу данных пользователей и упрощенное управление пользователями, поэтому оно не слишком трудоемко. Однако запрет на оскорбительные имена пользователей может занять некоторое время.

Недостатки

Прежде чем они смогут отправлять сообщения, пользователи вынуждены выполнить множество дополнительных шагов, для которых они могут увидеть небольшую выгоду. Это может привести к серьезным ошибкам, если ваш сайт только начинает работать и вы пытаетесь стимулировать его использование.

Один из способов сделать систему более гладкой — использование файлов cookie для автоматического входа повторных пользователей при каждом посещении сайта. Таким образом, когда они отправляют сообщения, им не нужно сталкиваться с формой входа в систему: они уже вошли в систему и могут просто начать отправлять сообщения. Однако эта опция не облегчает начальный процесс регистрации.

Дополнительную информацию о создании системы аутентификации пользователей можно найти на сайте Developer Fusion и, конечно же, с помощью поиска здесь на SitePoint.com .

2. Поймать комментарий спам после того, как он был добавлен

Поймать спам в комментариях будет необходимо, если вы решите не проводить различий между спамерами и пользователями. Это также может быть необходимо, если вы предприняли шаги, описанные выше — некоторый спам в комментариях почти неизбежен.

Этот подход предполагает создание проверки, которая происходит после отправки комментария, чтобы определить, является ли он спамом или допустимым сообщением. Конечно, вы можете просмотреть сообщения вручную, прежде чем они будут опубликованы, чтобы убедиться, что они не являются спамом. Но вы также можете автоматизировать процесс: создайте список ключевых слов, которые являются общими для спама, и проверьте каждый пост по этому списку. Затем вы можете отсеять любые комментарии, содержащие оскорбительные слова (которые могут включать такие термины, как виагра, азартные игры, покер, лекарства и т. Д.).

Это сравнение может быть выполнено различными способами и в нескольких точках во время обработки комментариев. Большинство языков программирования позволяют легко проверить строку для заданных ключевых слов. Перед выполнением сравнения убедитесь, что регистр строки также сравнивается путем преобразования строки в строчные или прописные буквы. Если найден комментарий, содержащий ключевые слова, спамер может быть предупрежден, а комментарий удален.

преимущества

Этот подход не требует от комментатора каких-либо дополнительных шагов, поэтому раздел комментариев остается простым и удобным в использовании.

Недостатки

Поскольку спаммер меняет слова, используемые спам-ботом, ваш список ключевых слов также должен обновляться. Этот метод также будет трудно реализовать, если спамер рекламирует продукты, относящиеся к вашему веб-сайту, ваш список запрещенных слов может помешать опубликованию законных комментариев.

Управление комментариями Спам

Спам всегда будет проблемой. Однако, хорошо спроектированный сайт, который принял во внимание обычные методы рассылки спама, сможет избежать большинства спама. Методы, которые мы здесь изучили, должны помочь владельцам сайтов эффективно бороться со спамом в комментариях.

В конечном итоге веб-мастеру необходимо адаптировать свои методы для борьбы со спамом на постоянной основе. Секрет успеха — постоянный мониторинг и адаптация к изменяющейся тактике спаммера.