Одним из наиболее важных аспектов управления сайтом является анализ трафика. Если вы не знаете, откуда приходят ваши посетители — и в каких количествах — вы не сможете эффективно продвигать свой сайт или оценить эффективность любых текущих усилий по продвижению.
Проверка статистики для вашего сайта (ов) должна быть ежедневной деятельностью, и если вы еще этого не делаете, сейчас самое время начать!
Дорожный жаргон
Существует некоторая путаница в отношении различных терминов, используемых для описания трафика на сайте. Неправильное использование этих терминов часто приводит к недопониманию, поэтому важно, чтобы вы знали правильные слова и понятия. Наиболее распространенные термины, которые вы найдете, включают:
Хит
HTTP-запрос на ваш сервер. «Хит» часто используется для описания впечатления, и это неверно. На ваш сервер делается запрос не только для каждого HTML-файла, но также для каждого изображения, каждого фильма и каждого включенного файла JavaScript или CSS. Если вы используете фреймы, то один фактический просмотр страницы может привести к нескольким попаданиям, так как несколько файлов составляют эту одну страницу. При каждом запросе ваш сервер записывает другую запись в свои файлы журналов, поэтому, когда программы анализа журналов читают эти файлы, они сообщают об общем количестве обращений. Люди часто думают, что это общее количество просмотров страниц, и они излишне возбуждаются — не попадайтесь в ту же ловушку.
Впечатление
Просмотр страницы. Такое впечатление возникает, когда кто-то просматривает одну из ваших HTML-страниц. Если вы используете фреймы, вы должны рассчитывать показы только на страницах основного контента, а не на тех страницах, которые вы используете для фреймов меню или заголовка. Еще один способ взглянуть на это — подсчитывать показы только на страницах с рекламой.
уникальный
Просмотр страницы уникальным человеком в течение 24 часов. Уникальность обычно измеряется путем определения IP-адресов каждого посетителя вашего сайта. Однако некоторые службы, в частности AOL, отправляют всех своих членов через прокси-серверы, поэтому тысячи или миллионы людей могут использовать один и тот же IP-адрес. Обычно это означает, что если вы записываете количество уникальных пользователей, просматривая показы по уникальным IP-адресам, ваше фактическое число будет немного выше, чем указано в журналах. Лучшим способом измерения уникальных значений будет составное уникальное значение, состоящее из IP-адреса, браузера или пользовательского агента и операционной системы.
Referrer
Страница, которая ссылается на ваш сайт. Это не обязательно должна быть настоящая страница: это может быть, например, набор результатов поисковой системы. Посмотрев на ваших рефералов, вы узнаете, кто ссылается на ваш сайт.
Пользовательский агент
Это относится к программному обеспечению, используемому для доступа к вашему сайту. Иногда известный как «браузер» или «клиент», пользовательский агент может описывать сценарий PHP, браузер, такой как Internet Explorer, или паук поисковой системы, такой как GoogleBot. Если вы сможете определить, какое программное обеспечение используется для доступа к вашему сайту, вы сможете определить, злоупотребляют ли пользователи им, и когда поисковые системы последний раз сканировали ваши страницы.
Счетчики и трекеры
В начале жизни Сети счетчики были довольно популярны. Счетчик — это простой скрипт, который записывает количество посетителей сайта в текстовом файле или базе данных, а затем отображает общее количество, в текстовом или графическом виде, на веб-сайте. Вы все еще найдете их на некоторых любительских страницах, но по большей части их использование прекратилось — в первую очередь потому, что владельцы сайтов хотели получить более сложную информацию об их трафике, а также потому, что эти счетчики стали рассматриваться как непрофессиональные.
В настоящее время большинство профессиональных или коммерческих сайтов используют программное обеспечение для отслеживания. Программное обеспечение для отслеживания говорит вам больше, чем просто количество посетителей — оно может разбить статистику посетителей по дате, времени, браузеру, просмотренной странице, рефереру и многим другим значениям. Трекеры названы так потому, что они могут более или менее подробно описать путь, по которому посетитель проходит через ваш Веб-сайт, поэтому они делают больше, чем просто считают ваш трафик: они отслеживают его. Вы можете выбрать один из трех основных типов программного обеспечения для отслеживания — давайте рассмотрим ваши варианты.
Три варианта программного обеспечения для отслеживания
1. Услуги удаленного слежения
Самый простой тип отслеживания для установки и, следовательно, самый популярный, это дистанционное отслеживание. Эти службы отслеживания содержат все сценарии записи трафика и отчеты на своих собственных серверах, в которые вы можете войти, чтобы проверить свою статистику. Сама запись осуществляется через JavaScript, который размещен на вашей странице (ах).
Несмотря на простоту использования, этот тип обслуживания является худшим по ряду причин. Часто это неточно: поскольку запись трафика основана на подключении к удаленному серверу (серверу, который, вероятно, завис), многие из ваших посетителей могут не записаться, потому что запросы просто истекают. Кроме того, зависимость сервисов от javascript означает, что он не может записывать посещения пользователей, у которых не включен javascript. Это большая проблема — пауки поисковых систем не используют javascript, поэтому эти сервисы упускают из виду одно из ключевых преимуществ анализа вашего трафика (зная, когда вас опрашивают). Кроме того, удаленные трекеры часто требуют, чтобы вы размещали на своем сайте кнопку или изображение в обмен на бесплатное использование их сервиса, что не идеально для большинства владельцев сайтов.
Поэтому старайтесь избегать использования этих сервисов, если у вас нет возможности или опыта для выполнения сценариев отслеживания любого вида на вашем собственном сервере.
Примеры:
2. Регистрация программ
Это мой предпочтительный метод анализа трафика. Программы ведения журналов — это сценарии, которые вы устанавливаете на своем сервере, которые затем генерируют как файлы журналов (в виде простых файлов или базы данных), так и отчеты. Я предпочитаю этот тип программ системам анализа журналов (обсуждаемых ниже), поскольку программы ведения журналов предоставляют владельцу сайта больше контроля — вы сами решаете, что регистрируется, а что нет, и отслеживаете только те страницы, которые хотите отслеживать.
Недостатком этого является то, что вы должны поддерживать свои файлы журналов, и если ваш сайт популярен, они могут стать довольно большими. На одном из моих сайтов (который регистрирует более миллиона показов в месяц) файл журнала увеличивается примерно на 15 Мб в день, поэтому я обычно чередую его каждые 3 дня. Теперь, если вы используете программу анализа журналов, вы все равно будете бороться с большими файлами журналов, однако это файлы журналов вашего сервера, и, таким образом, они автоматически поворачиваются и поддерживаются для вас.
Еще одна добавленная функция этого типа программ заключается в том, что вы можете иногда использовать их для отслеживания ссылок с вашего сайта, чтобы вы могли точно определить, какой объем трафика вы отправляете при обмене ссылками.
Примеры:
3. Программы анализа логов
Это программы, которые анализируют журналы вашего сервера, а затем создают соответствующие отчеты о трафике. Некоторые могут включать в себя расширенные фильтры, которые позволяют вам указать, что именно вы хотите сообщить, но большинство просто сообщит обо всем в файлах журнала — обычно покрывая общее количество просмотров, показов и уникальных. Конечно, качество создаваемых отчетов будет зависеть от того, какое программное обеспечение вы на самом деле используете.
Некоторые анализаторы журналов бесплатны и поставляются с предустановленными на многих учетных записях хостинга, в то время как другие могут стоить немалых денег.
Примеры:
Что делать каждый день
После того, как вы настроили свое программное обеспечение для отслеживания, вы можете начать его использовать, но что вы должны искать? Есть множество вещей, которые вы должны проверять каждый день:
Источники
Первое, что вы должны проверять ежедневно, это ваши рефереры. По личному опыту я знаю, что если у вас есть популярный сайт, ваши источники могут исчисляться тысячами, поэтому каждый день читать этот список может быть непростой задачей, но это обязательно!
Когда вы смотрите на своих рефералов, обратите внимание на две вещи:
- где в поисковых системах посетители находят ваши списки, и
- на каких других веб-страницах посетители размещали ссылки на ваш сайт.
В частности, это поможет вам проверить, поддерживаете ли вы свою позицию в поисковой системе, а также определить новые сайты, которые ссылаются на вас. Когда я обнаруживаю, что новый сайт ссылается на один из моих, я отправляю их сайт в Google, чтобы он мог просматривать их сайты, видеть ссылку и повышать рейтинг популярности моих ссылок. Некоторые люди не советуют делать это на том основании, что неэтично размещать сайт другого человека в поисковой системе, но я не согласен.
Раньше некоторые поисковые системы запрещали сайты, которые были переданы слишком часто, однако Google никогда этого не делал и до сих пор не делает. Если страница уже была отправлена, ваш запрос будет просто проигнорирован. Поскольку ничего плохого не случится при отправке чужой страницы, я не считаю эту практику неэтичной, тем более что многие люди, владеющие этими страницами, могут не знать, как разместить свой сайт. Конечно, вы должны принять собственное решение по этому вопросу.
IP-адреса и агенты пользователей
Второе, что вам нужно проверить, — это IP-адреса и пользовательские агенты ваших посетителей. Эта информация скажет вам две вещи:
- Когда поисковая система пауков вашего сайта.
- Если кто-то злоупотребляет вашим сайтом.
Первый момент важен, потому что, если вы не знаете, когда ваш сайт попал в атаку, вы не сможете эффективно устранить неполадки в списках поисковых систем (например, если они выглядят устаревшими или вообще не отображаются). Многие люди будут помнить, когда они подчинялись поисковым системам, но если вы спросите их, когда они были опубликованы, у них нет подсказки. Знание того, когда поисковые машины и когда они обновляются, позволит вам предсказать, когда ваши списки изменятся.
Второй момент важен, потому что есть много людей, которым нечего делать, и есть много способов, которыми они могут злоупотреблять сайтом. Одним из способов является написание сценария, который срывает контент с веб-сайта и отображает его самостоятельно.
Например, есть сценарии, которые копируют заголовки новостей с таких сайтов, как CNN.com. Затем владелец сайта отображает заголовки на своем сайте вместе со ссылкой на CNN. Хотя технически неправильно копировать их заголовки, они легко прощаются более крупными игроками, поскольку владельцы сайтов используют заголовки для ссылок на них (эффективно отбрасывая трафик на свой сайт).
Однако так же легко написать скрипт, который крадет статьи с сайта и отображает их самостоятельно. Если вы стали жертвой любого из этих злоупотреблений, вы обычно можете узнать об этом в своих журналах. Обычно будет большое количество запросов от их IP-адреса (которые должны быть разрешены к веб-серверу), а также чрезмерное количество обращений от пользовательского агента под названием «PHP», «Perl» или другого языка сценариев. Иногда люди скачивают весь ваш сайт и затем публикуют его на своем сервере, однако иногда забывают перекодировать некоторые ссылки, что приводит к попаданию их версии вашего сайта на ваш оригинальный сайт. Один советник SitePoint Forum недавно обнаружил, что именно это происходит при тщательном мониторинге его рефералов.
На тему загрузки всего сайта, есть также рипперы сайтов. Часто называемые «автономными браузерами», во многом так же, как некоторые троянцы называются «инструментами удаленного администрирования». Это программы, которые можно использовать для загрузки всего сайта, которые не только крадут ваш сайт (дизайн, контент и т. Д.), Но и может привести к сбою или серьезно замедлить работу сервера. В зависимости от размера вашего сайта, эти программы могут быть обнаружены по IP-адресам — если вы видите сотни или тысячи показов с одного адреса, скорее всего, это одна из этих программ. Вы также можете искать их пользовательских агентов — некоторые из наиболее популярных — это Wget, Teleport, HTTrack и Web Reaper. Следует отметить, что Wget — это действующая программа, используемая на серверах Unix для загрузки файлов, таких как исправления или драйверы. Однако, если вы не предоставите такие загрузки на своем сайте, любой, кто использует этот агент на вашем сайте, вероятно, будет воровать.
Еще одной формой злоупотребления сайтом является сбор электронных писем с сайта — это особенно важно, если вы пользуетесь сайтом сообщества, где пользователи часто публикуют свои адреса электронной почты. Как и в случае с рипперами сайтов, вы часто можете идентифицировать харвестеры электронной почты через их пользовательский агент.
Последний метод злоупотребления сайтом — блокировка рекламы сайта. Некоторые считают это правом серфера, однако я чувствую, что это воровство. Веб-мастер размещает рекламу, ожидая, что пользователи будут просматривать их вместе с контентом, который они просматривают бесплатно. Если посетители блокируют рекламу, то с этической точки зрения я не думаю, что они вообще должны посещать сайт. Некоторые веб-мастера перенаправляют людей, использующих программы блокировки рекламы, на страницу, которая просит их заплатить за доступ к сайту, и этот подход отражает то, что чувствуют веб-мастера: вы либо платите своим кошельком, либо зрачками. Как и в вышеупомянутых примерах, это можно обнаружить с помощью мониторинга пользовательского агента.
После того, как вы определили IP-адреса или пользовательские агенты тех, кто злоупотребляет вашим сайтом, вы можете запретить их (используя .htaccess, если вы запускаете Apache), но полное объяснение этого, очевидно, выходит за рамки этой статьи.
Другая статистическая информация
Существует много информации, которую вы можете получить из своей статистики в дополнение к тому, что было упомянуто до сих пор. Эта информация обычно полезна, когда вы пытаетесь продать рекламу или пересмотреть свои рекламные усилия.
Демография
Статистика вашего сервера может предоставить ограниченную демографическую информацию, которая полезна как для разработки вашего сайта, так и для привлечения рекламодателей. Например, изучая статистику по операционным системам или пользовательским агентам, вы можете определить, используют ли ваши посетители ПК или Mac, Internet Explorer или Netscape. Некоторое программное обеспечение также может предоставлять вам географическую статистику путем определения IP-адреса ваших посетителей. Хотя эти статистические данные не являются наиболее точными (не всегда возможно точно определить страну происхождения пользователя), эта информация может быть полезна при представлении пакетов потенциальным рекламодателям или даже при принятии решения о том, следует ли региональные изменения на вашем сайте — добавьте контент на другом языке, например.
Статистика поисковой системы
В дополнение к поиску ваших рефералов, чтобы убедиться, что вы сохраняете свои позиции в поисковых системах, вы можете иногда проводить более подробный анализ, чтобы сравнить объем трафика, который вы получаете от различных поисковых систем. Это может помочь вам определить, есть ли конкретный двигатель, который работает плохо для вас. Затем вы можете определить, с какими реферерами вам нужно работать — чтобы увеличить объем трафика, который они вам отправляют (хотя вы должны помнить, что воспринимаемые «более низкие уровни трафика» могут быть результатом того, что поисковая система менее популярна, чем другие, которые вы трек).
Поведение посетителя
Вы также можете время от времени анализировать поведение посетителей. Например, быстрый просмотр статистики может указать на страницы, которые посетители используют для входа и выхода с вашего сайта, что, в свою очередь, может сказать вам, какие части вашего сайта наиболее популярны, а какие разделы требуют работы.
Если ваш сайт охватывает несколько тем, этот анализ может также помочь вам определить темы, которые больше всего интересуют ваших пользователей. Например, если вы просматриваете оборудование Mac и ПК, и большинство ваших посетителей читают обзоры Mac, то вы можете сосредоточиться на разделе Mac и вывести информацию о ПК (или превратить ее в отдельный сайт). Но эта информация не только удобна для ознакомления, но и полезна при работе с потенциальными рекламодателями. Кроме того, если вы запускаете сайт на основе сообщества, эти данные могут указывать, сколько у вас может быть скрытников, а если вы используете сайт на основе статей, статистика может указывать, какие статьи или авторы являются наиболее популярными.
Модели трафика с течением времени
Другие хорошие статистические данные, за которыми нужно следить, — это те, которые измеряют структуру трафика с течением времени. Они могут указывать не только на время, когда ваш сайт получает наибольшее количество трафика, но также могут дать реальное представление о вашей аудитории — четкое представление об использовании ваших посетителей с течением времени может подсказать причины, по которым они посещают ваш сайт.
Например, я заметил, что трафик на мой образовательный сайт тесно связан с учебным годом, поэтому в выходные, праздничные дни и летом мой уровень трафика падает. Эта информация свидетельствовала о том, что моими ключевыми пользователями были студенты, что позволило мне соответствующим образом ориентировать свою рекламу. Еще одним ключевым преимуществом знания того, когда ваш сайт получает наибольшее количество трафика, является то, что вы можете запланировать время простоя (для обновлений и обслуживания) в часы, когда использование минимально.
Заворачивать
Эта статья была задумана как учебник по анализу веб-трафика, но для получения дополнительной информации по некоторым из упомянутых здесь тем перейдите по ссылкам ниже:
Список пользовательских агентов поисковой системы:
Как забанить плохих людей / роботов: