Я публикую отчет о доле рынка браузеров каждый месяц или два. Я надеюсь, что вы найдете их интересными или, по крайней мере, наслаждаетесь новостями о снижении использования IE6. Однако они часто приводят к большему количеству вопросов, чем к ответу. Это моя попытка объяснить, как рассчитывается доля рынка браузеров. Это теоретический обзор, а не математический тезис, и методы расчета будут отличаться от системы к системе.
Ложь, чертова ложь и статистика
… а затем есть веб-статистика. Общеизвестно, что сбор информации из веб-браузеров затруднен — посмотрите, почему ваши статистические отчеты о сайте неверны . StatCounter и Google Analytics создают великолепные отчеты с цифрами в несколько десятичных знаков, но вы должны знать, что анализ основан на иерархии предположений.
Это не значит, что веб-статистика бесполезна. Они отлично подходят для определения тенденций, но попытки сопоставить результаты с действиями отдельных пользователей часто бесполезны.
Какая доля рынка не …
Прежде чем мы обсудим, какая доля рынка, возможно, лучше определить, что это не так:
1. Загрузка браузера
Количество загрузок браузера не является жизнеспособным методом сравнения доли рынка:
- Все операционные системы оснащены браузером по умолчанию, и многие пользователи никогда не будут рассматривать альтернативу.
- Вы можете загрузить браузер много раз, но никогда не устанавливайте его.
- Вы можете скачать браузер один раз и установить его на сотни компьютеров.
- Браузеры, которые реализуют автоматические обновления, будут в невыгодном положении.
2. Браузерные установки
Установки браузера также имеют недостатки:
- Вы никогда не можете использовать браузер, который поставляется с вашей ОС. IE установлен на всех ПК с Windows, но это не значит, что IE имеет такую же 90% долю рынка, как и сама Windows.
- Вы можете установить другой браузер и никогда не использовать его.
- Вы можете установить и удалить один и тот же браузер несколько раз.
Это не значит, что цифры бесполезны, но они не обязательно указывают на долю рынка.
Так что же такое доля рынка?
Первой причиной путаницы является то, что таблицы доли рынка показывают процент пользователей. В действительности доля рынка определяется по фактическому использованию браузера. Цифры являются вероятностями.
Предположим, что browserX занимает 50% рынка. Если вы исследуете случайное попадание файла на случайный веб-сайт, вероятность того, что browserX был использован 1 к 2. Неважно, смотрите ли вы случайное попадание, сеанс посетителя или отдельного пользователя — такая же вероятность будет применима.
Поскольку мы рассчитываем пропорции использования браузера, базовые данные не должны регистрировать отдельных лиц. Тем не менее, результаты сохраняют прямую связь с пользователями. Мы можем сделать вывод, что:
- каждый использует browserX в 50% случаев, или
- более реалистично, 50% пользователей все время используют browserX
Результат где-то между этими двумя крайностями. В конечном счете, это не имеет значения — мы анализируем схемы использования группы.
Как рассчитывается доля рынка
Когда вы посещаете веб-сайт, каждый запрос файла (попадание) регистрируется, и ваш браузер идентифицируется по строке агента пользователя, переданной в заголовке HTTP. По сути, если 50% запросов на попадание поступили от browserX в течение периода P, то на тот момент он занимал 50% рынка.
Реальность немного сложнее. Хиты файлов могут быть неоднозначными, поскольку разные браузеры могут загружать разные ресурсы, например, условные таблицы стилей IE или предварительное кэширование связанных страниц. Поэтому системы могут только анализировать фактический просмотр страницы или вносить другие корректировки.
Следующим важным соображением является размер выборки — сколько сайтов и посещений анализируются. Нет такого понятия, как «средний» сайт:
- SitePoint.com имеет техническую аудиторию, поэтому использование Firefox и Chrome выше, чем у других.
- аудитория оказывает влияние, т. е. Opera более популярна в Европе и России, чем в США.
- день и время влияют на модели использования. Например, использование IE обычно выше в рабочие дни в рабочие дни, чем по вечерам или выходным.
Статистические аномалии уменьшаются, если вы анализируете широкий спектр сайтов из разных стран. По сути, больше данных приводит к более точным показателям использования браузера. StatCounter анализирует трафик с 3 миллионов веб-сайтов по всему миру — это, кажется, хороший размер выборки.
Ах, но что если …
Теперь следует список часто задаваемых вопросов о доле рынка браузеров. Если я не ответил на ваш запрос, пожалуйста, оставьте комментарий ниже.
В: Использование интернета растет.
Количество интернет-пользователей увеличивается с каждым днем. Следовательно, доля рынка браузера может снизиться, а фактическое количество пользователей увеличится.
Умножьте количество веб-пользователей на пропорцию браузера, чтобы оценить изменения в населении… при условии, что вы сможете найти разумные показатели чистого использования.
В: Будут ли сеансы посетителя или пользователя более точными, чем попадания страниц / файлов?
Нет. Это не приведет к улучшению данных, потому что вы уменьшаете размер выборки и создаете неожиданные проблемы. Если бы у вас были только данные сеанса, 3 часа развлекательного просмотра на одном сайте равнялись бы 30 секундам просмотра рабочей темы. Так как многие люди используют IE на работе, он будет подвергаться несправедливой предвзятости по сравнению с другим браузером, используемым дома.
Помните, что мы анализируем использование браузера: нет необходимости понимать поведение отдельных пользователей.
В: Я использую более одного браузера. Я посчитал несколько раз?
Это не важно У людей часто бывают сложные схемы просмотра, например, вы можете использовать Firefox 80% времени, а Chrome — 20% времени. Это использование записывается; Если бы вы были единственным человеком, Firefox имел бы 80% рынка.
Q: Как насчет гиков, использующих сеть по 18 часов в день?
Доля рынка — это запись использования браузера. Тяжелый просмотр страниц пользователя имеет больший вес, чем кто-либо, использующий IE6 раз в месяц.
Однако, если предположить, что размер выборки достаточно велик, влияние привычек просмотра отдельных лиц или групп будет незначительным и не повлияет на результаты. На каждого гика или технофоба приходится тысячи людей, использующих сеть в течение часа или двух в день.
Q: Мой браузер использует неверную строку агента пользователя.
Он не будет определен правильно, но, опять же, вы находитесь в меньшинстве, и это вряд ли повлияет на результаты со значительным отрывом.
Вопрос: Насколько точны результаты для регионов или отдельных стран?
Меньший размер выборки приводит к менее надежным данным. Я бы больше верил в цифры только для США, чем в Антарктику.
Q: Статистика моего сайта отличается?
Они будут. Многие факторы влияют на использование браузера, и мало сайтов можно сравнить со средним показателем по миру. Всегда проверяйте свои собственные цифры в первую очередь.
Q: Я не верю ни одному из этих чисел!
Здоровая доза скептицизма полезна для вас. Слепое использование отчета без понимания основных данных или анализа опасно.
Скоро — Browser Trends, май 2011 г.