Статьи

Google Reigns Supreme

Google сохраняет свое превосходство, несмотря на шум вокруг новых поисковых систем, пытающихся свергнуть его. Эти провайдеры подходят к поиску с разных точек зрения (семантическая, социальная, основанная на сообществе) и представляют свои результаты в свежих формах (дизайн, верстка, структура) в надежде, что их новый пакет будет больше привлекать массы. Однако очевидно, что доминирование в поиске связано не только с брендингом, популярностью и финансовой поддержкой, но и с релевантностью или внешним видом.

Средства массовой информации дают импульс, в то время как многие пользователи сети с нетерпением наблюдают за войной в поисковых системах, веря, что каким-то образом один из новых детей окажется достойным Google . Хотя на первый взгляд эти объекты выглядят многообещающе, при более тщательном изучении выявляется их неполноценность перед Google.

Фраза убийцы Google по- прежнему вызывает реакцию, которая обеспечивает высокий трафик, и трафик является источником жизненной силы любой онлайн-публикации. Все действия Google отслеживаются, анализируются и анализируются. Поисковые эксперты, SEO-гуру, аналитики, веб- пророки , технические писатели и даже обычные блоггеры с огромным энтузиазмом освещают все новости в Google. Тем не менее, очень немногие из этих аналитиков Google на самом деле знают, о чем пишут. В своем невежестве средства массовой информации наделяют Google еще большей властью.

Почти все последние статьи о поисковых системах и убийцах Google имели два ключевых эффекта:

  • вводит общественность в заблуждение, полагая, что эти новые поисковые системы разработали новые технологии и алгоритмы, чуждые Google
  • понижение доверия к недавно созданным поисковым системам (например, Cuil )
Сила великана, полученная из невежества

Что происходит, когда авторы проводят ограниченное исследование для статей, которые они публикуют в Интернете? Каков эффект, когда они делают утверждения, основанные на личном восприятии? Насколько влиятельна редакционная статья, заполненная предвзятыми терминами в поисковом рейтинге страницы?

В крайних случаях популярные блоггеры осуждаются их читателями — при условии, что читатели знают тему лучше, чем сами авторы. Здесь писатели должны просто кусать пулю. Формальное признание ошибки — идеальный подход, но не все блоггеры приходят чистыми. В альтернативных сценариях пользователи страдают. Они введены в опции поисковых систем, которые обслуживают определенные ниши , но информация часто усекается и неточная. А некоторые провайдеры поиска даже обманывают — например, эта исламская поисковая система , созданная с единственной целью получения дохода с помощью программы пользовательского поиска Google (с интегрированной AdSense).

В обоих случаях Google выигрывает, и компания может извлечь выгоду только из такого импульса. Пользователи могут тестировать другие поисковые системы только для того, чтобы прийти к выводу, что, в конце концов, Google обеспечивает лучшие результаты. Поисковые стартапы получают некоторые преимущества от кратковременного гудения — трафик, ссылки, бесплатный PR (отрицательный или положительный) — только о котором вскоре забывают. Чтобы оставаться в центре внимания, им необходимо постоянно добавлять новые функции и функции, чтобы привлечь внимание прессы. Тем временем, Google следит за их ходом; Реакции и отклики лидера рынка настолько утончены, что почти никто не понимает, что это оружие Google.

Финансовая сила вне поражения

Лично я убежден, что главная причина, по которой Google продолжает оставаться королем поиска, заключается в финансовой. Google — это денежный автомат. Они используют деньги, чтобы заработать больше денег. Они инвестируют во все возможные ниши, чтобы расширить свое веб-доминирование. Они покупают своих конкурентов (или ближайшую вещь, чтобы быть конкурентом) по тем же причинам. То, что делает Google … по уважительной причине.

Microsoft, очевидно, обладает большей финансовой мощью, чем Google, но их маркетинговые стратегии не такие умные. Кроме того, их главной заботой остается рабочий стол — поиск идет вторым. Чтобы победить Google, потребовалось бы больше ресурсов, чем Microsoft готова потратить. Приобретение Powerset было разумным ходом, но на самом деле это не шаг, который «усилит мощность» Live в иерархии поиска. Почему? Потому что Microsoft просто купила технологию, похожую на ту, что уже есть у Google.

Сила бренда силы

Google является брендом номер один в мире . Многие компании пытаются свергнуть его, но, как вы видите, поисковый гигант представляет угрозу и для традиционного бизнеса — конечно, на разных уровнях.

Таблица 1. Топ 10 самых сильных брендов

Ранг марка Ценность бренда Изменение стоимости бренда
1 Google 86057 30%
2 GE (General Electric) 71379 15%
3 Microsoft 70887 29%
4 Кока-Кола 58208 17%
5 China Mobile 57225 39%
6 IBM 55335 65%
7 яблоко 55206 123%
8 Макдоналдс 49499 49%
9 Nokia 43975 39%
10 Marlboro 37324 -5%

Источник: Millward Brown Optimor (включая данные от Brandz, Datamonitor и Bloomberg)

Каждый день мы видим силу самого влиятельного бренда в мире над потребителями. Что бы ни делала Google, СМИ освещают это и независимо от того, какой новый сервис или инструмент компания выпустит завтра, всегда будет достаточно сторонников (или поклонников), чтобы обеспечить быстрый охват рынка и распространение без прецедента .

Новые поисковые технологии? Неа …

Как я уже говорил выше, приобретая Powerset, Microsoft фактически приобрела конкурентоспособную технологию поиска. Согласно множеству статей, распространяемых в средствах массовой информации, Powerset «создает семантическое представление, анализируя каждое предложение и извлекая его значение». Это также определяется как семантический поиск .

Powerset не первый в индустрии поиска, который будет назван семантической поисковой системой. У нас также есть hakia , Swoogle , ZoomInfo и многие другие. Как и Powerset, эти поисковые системы пытаются предоставлять результаты, основываясь на значении веб-страниц, которые они индексируют. Их разработчики предполагают, что Google основывает свои результаты на ключевых словах. Даже заявления своих представителей заставляют нас поверить, что Google не использует семантические алгоритмы:

«Поскольку мы обрабатываем так много данных, у нас много контекста вокруг таких вещей, как аббревиатуры. Внезапно поисковая система кажется умной, как будто она достигла такого семантического понимания, но на самом деле это не так », — Марисса Майер.

Правда в том, что Google использует семантические алгоритмы и является семантической поисковой системой . Если вам нужно больше доказательств, вот патент Google, который проливает свет на этот вопрос.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Один аспект настоящего изобретения направлен на способ идентификации семантических единиц в поисковом запросе. Способ включает идентификацию документов, относящихся к запросу, путем сопоставления отдельных поисковых терминов в запросе с индексом корпуса и генерацией подстрок запроса. Для каждой из сгенерированных подстрок рассчитывается значение, которое относится к части идентифицированных документов, которая содержит подстроку. Семантические единицы выбираются из сгенерированных подстрок на основе рассчитанных значений.

Второй аспект настоящего изобретения направлен на способ определения местоположения документов в ответ на поисковый запрос. Способ включает в себя создание списка релевантных документов на основе отдельных поисковых терминов запроса и определение подмножества документов, которые являются наиболее релевантными документами из списка релевантных документов. Подстроки идентифицируются для запроса, и генерируется значение, относящееся к части подмножества документов, которая содержит подстроку. Семантические единицы выбираются из сгенерированных подстрок на основе рассчитанных значений. Наконец, список соответствующих документов уточняется на основе семантических единиц.

Третий аспект настоящего изобретения направлен на сервер, который включает в себя процессор, базу данных и память. Память включает в себя компонент ранжирования, сконфигурированный для возврата списка документов, упорядоченных по релевантности в ответ на поисковый запрос, и компонент локатора семантических единиц, который определяет местонахождение семантических единиц в поисковых запросах, введенных пользователем, на основе заранее определенного числа наиболее релевантных документов в список, возвращаемый компонентом ранжирования.

Аналитики Powerset, hakia и co утверждают, что системы, используемые настоящими семантическими поисковыми системами, фактически основаны на обработке естественного языка (NLP). Но как эти движки обрабатывают данные? Один из возможных ответов приходит от Microsoft :

Понимание »языка означает, помимо прочего, знание того, какие понятия обозначает слово или фраза, и умение осмысленно связывать эти понятия вместе. Ирония в том, что естественному языку, системе символов, которую людям легче всего изучать и использовать, труднее всего освоить компьютер […]

Проблемы, с которыми мы сталкиваемся, проистекают из весьма неоднозначной природы естественного языка. Как говорящий по-английски, вы без труда понимаете предложение типа «Летающие самолеты могут быть опасными». Тем не менее, это предложение создает трудности для программы, в которой не хватает ваших знаний о мире и вашего опыта работы с лингвистическими структурами. […]

Мы решаем эти проблемы, используя сочетание инженерно-технических и статистических / машинных методов обучения для устранения неоднозначности и реагирования на ввод естественного языка. Наша работа имеет значение для таких приложений, как критический анализ текста, поиск информации, ответы на вопросы, обобщение, игры и перевод.

Еще лучшее объяснение можно найти в Википедии , в статье, которая подробно описывает конкретные проблемы и подзадачи, поднятые НЛП .

Независимо от того, сколько определений мы читаем, вывод один и тот же: НЛП остается мечтой, которая, вероятно, никогда не будет реализована в глобальном масштабе. У Google есть финансовое влияние, чтобы нанимать лучших инженеров для разработки механизма НЛП, и они, вероятно, уже работают над этим за кулисами. Вспомните, что сказал Ларри Пейдж в прошлом году на ежегодной конференции Американской ассоциации развития науки:

У нас есть люди в Google (которые) действительно пытаются создать искусственный интеллект и делать это в больших масштабах. Это не так далеко, как думают люди.

Что он имел в виду? Поскольку некоторые называют НЛП искусственным интеллектом, можно ли предположить, что Пейдж фактически объявляет, что Google работает над поисковой системой обработки естественного языка?

Совершенно ясно, почему Powerset и hakia не определяют себя как поисковые движки на естественном языке, предпочитая вместо этого метку семантической поисковой системы. В конце концов, они индексируют, что означает то же самое, что и Google — что не вызывает особого шума из этого достижения.

Относительные Мозги и Браун

Никто никогда не мог предположить, что у конкурентов не хватает умственных способностей, поскольку их инновации и полномочия демонстрируют значительную изобретательность и качество. Тем не менее, несколько миллионов долларов в руках блестящих людей в конечном счете не смогут свергнуть левиафана с миллиардами за столь же блестящими умами.

Теперь, когда Powerset поддерживается Microsoft и ее неограниченными ресурсами, Google может сделать паузу для развития своих заслуг. Тем не менее, паритет Google даже с лучшим конкурентом в сочетании с его огромным лидерством в доле рынка все еще представляет собой саммит, который, возможно, недостижим.

Потому что Google работает в тишине — постоянно совершенствуют свои алгоритмы и никогда не раскрывая слишком много о своей технологии — это трудно сказать, кто или что будет свергнут в настоящее время бесспорный король поиска. Люди, кажется, гораздо меньше озабочены актуальностью и внешним видом организации, чем Google, как знакомой, популярной, находчивой и эффективной поисковой системой. На мой взгляд, если Google упадет, это будет не из-за новой поисковой системы; более вероятно, что Империя упадет изнутри из-за собственных ошибок, непоправимых просчетов и плохих инвестиций.