Встряхнуть Поиск

Индексирование выглядит лучше с людьми

Если вы читаете о поисковых системах, слово «алгоритм» выскочит на вас довольно быстро, возможно, с помощью MathML , просто чтобы убедиться, что непрофессионалы действительно ослеплены. Все виды знаний и загадок окружают алгоритм поиска Google. Между тем у IBM есть эта UIMA- вещь для действительно интеллектуального поиска.

Но сравните эти результаты поиска для «PHP SOAP» — http://del.icio.us/search/?all=php+soap и http://www.google.com/search?q=php+soap . Прямо сейчас Google возвращает первый результат как давно мертвый PHP SOAP Toolkit . В то же время восхитительно сначала дает мне этот урок: PHP Web Services без SOAP — как этот результат вычисляется с точки зрения релевантности?

Иными словами, насколько умным должен быть ваш алгоритм поиска, чтобы он мог возвращать результат типа «FatBoy Slim?!?» Ты прикалываешься, да? Сломанные ритмы — мертвый ребенок!

Как я (цинично) указал здесь , люди отлично подходят для построения индексов поисковых систем. Они самодостаточны, обильны, умны и распределены. Неважно, насколько умный ваш алгоритм — даже если вы можете сопоставить способность человека классифицировать, экономия от этого убьет вас.

Между тем, интересный момент о причинах без ведома здесь ;

блоггеры начинают получать больше трафика от Del.icio.us в любом случае

Это не значит, что «вкусный» собирается заменить Google — как я понимаю, «вкусный» — это инструмент от Nerds для Nerds — я не вижу концепции в ее нынешней форме, касающейся не-Nerds, пока она не станет возможной для « индексирование », чтобы быть легким для того, кто (активно) проводит только час в неделю в Интернете Но не в этом суть — мне интересно то, что индекс, созданный людьми, оказывается, по крайней мере, таким же хорошим, как один билд на машине, — восхитительный прорыв показал, что это можно сделать.

Распределение поиска

На параллельном пути, если вы будете охотиться за «распределенным поиском», вы увидите явление, похожее на поиск — зануды в поиске алгоритмов, позволяющих распределять гигантские поисковые индексы. Они застряли на проблеме того, как справиться с нехваткой ресурсов у сверстников.

Но думаю, что подобный «человеческий взлом» применим здесь — выбирая число, я бы предположил, что 90% + того, что ищет тот или иной человек, относится к той же основной теме — вещам, которые его интересуют. В большинстве случаев индивидууму нужен только индекс вещей, в которых он заинтересован. Это само по себе не решает магически все проблемы, но создает «самоорганизующиеся сообщества» типа P2P, и это не выглядит таким уж далеким.

Тем не мение. Просто пересказ того, что Web 2.0 уже говорит.

Встряхнуть Поиск

Категории

Последние статьи

Рефакторинг Hudson God Class

Альтернативы синтаксиса Java лямбда

Morphia и MongoDB: развивающиеся структуры документов

OpenShift Express: развертывание приложения Java EE (с поддержкой AS7)

Интеграция jqGrid, REST, AJAX и Spring MVC