Статьи

Встряхнуть Поиск

Индексирование выглядит лучше с людьми

Если вы читаете о поисковых системах, слово «алгоритм» выскочит на вас довольно быстро, возможно, с помощью MathML , просто чтобы убедиться, что непрофессионалы действительно ослеплены. Все виды знаний и загадок окружают алгоритм поиска Google. Между тем у IBM есть эта UIMA- вещь для действительно интеллектуального поиска.

Но сравните эти результаты поиска для «PHP SOAP» — http://del.icio.us/search/?all=php+soap и http://www.google.com/search?q=php+soap . Прямо сейчас Google возвращает первый результат как давно мертвый PHP SOAP Toolkit . В то же время восхитительно сначала дает мне этот урок: PHP Web Services без SOAP — как этот результат вычисляется с точки зрения релевантности?

Иными словами, насколько умным должен быть ваш алгоритм поиска, чтобы он мог возвращать результат типа «FatBoy Slim?!?» Ты прикалываешься, да? Сломанные ритмы — мертвый ребенок!

Как я (цинично) указал здесь , люди отлично подходят для построения индексов поисковых систем. Они самодостаточны, обильны, умны и распределены. Неважно, насколько умный ваш алгоритм — даже если вы можете сопоставить способность человека классифицировать, экономия от этого убьет вас.

Между тем, интересный момент о причинах без ведома здесь ;

блоггеры начинают получать больше трафика от Del.icio.us в любом случае

Это не значит, что «вкусный» собирается заменить Google — как я понимаю, «вкусный» — это инструмент от Nerds для Nerds — я не вижу концепции в ее нынешней форме, касающейся не-Nerds, пока она не станет возможной для « индексирование », чтобы быть легким для того, кто (активно) проводит только час в неделю в Интернете Но не в этом суть — мне интересно то, что индекс, созданный людьми, оказывается, по крайней мере, таким же хорошим, как один билд на машине, — восхитительный прорыв показал, что это можно сделать.

Распределение поиска

На параллельном пути, если вы будете охотиться за «распределенным поиском», вы увидите явление, похожее на поиск — зануды в поиске алгоритмов, позволяющих распределять гигантские поисковые индексы. Они застряли на проблеме того, как справиться с нехваткой ресурсов у сверстников.

Но думаю, что подобный «человеческий взлом» применим здесь — выбирая число, я бы предположил, что 90% + того, что ищет тот или иной человек, относится к той же основной теме — вещам, которые его интересуют. В большинстве случаев индивидууму нужен только индекс вещей, в которых он заинтересован. Это само по себе не решает магически все проблемы, но создает «самоорганизующиеся сообщества» типа P2P, и это не выглядит таким уж далеким.

Тем не мение. Просто пересказ того, что Web 2.0 уже говорит.