Как широко сообщалось и обсуждалось , Google зарегистрировал торговую марку для «TrustRank».
За торговой маркой мы находим исследовательскую работу от обычных подозреваемых в проекте Стэнфордских цифровых библиотек. В этой статье обсуждается метод отсеивания спама из результатов поиска с использованием «начального набора» надежных веб-сайтов.
TrustRank, как описано в статье, использует метод, аналогичный алгоритму PageRank, чтобы определить, насколько надежным является данный веб-сайт или, другими словами, насколько вероятно, что сайту можно доверять.
Сообщество SEM всегда заинтересовано, когда поисковая система подает заявку на патент или товарный знак, приобретает компанию с интересной технологией или когда человек, удаленно связанный с поисковой системой, публикует исследовательскую работу.
Важно сохранять представление об этих вещах, потому что все основные поисковые системы платят многим людям за исследования и изобретения. То, что патент был подан или получен, не означает, что он автоматически переходит в поисковую систему, реализующую патент в своих основных результатах поиска.
TrustRank, кажется, немного отличается, потому что торговые марки на самом деле должны быть использованы для поддержания. Я слышал аргумент, что Google должен планировать использовать TrustRank, если они зарегистрировали товарный знак. Означает ли это, что Google будет реализовывать что-то вроде алгоритма TrustRank, описанного в этой статье? Возможно, или они могут просто рисковать, решая, что делать.
В любом случае, такие инновации, как TrustRank, будут играть важную роль в будущем веб-поиска. Независимо от того, используют ли поисковые системы вручную отредактированный «начальный список» «хороших» веб-сайтов, отзывы пользователей или другие средства, у всех поисковых систем есть сильный стимул уменьшить количество спама в своих результатах поиска.
Поскольку все остальные размышляют о том, как Google может реализовать TrustRank, я выброшу одну идею. Конечно, это может быть плохой идеей. Я позволю тем, кому действительно приходится иметь дело с практической реализацией, решать …
Как обсуждалось в SEM Kit SitePoint (об этом вы можете прочитать в главе с примером), алгоритм PageRank моделирует «случайного веб-серфера», которому иногда надоедает его случайный щелчок и он начинается с новой страницы. Вероятность того, что нашему случайному серферу «надоест», представлена в алгоритме PageRank как «фактор демпфирования».
Одним из возможных способов реализации TrustRank без отбрасывания PageRank является настройка коэффициента демпфирования на основе «доверия», которое мы имеем на определенной веб-странице. Если у вас низкая степень доверия, то отрегулируйте коэффициент демпфирования, увеличивая вероятность того, что нашему случайному пользователю будет «скучно» на этой странице. Это будет означать, что менее доверенные страницы будут передавать меньше PageRank остальной части сети — не наказывая сайты, на которые они ссылаются, а просто уменьшая выгоду от таких ссылок, включая внутренние ссылки внутри самого сайта.
Что на самом деле будет делать Google? Ваши предположения так же хороши, как и мои, если только вы не один из тех, кто считает, что они фактически реализуют каждый процесс, который они запатентовали.
Следите за обновлениями, смотрите это место, чтобы получить больше удовольствия и игр с патентами, алгоритмами, исследовательскими работами и другими удивительными доказательствами.