Статьи

Почему RDFa является единственным форматом веб-масштабируемых метаданных для поисковых систем следующего поколения

Yahoo! скоро запустит их поисковую систему следующего поколения под названием SearchMonkey . Это означает, что разработчики контента имеют в своем арсенале новый мощный инструмент. То, что раньше было почти невозможно. Вот быстрый предварительный просмотр от Yahoo!

поиск 1.0

поиск следующего поколения

Больше не зависит от Google

Вам больше не нужно полагаться на добрые дела Google (и их умных людей), чтобы понять содержание, над которым вы работали. Вы можете явно указать, что вы имели в виду, без двусмысленности.

Я собирался написать этот пост через несколько дней, но пост на OpenBible.info заставил меня помочь — спасибо за это 🙂

Yahoo! На прошлой неделе было объявлено о начале индексации семантических данных , включая поддержку определенных микроформатов.

Библия не является одним из тех микроформатов. Должны ли сторонники Библия в лоббировании Yahoo! для индексации Bibleref, или Библия должна изменить свой синтаксис, чтобы он был совместим с RDFa или другим стандартом семантической сети?

….

Так что же делать сторонникам Библерефа? Возможно, мы сможем убедить Yahoo! индексировать Библереф, придавая ему силу, необходимую для взлета. Однако я бы не ожидал, что Yahoo! чтобы хорошо понимать данные, отчасти из-за слабости стандарта (что я считаю хорошей вещью). И если Yahoo! не понимает это хорошо, тогда результаты поиска на основе Bibleref не будут очень качественными. Но многое зависит от того, как Yahoo! выставляет данные. (И они могут даже не захотеть индексировать Библия.)

RDFa

Другая возможность — изменить Bibleref на совместимость с RDFa , новым стандартом, который Yahoo! действительно понимает …

Они объяснили это лучше, чем я! Хорошие люди, работающие над Библия, сейчас находятся в ситуации, когда я верю, что многие, многие из вас скоро будут.

Вопрос в 64 000 долларов

//en.wikipedia.org/wiki/The_$64,000_Question

Как мы публикуем нашу интеллектуальную информацию в формате, понятном для Yahoo! SearchMonkey и другие поисковые системы следующего поколения? Как вы получаете ваши ценные метаданные там, на новой границе Веба Связанных Данных / Семантической сети?

В настоящее время существует два основных варианта: RDFa и микроформаты . Но, конечно, все не так просто.

Проблема с микроформатами

Основная проблема с микроформатами состоит в том, что каждый раз, когда создается новый, поисковому индексатору необходимо разработать собственный экстрактор, чтобы понять смысл микроформата. Вот почему Yahoo microsearch индексирует только 3 наиболее популярных формата, и поэтому при запуске SearchMonkey он будет индексировать только 5 из 20, перечисленных на главной вики-странице и 74 на исследовательской странице.

Это означает, что если вы используете какой-либо из 94 перечисленных микроформатов, SearchMonkey увидит только 5 из них .

Есть и другие проблемы, которые ранее были отмечены другими. Сложно смешивать и сочетать разные микроформаты; это накладывает большое ограничение на гибкость компоновки. Нет простого способа проверить вашу работу . Использование микроформатов также вызывает обеспокоенность по поводу доступности .

В этом и заключается проблема с микроформатами. Без базовой абстрактной модели данных валидация становится чем-то похожим на то, чтобы отойти назад, глядя на подержанный автомобиль, выбить шины, сделать вывод: «Да, выглядит хорошо», а затем передать источник денежных средств.

Что делать поисковой системе?

Так что, как поисковая компания, что вы предпочитаете? Напишите ОДИН анализатор RDFa и примите ВСЕ метаданные, созданные с помощью RDFa. Или написать новый парсер для КАЖДОГО микроформата, который теперь доступен, плюс каждый новый в будущем?

Веб-масштабируемые метаданные

RDFa скоро станет стандартом W3C (или Рекомендацией, как они их называют). Потребовалось время, чтобы все части собрались вместе, но все, что это важно, требует времени. И с этим временем приходит очень хорошо продуманное решение:

  1. Масштабируемость — любые словари, которые вы хотите. Создайте свой собственный и сходите с ума
  2. Mixable — смешивайте и подбирайте любой словарь в любом макете.
  3. Стандарт W3C — причина того, что один парсер будет читать любой словарь, проверка тривиальна.
  4. Глобальная идентификация — присвойте любой вещи на своей странице URL-адрес, и она станет «живой» точкой данных в Интернете; легко адресуемый любым.
  5. Ваша страница становится автономным клиентом для связанных данных ; Запрашиваемый как база данных. Это действительно круто.

Узнайте больше о RDFa

Группа RDFa только что запустила вики (с растущим объемом информации) и список рассылки . С ними также можно связаться по IRC / # swig. Продолжайте проверять, как я планирую добавлять новые сообщения о том, как использовать RDFa на ваших собственных веб-страницах.

(изображение из Википедии )