Статьи

ODD пример переносимости данных

Недавно я узнал о новой инициативе в области переносимости данных – Open Data Definition (ODD). Я приветствую любые попытки повысить переносимость данных между социальными сетями и вашими данными. Но чтобы действительно добиться успеха, идея должна быть хорошо продумана и проведена исследовательская работа, чтобы увидеть, что там и что действительно работает.

В блоге Бена Вердмюллера, в котором рассказывается о ODD, он определяется как новый формат для импорта и экспорта данных из социальных приложений. Он подчеркивает, что этот проект возник из реального мира, а не из академических упражнений. Он делает хороший аргумент в пользу переносимости данных; связывая его с рабочим столом, беря файл, созданный в одном приложении, и открывая его в другом. Это основной 101 здесь, но Интернет не может это сделать – пока.

Я чувствую, что он серьезно скучал по лодке, в разделе, где он говорит о семантической паутине. Он описывает сообщество как неоднозначное и слишком сложное:

В семантическом веб-сообществе есть RDF – формат, разработанный для потенциально мощных целей, но – как можно ожидать от сообщества семантических веб-сайтов – склонный к неоднозначности и слишком сложной реализации.

И тогда самая большая проблема, которую я вижу со всем аргументом, заключается в следующем:

… В малых дозах это работает ( FOAF основан на подмножестве RDF), но для более абстрактных данных его становится экспоненциально сложнее. Добавление новых полей данных требует создания искажений в XML, что усложняет динамическую генерацию.

Теперь это просто странно . RDF это * не * XML. RDF – это абстрактный формат , созданный для масштабируемого формата данных для World Wide Web (я подчеркиваю, во всем мире). RDF создан для моделирования информации * любой * формы и любого размера. Это довольно просто на самом деле. Возьмите три вещи (что угодно) и соедините их вместе, и вы получите RDF. Приведенный ниже пример основан на Turtle , формате RDF, созданном для людей-писателей. Это всего лишь один из многих форматов, которые можно использовать для написания RDF. RDFa – это еще один способ написания RDF. Он встраивает RDF в HTML, немного похожий на микроформаты, но более расширяемый.

С этими тремя предложениями я построил этот график:

График RDF

Все довольно просто

Конечно, я могу продолжать добавлять все, что я хочу, в <http://data.boab.info/david/foaf.rdf#me> или, если я хочу, могу добавить в <http: // http: // dbpedia .org / ресурс / Таунсвилл>. Просто добавьте больше вещей …

Реальная переносимость данных

Мой файл FOAF – это моя личность в Интернете. Я владею им, я могу поставить его на любой сервер, какой захочу. Это максимальная переносимость данных. В нем перечислены мои друзья, мои контактные данные, все, что я хочу. Опять же, RDF бесконечно расширяем.

Замечательная вещь о RDF и связанных данных состоит в том, что каждое из приведенных выше утверждений может быть получено через его URL. Это основа связанных данных. Я могу проследить график, получая URL с помощью моего браузера, с помощью вызова REST и т. Д. Если вы хотите узнать больше о том, где я живу, зайдите на http://dbpedia.org/resource/Townsville . Оттуда вы можете узнать географические координаты и почти все, что захотите 🙂

Новое состояние Интернета

Предпосылка, что это слишком сложно и сложно, больше не моется. Возможно, это было несколько лет назад, но с учетом того, что Yahoo полностью поддерживает стандарты Semantic Web, а также в будущей версии Drupal 7 , имеющей ядро данных, связанных с RDF , это определенно утрачено.

Подробная запись в блоге Генри Стори (профиль foaf) под названием « Доказательство: переносимость данных требует связанных данных » раскрывает гораздо более подробные сведения, и я призываю всех, кто работает в области переносимости данных, прочитать и подписаться на общий DataPortablity. обсуждение групп Google.

Любая попытка заставить переносимость данных действительно работать должна учитывать RDF, который является фундаментальным строительным блоком семантической сети. И не верьте мне на слово, вот цитата из другого блога:

… Многие из нас на самом деле занимаются бизнесом и фактически внедряют это в жизнь (такие компании, как Microsoft , Adobe, Sun Microsystems, OpenLink Software, Mozilla, Nokia, Skype, BBC, Joost и Oracle , все используют RDF одним способом или еще один) …

Через несколько часов после публикации я расширил приведенный выше пример, добавив больше подробностей о FOAF.