Статьи

Самая важная часть поиска в графе Facebook

Примечание куратора: содержание этой статьи было первоначально написано Эмилем Эйфремом и Филиппом Ратлом в блоге Neo4j.

Вы слышали новости: Facebook объявил о новом предложении под названием Поиск по графику. В последние несколько лет использование графических технологий расширяется, и в последнее время вокруг графических баз данных довольно много шума .
Мы считаем, что поиск по графику является частью тенденции, которая намного больше, чем Facebook, и более распространена, чем поиск. Facebook использует принципиально новый способ использования информации, которая существует во всех мировых базах данных. В этом посте мы рассмотрим объявление Facebook под другим углом, связанное с данными: растущая тенденция, которая находится на грани изменения того, как крупные и маленькие компании понимают свои данные.

Графики и поиск: немного истории
Веб-поиск и графики имеют долгую историю. На протяжении большей части 1990-х годов технология веб-поиска основывалась на «атомарных данных»: она индексировала каждую страницу и ранжировала ее по отдельности, основываясь исключительно на ее содержимом и без каких-либо ссылок на другие страницы. Но в 1999 году небольшой стартап под названием Google принял новый графоцентрический подход, изобретенный сооснователем Ларри Пейджем, под названием PageRank . PageRank изменил основы веб-поиска и катапультировал Google, опередив своих конкурентов, которые по сей день не догнали. Что было нового в этом новом алгоритме, так это то, что вместо того, чтобы ранжировать страницы изолированно, без какой-либо ссылки друг на друга, он добился заметно лучших результатов, принимая во внимание, как страницы связаны между собой.

Связанные данные как новый источник понимания
В своем выступлении на прошлогодней конференции GraphConnect в Сан-Франциско социальный исследователь Джеймс Фаулер (автор книги « Связанные ») поделился своими последними результатами исследований, указав, как можно узнать больше о ком-то, зная, как они взаимодействуют с людьми и окружающими вещами. их, чем путем изучения отдельных фактов об этом человеке. Разница между пониманием, полученным из атомарных данных, и интеллектом, который может быть обнаружен из связанных данных, огромна, и требует специализированных технологий, разработанных для использования связности.

Как работает поиск по графику?
Графики по своей сути визуальные. Это не так сложно понять, как работает технология, даже если вы не настолько технический. Давайте возьмем один из примеров запросов поиска по графику в Facebook, чтобы найти все суши-рестораны в Нью-Йорке, которые нравятся моим друзьям. Ниже приведена иллюстрация того, как выглядит базовый граф:

Данные, хранящиеся в базе данных графа, выглядят точно так же, как на чертеже. Получить ответ очень просто для графической базы данных. Вам просто нужно сформулировать вопрос так, чтобы база данных его понимала. Те, кто более технически склонен, могут увидеть пример ниже для запроса, который отвечает на вопрос: «найдите нью-йоркские суши-рестораны, которые нравятся моим друзьям»:

Пример языка Cypher Query: суши-рестораны в Нью-Йорке, которые нравятся моим друзьям

START me=node:person(name = 'Philip'),
      location=node:location(location='New York'),
      cuisine=node:cuisine(cuisine='Sushi')

MATCH (me)-[:IS_FRIEND_OF]->(friend)-[:LIKES]->(restaurant)-[:LOCATED_IN]->(location),
      (restaurant)-[:SERVES]->(cuisine)
RETURN restaurant

Другие приложения для графиков

Мышление на графиках естественно и заразительно. Чем больше вы думаете о связях, тем больше понимаете, что графики — это способ, которым мы неявно думаем. Что такое дерево решений, например, но график возможностей? Чем больше вы смотрите, тем больше начинаете замечать, что графики, на самом деле, везде. Пользователи базы данных Graph регулярно используют запросы, подобные приведенному выше, чтобы отвечать на вопросы, и чем больше вы спрашиваете, тем больше вы думаете о новых вопросах, которые вам никогда не приходило задавать ранее. Графические запросы могут быть довольно сложными, и вполне возможно запускать запросы, которые сканируют в социальной сети, если удалено два, три или более уровней друзей.

Возможности использования подключенных данных выходят далеко за пределы социальных сетей и поиска. Шаблон, который применяется к графическому поиску, также применим к биоинформатике, обнаружению мошенничества, управлению сетью, логистике и множеству других
случаев использования .
Neo Technology имеет клиентов во всех этих областях (и даже больше!), Использующих
графическую базу данных
Neo4j для достижения новых и более высоких уровней понимания.

Я не Facebook … Как я могу получить это?

Технологические гиганты, такие как
Facebook ,
Google и
Twitterиметь все построенные графовые технологии с нуля, чтобы дифференцировать и развивать свой бизнес. Однако создание и поддержка собственной системы управления базами данных не является практичным решением, если вы не являетесь Facebook. Хорошей новостью является то, что компании, которым нужна функциональность, такая как поиск по графику, находятся в одном клике от получения инструментов, необходимых для ее создания. По сути, Graph Search представляет собой базу данных. В отличие от десятилетия назад, теперь можно найти коммерческие готовые графические базы данных, которые проверены и надежны и созданы с нуля для поддержки связанных данных.
Neo4j является наиболее широко используемой графической базой данных сегодня. Такие компании, как Cisco, Adobe и Deutsche Telekom, приняли его, потому что это в
1000 раз быстреечем реляционные базы данных для работы со связанными данными, и с ними гораздо проще работать, чем вставлять графики в таблицы.
Neo4j свободно доступен в виде программного обеспечения с открытым исходным кодом, с Community Edition, доступной по той же лицензии с открытым исходным кодом, что и MySQL, и для Enterprise Edition. Коммерческие подписки доступны от создателя Neo4j и спонсора
Neo Technology . Коммерческие пользователи включают Cisco, Adobe, Deutsche Telekom, Accenture и
многие другие ; а также множество стартапов, в том числе Fiftythree (производители
бумаги , победитель Apple App 2012 года от Apple), Squidoo от Seth Godin
и
Justdial (один из самых обсуждаемых стартапов в Индии).

По мере того как мы вступаем в эру, когда все больше и больше компаний получают выгоду от понимания связанных данных, наличие нужных инструментов, доступных каждому, означает, что никому не нужно оставаться позади. Neo4j доступен для
скачивания сегодня . Попробуйте или воспользуйтесь интерактивной
веб-консолью Cypher , чтобы сразу же попробовать язык запросов графиков Cypher из вашего веб-браузера.


Нажмите на изображение ниже, чтобы просмотреть пример запроса выше в интерактивной консоли Cypher: