Статьи

Обжигающий: Нахождение K ближайших соседей для удовольствия и прибыли

Представьте, что вы пользуетесь популярным сайтом электронной коммерции, посвященным модной и модной одежде для женщин, и у вас есть механизм рекомендаций по выбору, который рекомендует…
Статьи

Ленивая миграция данных в Riak

Первоначально автор Пол Гросс и кросс- пост в блоге Брейнтри Движение NoSQL принесло нам волну новых хранилищ данных за пределами традиционных реляционных баз данных. Эти…
Статьи

Работа с интенсивной обработкой текста с помощью MapReduce - локальная агрегация, часть II

Этот пост продолжается серией статей по реализации алгоритмов, которые можно найти в книге « Интенсивная обработка данных с помощью MapReduce» . В предыдущем посте мы…
Статьи

Паршивая криптография ABC, взломанная за считанные секунды при вскрытии австралийских паролей

45 секунд Вот сколько времени понадобилось для взлома 53% общедоступной базы паролей ABC. Это более половины из почти 50 000 паролей, которые были  опубликованы сегодня…
Статьи

Распределенные графовые вычисления с Gremlin

script-Ступенно в Фавна Gremlin позволяет выполнение произвольного сценария Gremlin против всех вершин в графе Faunus. Эта простая идея имеет интересные последствия для распределенных графовых вычислений…