Статьи

Уменьшение карты и обработка потока

Модель Hadoop Map / Reduce очень хороша для параллельной обработки большого количества данных. Он обеспечивает общий механизм разделения (на основе ключа данных) для распределения агрегационной…
Статьи

Spark Backend для Apache Gora

Я работал над Spark-сервером Apache Gora в качестве своего проекта GSoC 2015 и закончил его. В этом посте я расскажу, как это работает и как…
Статьи

Выбор модели классификации

Чтобы проиллюстрировать проблему выбора модели классификации, рассмотрим некоторые моделируемые данные, > n = 500 > set.seed(1) > X = rnorm(n) > ma = 10-(X+1.5)^2*2 >…
Статьи

Операторы MySQL REGEXP (Регулярное выражение)

MySQL предлагает возможность использовать регулярные выражения для выполнения сложного поиска по вашим данным. Регулярное выражение — это инструмент, который обеспечивает краткий и гибкий способ идентификации…
Статьи

Поиск рейса с помощью Neo4j Traversal API

До появления Cypher, если вы хотите описать обход графов в Neo4j, вы должны использовать Java API-интерфейс Traversal Framework . API-интерфейс Traversal — это одна из…