Вступление Давайте предположим, что у нас есть список задач для выполнения. Некоторые задачи зависят от других, поэтому мы должны быть очень осторожны с порядком их…
В последнее время я немного поигрался с потоковым API Twitter, чтобы увидеть, какие ссылки чаще всего публикуются людьми, за которыми я следую, и затем сохранять…
Мы начали сталкиваться с некоторыми проблемами тайм-аута при загрузке десятков тысяч узлов с полнотекстовыми индексами в Neo4j. Мы решили взглянуть на него с установки по…
В этом посте мы немного отклонимся от реализации шаблонов, найденных в Data-Intensive Processing с MapReduce, для обсуждения чего-то столь же важного, тестирования. Отчасти меня вдохновила…
Как читатели этого блога уже знают, я работаю над средой потокового программирования NoFlo для JavaScript. В последнее время усилия по разработке получили значительную поддержку как…
Вчера Кристофер спросил меня, как сохранить объект R, чтобы сэкономить время при работе над проектом. Сначала загрузите файл csv для поиска, связанного с каким-либо ключевым…
Примечание . Эта статья является второй половиной моей недавней статьи » Выполнение рабочего процесса Elive MapReduce Hive» из статьи AWS Management Console со слегка измененным…
Я радостно объявляю, что мы меняем все драйверы MongoDB от 10gen для «безопасной записи» по умолчанию. В процессе мы переименовываем все классы соединений в MongoClient,…
Что я научился делать? За последние пару недель я узнал о двух наиболее популярных алгоритмах кластеризации данных: K-Means Clustering и Density Based Clustering (слабо соответствует…
Учитывая то, что, как мне кажется, наметился сдвиг в сторону клиентского MVC, работающего с целыми документами JSON вверх и вниз по сети, мне интересно, есть…