Статьи

Оптимизация в R

Оптимизация — очень распространенная проблема в анализе данных. Учитывая набор переменных (которые контролируют), как правильно выбрать значение, чтобы выгода была максимальной. Более формально, оптимизация заключается…
Статьи

Потоковое MapReduce: примеры кода

В этой статье я представлю концепцию потоковой обработки MapReduce с использованием GridGain и Scala. Выбор Scala объясняется просто тем, что он обеспечивает очень краткую запись,…
Статьи

Анатомия запроса DisMax

При отладке функциональности нового анализатора запросов у меня было  несчастье  редкая возможность углубиться в поисковый код Solr. В итоге я много узнал о том, как…
Статьи

Использование MongoDB через .NET

Задача : В этом посте я объясню, как мы можем взаимодействовать с данными, находящимися в MongoDB, используя .Net. Ингредиенты: Mongodb-win32-i386-2.2.3, Microsoft Windows Vista Professional, Visual…
Статьи

Работа с набором данных FreeDB в Вороне

Напомним, что набор данных FreeDB составляет 3,32 миллиона записей. Содержит большинство альбомов, которые вышли за последние несколько десятилетий. Для этого мы создали следующую базу данных…
Статьи

Понимание алгоритмов многорукого бандита

Сценарий Представьте, что вы находитесь перед тремя игровыми автоматами, каждый из которых имеет разную вероятность выплаты. Как вы должны играть их, чтобы максимизировать ваши выплаты?…