Статьи

К-средние кластеризация и множества Вороного

В контексте -means мы хотим разделить пространство наших наблюдений на  классы. Каждое наблюдение принадлежит кластеру с ближайшим средним. Здесь «ближайший» означает некоторую норму, обычно (евклидову)…
Статьи

MapDB: Agile Java Data Engine

MapDB — это чистая база данных Java, специально разработанная для разработчика Java. Фундаментальная концепция MapDB очень умна, но естественна в использовании: предоставляет надежный, полнофункциональный и…
Статьи

Изучение Эрланга с картой / уменьшить

В категории «Параллельное ориентированное программирование» Эрланг недавно получил хорошее внимание из-за заявленного инженерами Facebook успеха в использовании Erlang в крупномасштабных приложениях. Соблазнившись выяснить основные составляющие…
Статьи

BIRT в Eclipse: использование API Design Engine

Представьте, что вы определили таблицу как элемент отчета в файле дизайна отчета с именем «клиенты». Как следует из названия, таблица используется для отображения всех клиентов…
Статьи

Улучшение компонента Camel Solr

В последнее время мы использовали Apache Camel в качестве предпочтительного конвейера. Он представляет собой довольно симпатичный DSL для соединения различных источников данных, выполнения преобразований и,…
Статьи

Hadoop: Начало работы со свиньей

Что такое свинья? Pig — это язык сценариев высокого уровня, который используется с Apache Hadoop. Свинья позволяет аналитикам данных писать сложные преобразования данных, не зная…