Учебники

Apache Solr — Терминология

В этой главе мы попытаемся понять реальное значение некоторых терминов, которые часто используются при работе с Solr.

Общая терминология

Ниже приведен список общих терминов, которые используются во всех типах установок Solr:

  • Экземпляр — Точно так же, как экземпляр Tomcat или Jetty , этот термин относится к серверу приложений, который работает внутри JVM. Домашний каталог Solr содержит ссылку на каждый из этих экземпляров Solr, в котором одно или несколько ядер могут быть настроены для работы в каждом экземпляре.

  • Ядро — при запуске нескольких индексов в вашем приложении вы можете иметь несколько ядер в каждом экземпляре, вместо нескольких экземпляров, каждое из которых имеет одно ядро.

  • Домашний — термин $ SOLR_HOME относится к домашнему каталогу, который содержит всю информацию, касающуюся ядер, их индексов, конфигураций и зависимостей.

  • Shard — в распределенных средах данные распределяются между несколькими экземплярами Solr, где каждый кусок данных можно назвать Shard . Он содержит подмножество всего индекса.

Экземпляр — Точно так же, как экземпляр Tomcat или Jetty , этот термин относится к серверу приложений, который работает внутри JVM. Домашний каталог Solr содержит ссылку на каждый из этих экземпляров Solr, в котором одно или несколько ядер могут быть настроены для работы в каждом экземпляре.

Ядро — при запуске нескольких индексов в вашем приложении вы можете иметь несколько ядер в каждом экземпляре, вместо нескольких экземпляров, каждое из которых имеет одно ядро.

Домашний — термин $ SOLR_HOME относится к домашнему каталогу, который содержит всю информацию, касающуюся ядер, их индексов, конфигураций и зависимостей.

Shard — в распределенных средах данные распределяются между несколькими экземплярами Solr, где каждый кусок данных можно назвать Shard . Он содержит подмножество всего индекса.

SolrCloud Терминология

В предыдущей главе мы обсуждали, как установить Apache Solr в автономном режиме. Обратите внимание, что мы также можем установить Solr в распределенном режиме (облачная среда), где Solr устанавливается в шаблоне главный-подчиненный. В распределенном режиме индекс создается на главном сервере и реплицируется на один или несколько подчиненных серверов.

Ключевые термины, связанные с Solr Cloud, следующие:

  • Узел — В облаке Solr каждый отдельный экземпляр Solr рассматривается как узел .

  • Кластер — все узлы среды, объединенные вместе, образуют кластер .

  • Коллекция . Кластер имеет логический индекс, который называется коллекцией .

  • Осколок — это часть коллекции, в которой есть одна или несколько копий индекса.

  • Реплика. В Solr Core копия осколка, которая работает в узле, называется репликой .

  • Лидер — это также точная копия осколка, которая распределяет запросы облака Solr по оставшимся репликам.

  • Zookeeper — это проект Apache, который Solr Cloud использует для централизованной настройки и координации, управления кластером и выбора лидера.

Узел — В облаке Solr каждый отдельный экземпляр Solr рассматривается как узел .

Кластер — все узлы среды, объединенные вместе, образуют кластер .

Коллекция . Кластер имеет логический индекс, который называется коллекцией .

Осколок — это часть коллекции, в которой есть одна или несколько копий индекса.

Реплика. В Solr Core копия осколка, которая работает в узле, называется репликой .

Лидер — это также точная копия осколка, которая распределяет запросы облака Solr по оставшимся репликам.

Zookeeper — это проект Apache, который Solr Cloud использует для централизованной настройки и координации, управления кластером и выбора лидера.

Конфигурационные файлы

Основные конфигурационные файлы в Apache Solr:

Solr.xml — это файл в каталоге $ SOLR_HOME, который содержит информацию, связанную с Solr Cloud. Для загрузки ядер Solr обращается к этому файлу, который помогает их идентифицировать.

Solrconfig.xml — этот файл содержит определения и специфичные для ядра конфигурации, связанные с обработкой запросов и форматированием ответов, а также с индексацией, настройкой, управлением памятью и выполнением коммитов.

Schema.xml — этот файл содержит всю схему вместе с полями и типами полей.

Core.properties — этот файл содержит конфигурации, специфичные для ядра. Он передается для обнаружения ядра , так как содержит имя ядра и путь к каталогу данных. Его можно использовать в любом каталоге, который затем будет рассматриваться как основной каталог .