Учебники

Apache Solr — Основы поисковой системы

Поисковая система относится к огромной базе данных интернет-ресурсов, таких как веб-страницы, группы новостей, программы, изображения и т. Д. Она помогает находить информацию в World Wide Web.

Пользователи могут искать информацию, передавая запросы в поисковую систему в виде ключевых слов или фраз. Затем поисковая система выполняет поиск в своей базе данных и возвращает соответствующие ссылки пользователю.

Поиск Гугл

Компоненты поисковой системы

Как правило, есть три основных компонента поисковой системы, как указано ниже —

  • Web Crawler — веб-сканеры также известны как пауки или боты . Это программный компонент, который проходит через Интернет для сбора информации.

  • База данных — Вся информация в Интернете хранится в базах данных. Они содержат огромный объем веб-ресурсов.

  • Интерфейсы поиска — этот компонент является интерфейсом между пользователем и базой данных. Это помогает пользователю осуществлять поиск по базе данных.

Web Crawler — веб-сканеры также известны как пауки или боты . Это программный компонент, который проходит через Интернет для сбора информации.

База данных — Вся информация в Интернете хранится в базах данных. Они содержат огромный объем веб-ресурсов.

Интерфейсы поиска — этот компонент является интерфейсом между пользователем и базой данных. Это помогает пользователю осуществлять поиск по базе данных.

Как работают поисковые системы?

Любое приложение для поиска требуется для выполнения некоторых или всех следующих операций.

шаг заглавие Описание

1

Получить сырье

Самым первым шагом любого поискового приложения является сбор целевого содержимого, по которому будет проводиться поиск.

2

Построить документ

Следующим шагом является создание документа (ов) из необработанного содержимого, которое поисковое приложение может легко понять и интерпретировать.

3

Проанализируйте документ

Прежде чем начать индексацию, документ должен быть проанализирован.

4

Индексирование документа

После того, как документы построены и проанализированы, следующим шагом является их индексация, чтобы этот документ можно было получить на основе определенных ключей, а не всего содержимого документа.

Индексирование аналогично индексам, которые мы имеем в конце книги, где обычные слова показаны с номерами их страниц, так что эти слова можно быстро отслеживать, а не искать в полной книге.

5

Пользовательский интерфейс для поиска

Когда база данных индексов готова, приложение может выполнять поисковые операции. Чтобы помочь пользователю выполнить поиск, приложение должно предоставить пользовательский интерфейс, в котором пользователь может вводить текст и инициировать процесс поиска.

6

Построить запрос

Как только пользователь отправляет запрос на поиск текста, приложение должно подготовить объект запроса, используя этот текст, который затем можно использовать для запроса базы данных индекса для получения соответствующих сведений.

7

Поисковый запрос

Используя объект запроса, проверяется база данных индекса для получения соответствующих сведений и документов содержимого.

8

Результаты рендеринга

Как только требуемый результат получен, приложение должно решить, как отобразить результаты пользователю, используя его пользовательский интерфейс.

1

Получить сырье

Самым первым шагом любого поискового приложения является сбор целевого содержимого, по которому будет проводиться поиск.

2

Построить документ

Следующим шагом является создание документа (ов) из необработанного содержимого, которое поисковое приложение может легко понять и интерпретировать.

3

Проанализируйте документ

Прежде чем начать индексацию, документ должен быть проанализирован.

4

Индексирование документа

После того, как документы построены и проанализированы, следующим шагом является их индексация, чтобы этот документ можно было получить на основе определенных ключей, а не всего содержимого документа.

Индексирование аналогично индексам, которые мы имеем в конце книги, где обычные слова показаны с номерами их страниц, так что эти слова можно быстро отслеживать, а не искать в полной книге.

5

Пользовательский интерфейс для поиска

Когда база данных индексов готова, приложение может выполнять поисковые операции. Чтобы помочь пользователю выполнить поиск, приложение должно предоставить пользовательский интерфейс, в котором пользователь может вводить текст и инициировать процесс поиска.

6

Построить запрос

Как только пользователь отправляет запрос на поиск текста, приложение должно подготовить объект запроса, используя этот текст, который затем можно использовать для запроса базы данных индекса для получения соответствующих сведений.

7

Поисковый запрос

Используя объект запроса, проверяется база данных индекса для получения соответствующих сведений и документов содержимого.

8

Результаты рендеринга

Как только требуемый результат получен, приложение должно решить, как отобразить результаты пользователю, используя его пользовательский интерфейс.

Посмотрите на следующую иллюстрацию. Это показывает общее представление о том, как работают поисковые системы.

Поисковый движок

Помимо этих основных операций, поисковые приложения также могут предоставлять интерфейс администратора-пользователя, чтобы помочь администраторам контролировать уровень поиска на основе профилей пользователей. Аналитика результатов поиска — еще один важный и продвинутый аспект любого поискового приложения.