Lucene — это простая, но мощная библиотека поиска на основе Java. Его можно использовать в любом приложении, чтобы добавить в него возможность поиска. Lucene — это проект с открытым исходным кодом. Это масштабируемо. Эта высокопроизводительная библиотека используется для индексации и поиска практически любого текста. Библиотека Lucene предоставляет основные операции, необходимые для любого поискового приложения. Индексирование и поиск.
Как работает поисковое приложение?
Приложение поиска выполняет все или несколько из следующих операций:
шаг | заглавие | Описание |
---|---|---|
1 |
Получить сырье |
Первым шагом любого поискового приложения является сбор целевого содержимого, по которому должно выполняться поисковое приложение. |
2 |
Построить документ |
Следующим шагом является создание документа (ов) из необработанного содержимого, которое поисковое приложение может легко понять и интерпретировать. |
3 |
Проанализируйте документ |
Перед началом процесса индексации необходимо проанализировать, какая часть текста является кандидатом для индексации. Этот процесс — то, где документ проанализирован. |
4 |
Индексирование документа |
После того, как документы построены и проанализированы, следующим шагом является их индексация, чтобы этот документ можно было получить на основе определенных ключей, а не всего содержимого документа. Процесс индексирования аналогичен индексам в конце книги, где обычные слова показываются с номерами их страниц, так что эти слова можно быстро отслеживать вместо поиска по всей книге. |
5 |
Пользовательский интерфейс для поиска |
Когда база данных индексов готова, приложение может выполнить любой поиск. Чтобы упростить пользователю поиск, приложение должно предоставить пользователю среднее значение или пользовательский интерфейс, где пользователь может вводить текст и запускать процесс поиска. |
6 |
Построить запрос |
Как только пользователь отправляет запрос на поиск текста, приложение должно подготовить объект Query, используя этот текст, который можно использовать для запроса базы данных индекса для получения соответствующих сведений. |
7 |
Поисковый запрос |
Используя объект запроса, база данных индекса затем проверяется, чтобы получить соответствующую информацию и документы контента. |
8 |
Результаты рендеринга |
Как только результат получен, приложение должно решить, как показать результаты пользователю, используя пользовательский интерфейс. Сколько информации нужно показывать с первого взгляда и так далее. |
Получить сырье
Первым шагом любого поискового приложения является сбор целевого содержимого, по которому должно выполняться поисковое приложение.
Построить документ
Следующим шагом является создание документа (ов) из необработанного содержимого, которое поисковое приложение может легко понять и интерпретировать.
Проанализируйте документ
Перед началом процесса индексации необходимо проанализировать, какая часть текста является кандидатом для индексации. Этот процесс — то, где документ проанализирован.
Индексирование документа
После того, как документы построены и проанализированы, следующим шагом является их индексация, чтобы этот документ можно было получить на основе определенных ключей, а не всего содержимого документа. Процесс индексирования аналогичен индексам в конце книги, где обычные слова показываются с номерами их страниц, так что эти слова можно быстро отслеживать вместо поиска по всей книге.
Пользовательский интерфейс для поиска
Когда база данных индексов готова, приложение может выполнить любой поиск. Чтобы упростить пользователю поиск, приложение должно предоставить пользователю среднее значение или пользовательский интерфейс, где пользователь может вводить текст и запускать процесс поиска.
Построить запрос
Как только пользователь отправляет запрос на поиск текста, приложение должно подготовить объект Query, используя этот текст, который можно использовать для запроса базы данных индекса для получения соответствующих сведений.
Поисковый запрос
Используя объект запроса, база данных индекса затем проверяется, чтобы получить соответствующую информацию и документы контента.
Результаты рендеринга
Как только результат получен, приложение должно решить, как показать результаты пользователю, используя пользовательский интерфейс. Сколько информации нужно показывать с первого взгляда и так далее.
Помимо этих основных операций, поисковое приложение может также предоставить административный пользовательский интерфейс и помочь администраторам приложения контролировать уровень поиска на основе пользовательских профилей. Аналитика результатов поиска — еще один важный и продвинутый аспект любого поискового приложения.
Роль Lucene в поисковом приложении
Lucene играет роль в шагах со 2 по 7, упомянутых выше, и предоставляет классы для выполнения необходимых операций. В двух словах, Lucene является сердцем любого поискового приложения и обеспечивает жизненно важные операции, относящиеся к индексации и поиску. Получение содержимого и отображение результатов оставлено для обработки частью приложения.
В следующей главе мы выполним простое приложение поиска, используя библиотеку Lucene Search.