Учебники

Поисковые системы

Поисковая система относится к огромной базе данных интернет-ресурсов, таких как веб-страницы, группы новостей, программы, изображения и т. Д. Она помогает находить информацию в World Wide Web.

Пользователь может искать любую информацию, передавая запрос в виде ключевых слов или фраз. Затем он ищет соответствующую информацию в своей базе данных и возвращает пользователю.

internet_technologies_tutorial

Компоненты поисковой системы

Как правило, есть три основных компонента поисковой системы, перечисленные ниже:

  1. Веб-сканер

  2. База данных

  3. Интерфейсы поиска

Веб-сканер

База данных

Интерфейсы поиска

Веб-сканер

Это также известно как паук или боты. Это программный компонент, который проходит через Интернет для сбора информации.

База данных

Вся информация в сети хранится в базе данных. Он состоит из огромных веб-ресурсов.

Интерфейсы поиска

Этот компонент является интерфейсом между пользователем и базой данных. Это помогает пользователю осуществлять поиск по базе данных.

Поисковая система работает

Веб-сканер, база данных и интерфейс поиска являются основным компонентом поисковой системы, которая фактически заставляет поисковую систему работать. Поисковые системы используют булево выражение AND, OR, NOT для ограничения и расширения результатов поиска. Ниже приведены шаги, которые выполняются поисковой системой:

  • Поисковая система ищет ключевое слово в индексе для предопределенной базы данных вместо того, чтобы напрямую искать в Интернете ключевое слово.

  • Затем он использует программное обеспечение для поиска информации в базе данных. Этот программный компонент известен как веб-сканер.

  • Когда веб-сканер находит страницы, поисковая система отображает соответствующие веб-страницы в результате. Эти извлеченные веб-страницы обычно включают заголовок страницы, размер текстовой части, первые несколько предложений и т. Д.

Поисковая система ищет ключевое слово в индексе для предопределенной базы данных вместо того, чтобы напрямую искать в Интернете ключевое слово.

Затем он использует программное обеспечение для поиска информации в базе данных. Этот программный компонент известен как веб-сканер.

Когда веб-сканер находит страницы, поисковая система отображает соответствующие веб-страницы в результате. Эти извлеченные веб-страницы обычно включают заголовок страницы, размер текстовой части, первые несколько предложений и т. Д.

Эти критерии поиска могут варьироваться от одной поисковой системы к другой. Полученная информация ранжируется в соответствии с различными факторами, такими как частота ключевых слов, актуальность информации, ссылок и т. Д.

  • Пользователь может нажать на любой из результатов поиска, чтобы открыть его.

Пользователь может нажать на любой из результатов поиска, чтобы открыть его.

Архитектура

Архитектура поисковой системы состоит из трех основных уровней, перечисленных ниже:

  • Сбор и доработка контента.

  • Поисковое ядро

  • Пользовательский и прикладной интерфейсы

Сбор и доработка контента.

Поисковое ядро

Пользовательский и прикладной интерфейсы

internet_technologies_tutorial

Обработка поисковых систем

Процесс индексации

Процесс индексирования состоит из следующих трех задач:

  • Приобретение текста

  • Преобразование текста

  • Создание индекса

Приобретение текста

Преобразование текста

Создание индекса

Приобретение текста

Он идентифицирует и хранит документы для индексации.

Преобразование текста

Он преобразует документ в термины или функции индекса.

Создание индекса

Он принимает термины индекса, созданные текстовыми преобразованиями, и создает структуры данных для поддержки быстрого поиска.

Процесс запроса

Процесс запроса состоит из следующих трех задач:

  • Взаимодействие с пользователем

  • ранжирование

  • оценка

Взаимодействие с пользователем

ранжирование

оценка

Взаимодействие с пользователем

Он поддерживает создание и уточнение пользовательских запросов и отображает результаты.

ранжирование

Он использует запрос и индексы для создания ранжированного списка документов.

оценка

Он контролирует и измеряет эффективность и результативность. Это делается в автономном режиме.

Примеры

Ниже приведены несколько поисковых систем, доступных сегодня: