Учебники

Scrapy — Экспорт кормов

Экспорт фидов — это метод хранения данных, извлеченных с сайтов, который создает «файл экспорта» .

Форматы сериализации

Используя несколько форматов сериализации и хранилища данных, Feed Exports использует экспортеры элементов и генерирует ленту с очищенными элементами.

В следующей таблице приведены поддерживаемые форматы

Sr.No Формат и описание
1

JSON

FEED_FORMAT — это JSON

Используется экспортер класса scrapy.exporters.JsonItemExporter

2

Строки JSON

FEED_FROMAT — это jsonlines

Используется экспортер класса scrapy.exporters.JsonLinesItemExporter

3

CSV

FEED_FORMAT — это CSV

Используемым экспортером является класс scrapy.exporters.CsvItemExporter

4

XML

FEED_FORMAT — это xml

Используется экспортер класса scrapy.exporters.XmlItemExporter

JSON

FEED_FORMAT — это JSON

Используется экспортер класса scrapy.exporters.JsonItemExporter

Строки JSON

FEED_FROMAT — это jsonlines

Используется экспортер класса scrapy.exporters.JsonLinesItemExporter

CSV

FEED_FORMAT — это CSV

Используемым экспортером является класс scrapy.exporters.CsvItemExporter

XML

FEED_FORMAT — это xml

Используется экспортер класса scrapy.exporters.XmlItemExporter

Используя настройки FEED_EXPORTERS , поддерживаемые форматы также могут быть расширены —

Sr.No Формат и описание
1

Соленый огурец

FEED_FORMAT это пикель

Используется экспортер класса scrapy.exporters.PickleItemExporter

2

маршал

FEED_FORMAT является маршалом

Используется экспортер класса scrapy.exporters.MarshalItemExporter

Соленый огурец

FEED_FORMAT это пикель

Используется экспортер класса scrapy.exporters.PickleItemExporter

маршал

FEED_FORMAT является маршалом

Используется экспортер класса scrapy.exporters.MarshalItemExporter

Хранение Backends

Бэкэнд хранилища определяет, где хранить канал, используя URI.

В следующей таблице приведены поддерживаемые бэкэнды хранилища.

Sr.No Хранение Backend & Описание
1

Локальная файловая система

Схема URI является файловой и используется для хранения каналов.

2

FTP

Схема URI — ftp, и она используется для хранения каналов.

3

S3

Схема URI — S3, а каналы хранятся в Amazon S3. Требуются внешние библиотеки botocore или boto .

4

Стандартный вывод

Схема URI — это стандартный вывод, и каналы сохраняются для стандартного вывода.

Локальная файловая система

Схема URI является файловой и используется для хранения каналов.

FTP

Схема URI — ftp, и она используется для хранения каналов.

S3

Схема URI — S3, а каналы хранятся в Amazon S3. Требуются внешние библиотеки botocore или boto .

Стандартный вывод

Схема URI — это стандартный вывод, и каналы сохраняются для стандартного вывода.

Параметры URI хранилища

Ниже приведены параметры URL-адреса хранилища, который заменяется при создании канала.

  • % (время) с: этот параметр заменяется меткой времени.
  • % (name) s: этот параметр заменяется именем паука.

настройки

В следующей таблице приведены параметры, с помощью которых можно настроить экспорт каналов.

FEED_URI

Это URI фида экспорта, используемый для включения экспорта фидов.

FEED_FORMAT

Это формат сериализации, используемый для канала.

FEED_EXPORT_FIELDS

Используется для определения полей, которые необходимо экспортировать.

FEED_STORE_EMPTY

Определяет, экспортировать ли каналы без элементов.

FEED_STORAGES

Это словарь с дополнительными хранилищами каналов.

FEED_STORAGES_BASE

Это словарь со встроенным хранилищем каналов.

FEED_EXPORTERS

Это словарь с дополнительными кормами для экспортеров.

FEED_EXPORTERS_BASE

Это словарь со встроенными фидами экспортеров.