Учебники

PyTorch — наборы данных

В этой главе мы сосредоточимся больше на torchvision.datasets и его различных типах. PyTorch включает следующие загрузчики наборов данных —

  • MNIST
  • COCO (субтитры и обнаружение)

Набор данных включает в себя большинство из двух типов функций, приведенных ниже —

  • Transform — функция, которая берет изображение и возвращает модифицированную версию стандартного материала. Они могут быть составлены вместе с преобразованиями.

  • Target_transform — функция, которая берет цель и трансформирует ее. Например, принимает строку заголовка и возвращает тензор мировых индексов.

Transform — функция, которая берет изображение и возвращает модифицированную версию стандартного материала. Они могут быть составлены вместе с преобразованиями.

Target_transform — функция, которая берет цель и трансформирует ее. Например, принимает строку заголовка и возвращает тензор мировых индексов.

MNIST

Ниже приведен пример кода для набора данных MNIST:

dset.MNIST(root, train = TRUE, transform = NONE, 
target_transform = None, download = FALSE)

Параметры следующие:

  • root — корневой каталог набора данных, в котором существуют обработанные данные.

  • train — True = обучающий набор, False = тестовый набор

  • download — True = загружает набор данных из Интернета и помещает его в корневой каталог.

root — корневой каталог набора данных, в котором существуют обработанные данные.

train — True = обучающий набор, False = тестовый набор

download — True = загружает набор данных из Интернета и помещает его в корневой каталог.

COCO

Это требует установки COCO API. Следующий пример используется для демонстрации реализации набора данных COCO с использованием PyTorch —

import torchvision.dataset as dset
import torchvision.transforms as transforms
cap = dset.CocoCaptions(root =  dir where images are’, 
annFile = json annotation file’,
transform = transforms.ToTensor())
print(‘Number of samples: ‘, len(cap))
print(target)

Достигнутый результат следующий: