В этой главе мы сосредоточимся больше на torchvision.datasets и его различных типах. PyTorch включает следующие загрузчики наборов данных —
- MNIST
- COCO (субтитры и обнаружение)
Набор данных включает в себя большинство из двух типов функций, приведенных ниже —
-
Transform — функция, которая берет изображение и возвращает модифицированную версию стандартного материала. Они могут быть составлены вместе с преобразованиями.
-
Target_transform — функция, которая берет цель и трансформирует ее. Например, принимает строку заголовка и возвращает тензор мировых индексов.
Transform — функция, которая берет изображение и возвращает модифицированную версию стандартного материала. Они могут быть составлены вместе с преобразованиями.
Target_transform — функция, которая берет цель и трансформирует ее. Например, принимает строку заголовка и возвращает тензор мировых индексов.
MNIST
Ниже приведен пример кода для набора данных MNIST:
dset.MNIST(root, train = TRUE, transform = NONE, target_transform = None, download = FALSE)
Параметры следующие:
-
root — корневой каталог набора данных, в котором существуют обработанные данные.
-
train — True = обучающий набор, False = тестовый набор
-
download — True = загружает набор данных из Интернета и помещает его в корневой каталог.
root — корневой каталог набора данных, в котором существуют обработанные данные.
train — True = обучающий набор, False = тестовый набор
download — True = загружает набор данных из Интернета и помещает его в корневой каталог.
COCO
Это требует установки COCO API. Следующий пример используется для демонстрации реализации набора данных COCO с использованием PyTorch —
import torchvision.dataset as dset import torchvision.transforms as transforms cap = dset.CocoCaptions(root = ‘ dir where images are’, annFile = ’json annotation file’, transform = transforms.ToTensor()) print(‘Number of samples: ‘, len(cap)) print(target)
Достигнутый результат следующий: