GridFS — это спецификация MongoDB для хранения и извлечения больших файлов, таких как изображения, аудиофайлы, видеофайлы и т. Д. Это своего рода файловая система для хранения файлов, но ее данные хранятся в коллекциях MongoDB. GridFS имеет возможность хранить файлы даже больше, чем его ограничение размера документа 16 МБ.
GridFS делит файл на куски и сохраняет каждый кусок данных в отдельном документе, каждый из которых имеет максимальный размер 255 КБ.
GridFS по умолчанию использует две коллекции fs.files и fs.chunks для хранения метаданных файла и фрагментов. Каждый блок идентифицируется уникальным полем _id ObjectId. Файл fs.files является родительским документом. Поле files_id в документе fs.chunks связывает чанк с его родителем.
Ниже приведен пример документа коллекции fs.files —
{ "filename": "test.txt", "chunkSize": NumberInt(261120), "uploadDate": ISODate("2014-04-13T11:32:33.557Z"), "md5": "7b762939321e146569b07f72c62cca4f", "length": NumberInt(646) }
В документе указывается имя файла, размер фрагмента, дата загрузки и длина.
Ниже приведен пример документа fs.chunks —
{ "files_id": ObjectId("534a75d19f54bfec8a2fe44b"), "n": NumberInt(0), "data": "Mongo Binary Data" }
Добавление файлов в GridFS
Теперь мы будем хранить mp3-файл, используя GridFS, используя команду put . Для этого мы будем использовать утилиту mongofiles.exe, которая находится в папке bin установочной папки MongoDB.
Откройте командную строку, перейдите к файлу mongofiles.exe в папке bin установочной папки MongoDB и введите следующий код —
>mongofiles.exe -d gridfs put song.mp3
Здесь gridfs — это имя базы данных, в которой будет храниться файл. Если база данных отсутствует, MongoDB автоматически создаст новый документ на лету. Song.mp3 — это имя загруженного файла. Чтобы просмотреть документ файла в базе данных, вы можете воспользоваться поиском запроса —
>db.fs.files.find()
Приведенная выше команда вернула следующий документ —
{ _id: ObjectId('534a811bf8b4aa4d33fdf94d'), filename: "song.mp3", chunkSize: 261120, uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41", length: 10401959 }
Мы также можем увидеть все фрагменты, присутствующие в коллекции fs.chunks, связанные с сохраненным файлом, со следующим кодом, используя идентификатор документа, возвращенный в предыдущем запросе:
>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})
В моем случае запрос вернул 40 документов, а это означает, что весь mp3-документ был разделен на 40 блоков данных.