Учебники

Python — обработка данных JSON

Файл JSON хранит данные в виде текста в удобочитаемом формате. JSON означает JavaScript Object Notation. Pandas может читать файлы JSON с помощью функции read_json .

Входные данные

Создайте файл JSON, скопировав приведенные ниже данные в текстовый редактор, например блокнот. Сохраните файл с расширением .json и выберите тип файла в качестве всех файлов (*. *) .

{ 
   "ID":["1","2","3","4","5","6","7","8" ],
   "Name":["Rick","Dan","Michelle","Ryan","Gary","Nina","Simon","Guru" ]
   "Salary":["623.3","515.2","611","729","843.25","578","632.8","722.5" ],
   
   "StartDate":[ "1/1/2012","9/23/2013","11/15/2014","5/11/2014","3/27/2015","5/21/2013",
      "7/30/2013","6/17/2014"],
   "Dept":[ "IT","Operations","IT","HR","Finance","IT","Operations","Finance"]
}

Прочитайте файл JSON

Функция read_json библиотеки pandas может использоваться для считывания файла JSON в DataFrame pandas.

import pandas as pd

data = pd.read_json('path/input.json')
print (data)

Когда мы выполняем приведенный выше код, он дает следующий результат.

         Dept  ID    Name  Salary   StartDate
0          IT   1    Rick  623.30    1/1/2012
1  Operations   2     Dan  515.20   9/23/2013
2          IT   3   Tusar  611.00  11/15/2014
3          HR   4    Ryan  729.00   5/11/2014
4     Finance   5    Gary  843.25   3/27/2015
5          IT   6   Rasmi  578.00   5/21/2013
6  Operations   7  Pranab  632.80   7/30/2013
7     Finance   8    Guru  722.50   6/17/2014

Чтение определенных столбцов и строк

Подобно тому, что мы уже видели в предыдущей главе для чтения файла CSV, функция read_json библиотеки pandas может также использоваться для чтения некоторых определенных столбцов и определенных строк после чтения файла JSON в DataFrame. Для этой цели мы используем метод многоосевого индексирования .loc () . Мы выбрали отображение столбца Зарплата и Имя для некоторых строк.

import pandas as pd
data = pd.read_json('path/input.xlsx')

# Use the multi-axes indexing funtion
print (data.loc[[1,3,5],['salary','name']])

Когда мы выполняем приведенный выше код, он дает следующий результат.

   salary   name
1   515.2    Dan
3   729.0   Ryan
5   578.0  Rasmi

Чтение файла JSON как записей

Мы также можем применить функцию to_json вместе с параметрами для чтения содержимого файла JSON в отдельные записи.

import pandas as pd
data = pd.read_json('path/input.xlsx')

print(data.to_json(orient='records', lines=True))

Когда мы выполняем приведенный выше код, он дает следующий результат.