Файл JSON хранит данные в виде текста в удобочитаемом формате. JSON означает JavaScript Object Notation. Pandas может читать файлы JSON с помощью функции read_json .
Входные данные
Создайте файл JSON, скопировав приведенные ниже данные в текстовый редактор, например блокнот. Сохраните файл с расширением .json и выберите тип файла в качестве всех файлов (*. *) .
{ "ID":["1","2","3","4","5","6","7","8" ], "Name":["Rick","Dan","Michelle","Ryan","Gary","Nina","Simon","Guru" ] "Salary":["623.3","515.2","611","729","843.25","578","632.8","722.5" ], "StartDate":[ "1/1/2012","9/23/2013","11/15/2014","5/11/2014","3/27/2015","5/21/2013", "7/30/2013","6/17/2014"], "Dept":[ "IT","Operations","IT","HR","Finance","IT","Operations","Finance"] }
Прочитайте файл JSON
Функция read_json библиотеки pandas может использоваться для считывания файла JSON в DataFrame pandas.
import pandas as pd data = pd.read_json('path/input.json') print (data)
Когда мы выполняем приведенный выше код, он дает следующий результат.
Dept ID Name Salary StartDate 0 IT 1 Rick 623.30 1/1/2012 1 Operations 2 Dan 515.20 9/23/2013 2 IT 3 Tusar 611.00 11/15/2014 3 HR 4 Ryan 729.00 5/11/2014 4 Finance 5 Gary 843.25 3/27/2015 5 IT 6 Rasmi 578.00 5/21/2013 6 Operations 7 Pranab 632.80 7/30/2013 7 Finance 8 Guru 722.50 6/17/2014
Чтение определенных столбцов и строк
Подобно тому, что мы уже видели в предыдущей главе для чтения файла CSV, функция read_json библиотеки pandas может также использоваться для чтения некоторых определенных столбцов и определенных строк после чтения файла JSON в DataFrame. Для этой цели мы используем метод многоосевого индексирования .loc () . Мы выбрали отображение столбца Зарплата и Имя для некоторых строк.
import pandas as pd data = pd.read_json('path/input.xlsx') # Use the multi-axes indexing funtion print (data.loc[[1,3,5],['salary','name']])
Когда мы выполняем приведенный выше код, он дает следующий результат.
salary name 1 515.2 Dan 3 729.0 Ryan 5 578.0 Rasmi
Чтение файла JSON как записей
Мы также можем применить функцию to_json вместе с параметрами для чтения содержимого файла JSON в отдельные записи.
import pandas as pd data = pd.read_json('path/input.xlsx') print(data.to_json(orient='records', lines=True))
Когда мы выполняем приведенный выше код, он дает следующий результат.