Статьи

Сравнение библиотек первых наций Онтарио с использованием открытых данных Онтарио

Недавно я скачал очень классный набор данных по библиотекам Онтарио из Каталога открытых данных Онтарио . Набор данных содержит 142 столбца информации, описывающей 386 библиотек в Онтарио, что представляет собой фантастически обширную работу по сбору данных для таких важных учреждений культуры (хотя самая последняя доступная информация относится к 2010 году). Одна колонка, которая особенно заинтересовала меня, была «Тип библиотечного обслуживания», который разбивает библиотеки на:

  • Публичная или союзная библиотека (247)
  • Библиотека LSB (4)
  • Библиотека первых наций (43)
  • Окружная, окружная кооперативная или областная муниципальная библиотека (13)
  • Договаривающийся муниципалитет (49)
  • Сокращение LSB (14)

Я увидел тип Библиотеки первых наций и подумал, что для меня было бы действительно полезно сравнить библиотеки первых наций со всеми другими типами библиотек вместе взятыми и посмотреть, как они сравниваются, основываясь на некоторых интересных показателях. Чтобы сделать эти сравнения в этом посте, я использую несколько скрипичных сюжетов; там, где вы видите большую объемность графика, это говорит о том, что значение на оси у более вероятно для библиотеки по сравнению с более тонкими частями.

Наше первое сравнение, показанное ниже, показывает, что размеры местного населения НАМНОГО более вариабельны среди типов библиотек «Другие» по сравнению с библиотеками первых наций. С первого по третий квартиль в библиотеках первых наций, как правило, проживает от 250 до 850 местных жителей, в то время как в других библиотеках, как правило, насчитывается от 1110 до 18 530 местных жителей!

        isFN.Library 0%    25%  50%   75%    100%
1         Other Libraries 28 1113.5 5079 18529 2773000
2 First Nations Libraries 55  254.5  421   857   11297

Учитывая огромную разницу в размерах совокупности, для которой были созданы эти библиотеки, сравнения между типами библиотек необходимо взвешивать в соответствии с этими размерами, чтобы сравнения делались пропорциональными. В этом духе на следующем графике сравнивается распределение количества держателей карт на одного жителя по типу библиотеки. Подумав об этом показателе на мгновение, возможно, что человек, не проживающий по соседству с библиотекой, сможет получить там карточку. Если у всех жителей района библиотеки есть карточка, а за пределами этого района есть люди с карточками, то в библиотеке может быть более 1 держателя карточки на каждого жителя.

Глядя на сюжет, становится очевидным несколько моментов: во-первых, библиотеки коренных народов чаще всего перегружены держателями карт (больше владельцев карт, чем местных жителей, 14% библиотек первых наций против 4% других библиотек) , В нижней части спектра библиотеки коренных наций демонстрируют небольшую (незначительную) тенденцию иметь меньше держателей карт на одного жителя, чем другие библиотеки.

 isFN.Library 0%  25%  50%  75% 100%
1         Other Libraries  0 0.20 0.37 0.55  2.1
2 First Nations Libraries  0 0.19 0.32 0.77  2.8

Далее мы рассмотрим очень интересную метрику, потому что она выглядит очень иначе, когда вы сравниваете ее в необработанном виде с тем, когда вы сравниваете ее пропорционально размеру популяции. На графике ниже показано распределение английских названий в обращении по типу библиотеки. Не должно быть слишком удивительным, что другие библиотеки, обслуживающие группы населения в диапазоне от маленьких до ОЧЕНЬ больших, также довольно сильно различаются по количеству английских названий в обращении (от примерно 5600 до 55000, от первого до третьего квартиля). С другой стороны, у нас есть библиотеки первых наций, обслуживающие меньшие по численности группы населения, которые в этом отношении значительно меньше (от 1500 до 5600 в первом-третьем квартиле).

isFN.Library 0%    25%   50%   75%   100%
1         Other Libraries  0 5637.5 21054 54879 924635
2 First Nations Libraries  0 1500.0  3800  5650  25180

Хотя вышеприведенная перспектива показывает, что в библиотеках Первых наций в обращении, как правило, значительно меньше английских названий, все выглядит совсем иначе, когда вы взвешиваете этот показатель в зависимости от численности местного населения. Здесь сюжет для библиотек первых наций очень похож на «Поцелуй Херши», тогда как сюжет «Другие библиотеки» немного напоминает туалетный поршень. Другими словами, библиотеки первых наций имеют тенденцию иметь больше английских названий в обращении на одного жителя, чем другие библиотеки. Это ничего не говорит о качестве этих книг, доступных в библиотеках коренных народов. По этой причине было бы неплохо иметь меру, даже такую ​​простую, как средний / средний возраст / дата авторского права книг в библиотеках, чтобы служить приблизительным показателем качества книг, находящихся в каждой библиотеке. Сюда,мы бы знали, являются ли книги в этих библиотеках современными или устаревшими.

 

 isFN.Library 0%       25%      50%       75%      100%
1         Other Libraries  0 0.9245169 2.698802  5.179767 119.61462
2 First Nations Libraries  0 2.0614922 7.436399 13.387416  51.14423

Для следующего сюжета я взял все значения «на человека» и нормировал их. То есть для любого заданного значения переменных, представленных ниже, я вычел из этого значения минимально возможное значение, а затем разделил результат на диапазон значений этого показателя. Таким образом, любые значения, близкие к 1, являются более высокими значениями, а значения, близкие к 0, являются более низкими значениями. Затем я взял медианное значение (по типу библиотеки) для каждого показателя и нанес на график ниже. Выражаясь таким образом, хотя это и может быть ошибочным, мы видим, что библиотеки первых наций, как правило, тратят больше денег на одного местного жителя в разных регионах, чем другие библиотеки. Доходная сторона выглядит немного иначе. Несмотря на то, что они, как правило, получают больший доход на одного местного жителя, они, по-видимому, генерируют меньший доход от собственного капитала, получают меньше пожертвований и получают меньше денег в местных операционных грантах,все пропорционально количеству местных жителей. Три области, в которых они превосходят (опять же, это срединная мера), это общий операционный доход, провинциальное операционное финансирование и особенно гранты проекта.

Здесь я решил сосредоточиться на распределительных различиях в чистой прибыли на одного жителя по типу библиотеки. Учитывая, что библиотеки являются некоммерческими организациями, вы ожидаете увидеть нечто похожее на график, показанный для «других» библиотек, где подавляющее большинство находится на нулевой линии или около нее. Тогда мне интересно, тем более что я работаю с некоммерческими организациями, чтобы увидеть сумасшедшую изменчивость в заговоре библиотек коренных народов. Верхний конец этого, кажется, от некоторых чрезвычайно высоких выбросов, поэтому я решил вынуть их и переселить.

На графике ниже я фактически увеличил масштаб и вижу, что, похоже, больше библиотек, показывающих чистый убыток на человека, чем в статусе чистого дохода.

  isFN.Library      0%    25%   50%  75%   100%
1         Other Libraries -149.87  -0.49  0.00 1.16  34.35
2 First Nations Libraries  -76.55 -17.09 -0.88 0.40 250.54

Я хотел увидеть, как эта чистая прибыль на человека будет отображаться в Онтарио, поэтому я использовал замечательный пакет ggmap , который, к моему удовольствию, является дружественным для Канады! Иди в Канаду! На этой первой карте мы видим, что библиотеки Первых Наций в Южном Онтарио (часть Онтарио, которая выглядит как голова дракона), кажется, «в порядке» в этом измерении, с одной библиотекой на «шее» дракона, кажущейся взять немного больше красного оттенка, еще один запад, приобретающий очень яркий зеленый цвет, и несколько ближе к Манитобе, которая кажется худшей.

Для большей наглядности этих плохо работающих библиотек я убрал все библиотеки на уровне или выше нуля по этому показателю. Теперь меньше отвлекающих факторов, и легче увидеть худших исполнителей.

Наконец, в качестве проверки работоспособности я повторно выразил вышеуказанную меру в соотношении общих операционных доходов к общим операционным расходам, чтобы увидеть, была ли полученная географическая структура достаточно схожей. Все, что приобретает значение меньше 1, тратит больше, чем зарабатывает доход, и, таким образом, «в минусе». Хотя есть некоторые различия в том, как цвета расположены в Онтарио, результат в основном одинаков.

На этом пока все! Я напишу свой код здесь как можно скорее, чтобы я мог поделиться своей работой, как обычно. Если у вас есть какие-либо вопросы или идеи для дальнейшего анализа, не стесняйтесь, напишите мне.

В заключение, я думаю, что это потрясающе, что этот сбор данных был сделан, но тот факт, что самые последние доступные данные по состоянию на 2010 год очень запоздал. Что здесь случилось? Библиотеки так важны по всем направлениям, поэтому, пожалуйста, правительство провинции Онтарио, продолжайте сбор данных!