Статьи

Использование журналистики данных для генерации идей контента

Царапайте буквы, пишущие ДАННЫЕ среди беспорядка.

Фото: justgrimes

Строго говоря, журналистика данных — это рассказывать истории с цифрами.

Но давайте воспользуемся более широким определением в этой статье, поскольку для меня данные, используемые для рассказа истории, могут принимать разные стороны, включая простые факты (исторические, биографические, географические) и различные мультимедийные материалы (интервью, фоторепортажи, видеоматериалы). Идея состоит в том, чтобы дать вам общее представление о том, что такое журналистика данных и как вы можете использовать ее объектив, чтобы получить отличные идеи контента.

Идентификация данных

Первым шагом является определение данных, которые вы можете использовать. Но перед этим вам придется определить свои потребности.

Какую тему вы хотите охватить? Вы следуете за сезонным трендом (неделя моды, премьера фильма, праздники), или вы хотите заполнить свое поле контентом, который не меняется во времени, то есть холодным контентом (породы собак, рецепты)?

В то время как данные холодного контента легко найти в Интернете и могут создать большой длинный контент, более теплый контент получить сложнее. Вы должны быть в курсе любого новостного события в вашей области и быть готовыми действовать максимально быстро, так как многие конкуренты делают то же самое одновременно.

После того, как вы определили тип данных, которые вы ищете, вам нужно приложить руку к ним.

Открытые данные — отличный способ получить бесплатные данные, которые были собраны правительственными организациями. Каталоги данных — хорошая отправная точка для вашего поиска. Этот сайт предоставляет открытые источники данных для ряда стран.

Перестройка Нью-Йорка От зданий до велосипедных дорожек и живописи над Бродвеем, как город изменился за 12 лет при мэре Майкла Р. Блумберга.

Изменение облика Нью-Йорка: от зданий до велосипедных дорожек и рисования над Бродвеем — как город изменился за 12 лет
при мэре Майкла Р. Блумберга.

Например, предположим, что вы заинтересованы в услугах по уходу за полостью рта в Квинсленде. Вы можете получить ежемесячную выписку статистики о листе ожидания в каждой клинике . Кроме того, вы можете получить статистику преступности за инциденты в Вашингтоне, округ Колумбия.

Эти открытые каталоги данных являются хорошим источником, когда вы ищете конкретные данные. Но вы также можете просматривать их, чтобы получить новые идеи контента.

При просмотре сайтов с открытыми данными важно сохранять открытость: вы можете копать некоторые совершенно не связанные данные и находить новые преимущества в своем контенте.

Например, просмотр набора данных по социальному обеспечению в США может вдохновить вас на некоторые идеи, например, имена детей из фильмов или сериалов , от знаменитостей, для определенных стран или периодов времени. Вы можете соотнести эти данные с премьерами фильмов или спортивными событиями в новостях, чтобы добавить к ним глубины.

Программа просмотра Google Книг — это отличный инструмент для визуализации слов, появляющихся в книгах в течение определенного периода времени и определенного языка.

Например, следующий график показывает наличие в литературе четырех имен персонажей « Властелина колец», а именно: Арвен, Эовин, Галадриэль и Исильдур — с первым пиком в 1979 году и вторым в 2004 и 2005 годах.

Google Книги ngram

*Источник

Если вы ищете теплый контент, два источника могут помочь вам определить, что происходит в конкретной стране или на каком-либо языке прямо сейчас или в определенное время: статистика трафика статьи в Википедии и Google Trends .

Оба сайта также могут помочь вам определить шаблоны в искомых терминах.

Например, порода собак в основном ищется по воскресеньям в США, в то время как соответствующая страница Википедии на английском языке в основном просматривается по вторникам. Ну, я не могу многого из этого извлечь, но если ваш контент о собаках, возможно, вы можете. По крайней мере, вы знаете, когда публиковать свой контент и когда продвигать его в социальных сетях, чтобы получить максимальную отдачу.

Google Trends идет немного дальше, поскольку связывает причины пиков с конкретными новостями и может дать результаты для города, что является хорошим способом получить представление от местной аудитории.

Например, неделя моды достигла максимума между 9 и 15 февраля в США (для недели моды в Нью-Йорке) и между 6 и 12 апреля в Австралии (для недели моды в Сиднее).

Поэтому, в зависимости от вашей аудитории, вы знаете, когда нужно заранее подготовиться к теплому контенту. Следует помнить, что местная аудитория в первую очередь больше интересуется местными новостями.

Storification Data

Кто, что, когда и где находятся в области журналистики данных основные вопросы, на которые нужно ответить, например, в любой другой форме журналистики. Почему это не так легко передать, так как требуется реальный анализ, который трудно выразить в визуальных элементах. Почему нужно больше места и больше слов, чтобы быть полностью объясненным.

Чтобы превратить чистые данные в хорошую историю, вам нужно найти преимущество, то есть спросить себя, на какой конкретный вопрос вы хотите ответить.

Все 9 866 539 зданий в Нидерландах затенены в зависимости от года постройки.

Все 9 866 539 зданий в Нидерландах заштрихованы
по году постройки.

Поиск повествования также может оживить факты и данные, которые вы собрали.

Хорошей отправной точкой является определение того, какая часть данных не соответствует остальным: выбросы. В статистике выброс является точкой, далекой от других наблюдений. В наборе данных статистики преступности в Вашингтоне, округ Колумбия, это может быть область, более подверженная конкретному типу преступлений, или тип преступления, которое редко происходит в течение дня. Короче говоря, все, что отличается от шаблона данных, может дать вам преимущество.

Но если выбросы могут составить хорошую историю, они также могут быть признаком ошибки в данных, поэтому не забудьте перепроверить их.

В большинстве случаев собранные данные могут вызывать различные вопросы. Если для ваших пользователей полезно предложить различные способы взаимодействия с одними и теми же данными, например, предоставляя как представление карты, так и представление диаграммы, это также хорошая возможность для создания различного содержимого из одного и того же набора данных.

Обзорная история может принести глобальную осведомленность о вашей теме. Это широкое представление можно проиллюстрировать с помощью представлений, более близких к вашей аудитории (как тематически, так и географически), что в итоге приведет к большему количеству контента.

В качестве примера давайте попробуем провести мозговой штурм на тему недель моды. К нему можно обратиться с разных точек зрения:

  • карта следующих недель моды с многогранным поиском (Haute Couture / готовая одежда, дома моды, коллекции для мужчин и женщин)
  • сравнение цветов / узоров / материалов между разными годами местной недели моды
  • сравнение цветов / узоров / материалов между разными неделями местной моды в течение одного сезона
  • Сроки биографии создателей / домов моды, с представительными работами

Отзывы также являются отличным способом вдохнуть жизнь в ваш контент. В Бостонском Марафоне Момент 4:09:43 цель состояла в том, чтобы выйти за рамки катастрофического события и дать представление от обычных людей, которые были там, когда это произошло. С таким ошеломляющим событием число жертв удерживало аудиторию от людей, стоящих за цифрами.

Поместив лица и голоса перед цифрами, читатели смогли почувствовать причастность к истории, быть ее частью. Если этот пример особенно силен, вы должны иметь в виду, что данные могут восприниматься как очень сухие, а отзывы могут вернуть им эмоции.

Визуализация данных

Иногда простейшая визуализация является наилучшей, чтобы передать вашу точку зрения. На самом деле, вы должны сдерживать себя, чтобы поставить визуализацию и взаимодействие перед вашим контентом, так как он все еще должен рассказывать историю.

После этого обычного предисловия предосторожности давайте рассмотрим различные типы визуализаций, сгруппированные по типу данных, которые вы хотите показать, каждый из которых выражает особое значение.

Тур по зоопарку визуализации группирует их в пять комплектов:

  • Временной ряд (временность): индексный график, составной график, малый кратный, график горизонта
  • Статистические распределения: стволовая и листовая диаграммы, qq-диаграмма, Scatter Plot Matrix (SPLOM), параллельные координаты
  • Карты (география, пространственное представление): карта потоков, карта хороплетов, карта градуированных символов, картограмма
  • Иерархии: диаграмма нод-линк, дендрограмма, диаграмма смежности (солнечные лучи, сосулька), диаграмма вложений (квадратная древовидная карта, круговая упаковка)
  • Сети (взаимосвязи): силовая направленность, дуговая диаграмма, матричные виды

В то время как Кристиан Беренс группирует их в восемь комплектов:

  • Корреляции: пузырьковая диаграмма, диаграмма рассеяния
  • Непрерывные величины: спарклайны, диаграмма с областями с накоплением, многосетевой линейный график, простой линейный график
  • Дискретные величины: диаграмма диапазона, изометрическая гистограмма, столбчатая диаграмма с накоплением, точечная матрица, многосетевая гистограмма, простая гистограмма
  • Пропорции: круговая диаграмма, простая круговая диаграмма
  • Потоки: дуги нити, диаграмма Санки
  • Иерархии: древовидная схема, древовидная карта
  • Сети: карта-схема, круг отношений, жемчужное ожерелье
  • Пространственные конфигурации: топографическая карта, тематическая карта

Чтобы выбрать лучшую графическую форму, другой подход заключается в том, чтобы подумать о том, что вы хотели бы показать: сравнение (среди элементов или с течением времени), взаимосвязь и распределение (в зависимости от количества переменных) или композиция (изменяющаяся со временем или статика).

Следующий инструмент для предложения диаграмм был разработан Эндрю Абелой и доступен на его сайте, посвященном методам Extreme Presentation .

Выбор хорошего графика

Как только вы выбрали лучший тип визуализации для выражения вашего сообщения, вам все равно придется его реализовать. Существует множество библиотек javascript, которые можно использовать, см., Например , статью Томаса Греко для краткого их списка.

Если вы предпочитаете держать руки подальше от кода, некоторые службы могут помочь вам создавать встроенные визуализации непосредственно из ваших данных:

  • Datawrapper используется во многих цифровых изданиях газет. Этот бесплатный проект с открытым исходным кодом призван стать инструментом для управляемой данными журналистики.
  • Tableau public — это бесплатный инструмент для создания интерактивных визуализаций и их публикации в Интернете.
  • Infogr.am — это бесплатное приложение для создания инфографики и диаграмм.
  • Story Maps сочетает в себе интерактивные карты и мультимедийный контент. Он предоставляет некоторые интересные приложения, такие как Spyglass или журнал карт, чтобы показать предопределенный пользовательский опыт. Этот сервис основан на картографической платформе ArcGIS, в которой есть некоммерческая организационная программа.

Вдохновляющие сайты

  • Если длинноформатный контент Snow Fall был одним из первых широко распространенных мультимедийных сюжетов, The New York Times продолжает публиковать великолепный контент в области визуализации данных, пояснительной графики и других визуальных и интерактивных функций. Они собирают свою наиболее символичную продукцию на ежегодных страницах ( 2012 , 2013 ), на которые следует обратить особое внимание.
  • Guardian Interactive перечисляет последние интерактивные истории, опубликованные на их сайте, от мультимедийных длинных статей до интерактивной инфографики и видео.
  • На веб-сайте Texas Tribune есть целый раздел, позволяющий пользователям взаимодействовать с данными. Несмотря на то, что эти данные находятся в свободном доступе в другом месте, так как они поступают из общедоступных источников данных, этот раздел сайта составляет от 45% до 55% всего трафика сайта. Это ясно показывает, что если вы предоставите данные, нацеленные на вашу аудиторию, осмысленно и привлекательно, ваши посетители вернутся к ним, будут использовать их и делиться ими — трафик, который можно легко использовать в социальных сетях.
  • La Nación , газета из Аргентины, предлагает свои лучшие статьи по визуализации данных на своем сайте.
  • Le Monde , французская газета, также представляет свои визуализации в специальном разделе.

Как видите, многие газеты стараются дополнить свое цифровое издание интерактивным датавизом. Если наиболее известные из них являются источником вдохновения для их групп по работе с большими данными, вам следует сделать свой выбор из менее всемирно известных, так как небольшая команда может предложить инновационную идею, которая может вдохновить ваш собственный контент.

Погрузитесь глубже в тему

Эта статья в основном сосредоточена на поиске идей контента из источников данных, чтобы привнести пищу в процесс ваших идей. Но это только очень узкий взгляд на журналистику. Если вы заинтересованы в многочисленных действиях, связанных с журналистикой данных, вот несколько ссылок, которые можно углубить:

  • Журналистика, управляемая данными, является инициативой Европейского центра журналистики. Помимо того, что он является центром новостей и ресурсов, он предлагает курс MOOC под названием « Журналистика с данными: первые шаги, навыки и инструменты» . Курс теперь закрыт и доступен в режиме архива только до конца года, но он действительно стоит того времени, которое вы можете посвятить ему.
  • «Справочник по журналистике данных» — это бесплатный справочник с открытым исходным кодом от Европейского центра журналистики и Фонда открытых знаний. Он охватывает журналистику данных в отделах новостей, тематические исследования, а также способы получения, понимания и предоставления данных вашей аудитории.
  • Школа данных , поддерживаемая Open Knowledge Foundation, предоставляет множество инструментов и статей для извлечения, очистки, анализа, представления и обмена данными.

Я надеюсь, что теперь у вас есть полное представление о том, что такое информационная журналистика, и особенно о том, как она может помочь вам придумать идеи контента. Использование различных источников данных, сопоставление несвязанных данных для освежения вашей точки зрения, ознакомление с методами визуализации и, прежде всего, вдохновение от того, что делают другие: это уроки, которые вы должны извлечь из этой статьи.

Cet article est aussi disonible en français