Статьи

Будущее образов? Изменение размера изображения с учетом содержания

Время от времени что-то приходит, что просто заставляет вас идти «вау». Я думаю, что это один из тех моментов.

На прошлой неделе Шай Авидан и Ариэль Шамир впервые продемонстрировали свое новое исследование « Content Aware Image Resizing », как показано в этом ролике YouTube . Демонстрация намного лучше справляется с объяснением, чем я могу, но резюме выглядит примерно так:

В настоящее время у нас есть два метода представления фотографических изображений в жидкой (изменяемой) разметке. Большую часть времени мы обрезаем наше изображение до размера, который нам нравится, и затем фиксируем его для отображения в тех точных измерениях, позволяя тексту обтекать и обтекать его при изменении размера.

Также возможно (хотя и не часто) устанавливать размер изображения в процентах от ширины страницы, позволяя масштабировать его вместе со страницей. Конечно, это неизбежно приводит к появлению артефактов, искажений и шума при всех нестандартных измерениях.

Изменение содержимого изображения в действии «Content Aware Image Resizing» (CAIR) принимает совершенно другую тактику. Если мы уменьшим ширину нашего изображения на 1 пиксель вместо удаления случайного вертикального столбца пикселей, процесс CAIR определяет часто извилистый «путь наименьшей информации» сверху вниз, который затем удаляется с дисплея. Визуально важные области, насыщенные деталями, такие как люди, лица и текст, остаются практически нетронутыми, в то время как «области с низкой плотностью данных», такие как чистое небо, трава и бетон, тщательно обрезаются.

Концепция работает аналогично при увеличении изображения. Критические данные изображения защищены, в то время как новое изображение генерируется в областях с низким уровнем данных. Этот процесс также позволяет пользователям вручную «помечать» области изображения как защищенные, чтобы их не затронули алгоритмы обработки.

Удивительные и впечатляющие вещи.

Это поднимает некоторые интересные вопросы, хотя.

а). Возможно ли, что мы увидим, как эта технология дойдет до наших рабочих столов раньше, чем позже?

Хотя, вероятно, команда, стоящая за этой идеей, хочет получить некоторую отдачу от своих вложений в время и деньги, ее продажа потребителям «Джо Сикспака» кажется сложной задачей для меня. Однако, если бы им удалось создать набор бесплатных расширений или плагинов для Firefox, IE7, Safari и Opera, они быстро создали бы жизнеспособную базу пользователей этой технологии. Такие компании, как Adobe, хотели бы лицензировать свою технологию, чтобы позволить своим пользователям Photoshop отмечать изображениями области, защищенные от изменения размера. Если все пойдет по плану, браузеры могут отрисовывать изображения CAIR изначально.

Я не уверен, каковы ограничения, но мне кажется, что возможно закодировать эти «защищенные от изменения размера» данные в существующем формате PNG32, позволяя пользователям с подключаемым модулем CAIR получать интеллектуальное изменение размера, в то время как другие видят садовый сорт PNG. Fireworks, безусловно, кодирует много данных в свои PNG, и эти данные игнорируются всеми другими приложениями.

В качестве альтернативы Кевин предположил, что для них может быть более продуктивным записать свой процессор изображений в SWF и позволить разработчикам лицензировать и развертывать его для каждого сайта отдельно. Я думаю, что в идеале я бы предпочел иметь несколько крупных, важных клиентов, таких как Adobe и Microsoft, а не тысячи мелких клиентов.

Будет интересно посмотреть, что они запланировали.

б). Будете ли вы рады, что фотожурналистика с новостного сайта, такого как CNN или BBC, «отредактирована» с помощью технологии, подобной CAIR?

Конечно, когда какой-либо редактор редактирует фотографию, он или она вносит редакционные изменения в содержание изображения — оставляя одни кусочки, обрезая другие — и мы все принимаем это как часть процесса журналистики.

Но с CAIR у нас фактически есть «машина», принимающая редакторское решение по рассказываемой истории. Это добавление или удаление данных, которые, по его мнению, имеют меньшую ценность, но часто для нас это промежутки, которые рассказывают историю. Например:

  • Насколько близко были те протестующие против ОМОНа, когда вспыхнуло насилие?
  • Был ли президент слишком близко и знаком с этим симпатичным стажером в толпе?
  • Был ли тот знаменитый бразильский нападающий действительно вне игры, когда он забил в финале чемпионата мира?

Ваш ответ на эти вопросы может отличаться в зависимости от разрешения вашего монитора.

Интересные времена.

С тех пор Шай Авидан работает в Adobe в их офисе в Ньютоне, штат Массачусетс.