Что такое HEIF и зачем нужны 10-битные фото и видео?

10-битное видео, 10-битные режимы фотосъемки и возможность снимать файлы «HEIF» — все эти функции все чаще добавляются к камерам. Но в чем польза и когда следует использовать эти режимы? Мы рассмотрим, как данные захватываются, как они хранятся и, следовательно, какие преимущества вы должны (и не должны) ожидать от 10-битного съём.

Линейное кодирование

В отличие от зрительной системы человека, камеры записывают свет линейным образом: в два раза больше фотонов, попадающих на датчик, приводит к вдвое большему сигналу и записывается с использованием вдвое большего цифрового числа.

Это означает, что половина ваших доступных необработанных значений всегда потребляется самой яркой остановкой света, которую вы зафиксировали. Это просто базовая логика: каким бы ни было самое яркое значение, которое вы зафиксировали, вдвое меньше света (то есть: на одну ступень меньше света) будет захвачено значение вдвое меньше.

Результатом этого является то, что в Raw вы можете хранить примерно такое же количество ступеней динамического диапазона, как и битовая глубина вашей камеры . Или, чтобы получить причину и следствие в обратном порядке: будет выбран аналого-цифровой преобразователь, потому что он имеет достаточную разрядность для кодирования сигналов, исходящих от датчика. Прежде всего, это вопрос обеспечения возможности захвата и сохранения всей информации, поступающей с сенсора. Увеличение битовой глубины сверх того, что требуется для полного кодирования сигнала, не даст вам «более тонкую градацию» или «на X миллионов цветов больше», это просто будет означать создание файлов гораздо большего размера, которые записали шум в тенях более подробно. .

Итак, почему мы записываем линейные файлы Raw? Потому что это проще всего сделать с точки зрения обработки, сохраняет всю информацию, которую вы впервые захватили, и не является неуправляемо большим, поскольку вы обычно захватываете только одно необработанное значение для каждого пикселя, а не отдельные красный, зеленый и синий.

Неэффективность линейного кодирования

Линейное кодирование выделяет половину значений самой яркой ступени, четверть — следующей ступени и так далее.

Теперь рассмотрим дробовой шум фотонов; случайность света, который вы захватили. Дробовой шум — это, по сути, квадратный корень сигнала. Таким образом, очень яркие части изображения (которым вы посвящаете большую часть необработанных значений) имеют наибольшее количество шума, потому что квадратный корень из большего числа больше, чем из меньшего числа. Он не выглядит таким шумным, потому что шумность больше связана с отношением сигнал/шум, а не с абсолютным уровнем шума. Но это означает, что вы фиксируете множество очень мелких деталей чего-то с очень высокой дисперсией.

Что еще хуже, зрительная система человека хуже различает детали и цвета в ярких областях, чем в темноте: вы перекодируете зашумленный сигнал, который не особенно визуально значим. Короче говоря: линейное кодирование крайне неэффективно. (Некоторое сжатие Raw использует это преимущество: сжатие перекодированных светлых участков таким образом, что это не оказывает существенного влияния на изображение визуально или с точки зрения гибкости редактирования).

Гамма-кодирование

Гамма-кодирование — это процесс применения нелинейного преобразования к линейным данным или, проще говоря, перераспределения необработанных данных более компактным способом. Обычно, когда вы открываете изображение для просмотра, применяется противоположная гамма-кривая, так что вы возвращаетесь к тому, что выглядит как исходное изображение, которое вы пытались запечатлеть.

Гамма-кодирование + тоновая кривая

Поскольку это кодирование является нелинейным, вы можете сжать некоторые или все данные линейного файла Raw в файл с гораздо меньшей битовой глубиной. Почти все современные камеры выводят 8-битные JPEG-файлы, которые обычно включают около девяти ступеней DR (больше, когда используются режимы расширения DR и адаптивные кривые тона). В принципе, вы, вероятно, могли бы уместить еще больше, но в дополнение к гамма-кодированию ** обычно применяется кривая «S», которая дает хорошее резкое изображение.

После гамма-кодирования к большинству файлов JPEG применяется S-образная кривая, чтобы получить изображение с хорошим уровнем контраста.
Это присваивает почти 70% доступных 256 значений четырем ступеням вокруг среднего серого.
Это уменьшает возможности для внесения изменений.

При грамотном сжатии размер файла JPEG может составлять 1/6 размера файла Raw, но при этом он хорошо передает все, что вы видели, когда делали снимок. Или, по крайней мере, все, что может показать ваш 8-битный дисплей со стандартным динамическим диапазоном. Однако из-за того, что большое количество данных было удалено, а кривая «S» раздавила блики и тени, JPEG предлагает гораздо меньшую гибкость, если вы хотите внести в него серьезные изменения.

В 8-битном файле содержится 256 значений данных для каждого цветового канала, и к тому времени, когда вы распределите эти значения между девятью ступенями, у вас будет не так много возможностей для корректировки значений без появления пробелов и появления постеризации, а не плавные тональные переходы. Тем не менее, это отличная конечная точка, особенно для дисплеев SDR.

Решение о том, снимать в формате Raw или JPEG, вообще говоря, зависит от того, планируете ли вы редактировать результаты или представлять их более или менее в том виде, в каком они были сняты. Необработанные данные обычно являются 12- или 14-битными, и хотя их линейное кодирование действительно неэффективно, тот факт, что они не были подвергнуты демозаике, делает их управляемыми. Но в большинстве случаев конечное изображение может быть хорошо выражено в 8-битном формате JPEG. Так зачем нам 10-битные опции?

Кодирование журнала — золотая середина

При логарифмическом кодировании доступные значения распределяются более равномерно: большинству остановок присваивается одинаковое количество значений данных, а не эффектно взвешивается в сторону светлых участков, как при линейном кодировании, или фокусируется на средних тонах, как большинство стандартных кривых тона.

Логарифмические кривые (в данном случае S-Log3 от Sony) гораздо более равномерно распределяют доступные значения между захваченными данными, сохраняя хороший уровень гибкости для редактирования, но без неэффективности линейного кодирования.
Обратите внимание, что отношение в тенях не является логарифмическим (там, где этот подход выделял бы больше значений данных, чем исходный линейный захват).

По сути, это умный способ сохранить хорошую степень редактируемости в гораздо более эффективном файле. Вы можете понять, почему это стало популярным способом работы с видео, при котором вы можете сохранить гибкость редактирования, но при этом воспользоваться очень эффективными, хорошо оптимизированными кодеками и типами файлов, которые были разработаны для видео.

Переход от 8 к 10-битным означает, что у вас есть 1024 значения для обмена, поэтому вы можете сохранить в четыре раза больше информации о каждой захваченной вами остановке. В свою очередь, это означает гораздо большую гибкость, если вы попытаетесь внести существенные коррективы в цвет и контраст, с гораздо меньшим риском постеризации.

Обычно производитель смотрит на производительность своих камер, а затем разрабатывает логарифмическую кривую, которая может кодировать большую часть используемого динамического диапазона камеры. Вот почему большинство производителей закончили с несколькими логарифмическими кривыми: вы не хотите делиться своими 1024 значениями на 14 шагах, если выход вашей камеры неприемлемо шумен после шага 11.

Однако для большинства приложений 10-битное кодирование журнала значительно расширяет возможности редактирования, при этом размеры файлов не становятся слишком громоздкими.

Зачем еще мне нужен 10-битный?

Таким образом, 10-битный захват позволяет камерам предлагать гораздо больше редактируемого видео без добавления размера и потенциальных проблем совместимости (и юридических сложностей) при съемке необработанного видео. Но есть и другие области применения, которые обещают пользу как для видео, так и для фотосъемки.

В настоящее время широко доступны телевизоры нового поколения, которые могут отображать более широкий динамический диапазон, чем старые дисплеи SDR. Все большее число фильмов и телепередач снимается в формате HDR, и сервисы Steam могут доставлять эти кадры HDR в дома людей.

Hybrid Log Gamma (HLG) и Perceptual Quantizer (PQ) — два наиболее распространенных способа кодирования данных HDR. Оба требуют 10-битных данных, потому что они пытаются сохранить более широкий тональный диапазон, чем типичный 8-битный материал. Не дайте себя обмануть словом «Log» в названии HLG: только часть кривой является логарифмической. Как HLG, так и PQ, как и JPEG, предназначены для использования в качестве конечных точек, а не промежуточных.

Все большее число камер могут снимать видео HLG или PQ для воспроизведения на HDR-телевизорах. Но они также все чаще предлагают 10-битные кадры, основанные на этих стандартах, для воспроизведения на дисплеях HDR.

Значит, 10-битные кадры нужны для реалистичного HDR?

Справедливо сказать, что в предложениях разных производителей камер нет большой последовательности. Некоторые производители камер позволяют снимать 10-битные файлы только при захвате настоящих HDR-изображений , в то время как другие предлагают профили SDR только в режиме HEIF, а некоторые позволяют снимать любые комбинации по вашему желанию.

С нашей точки зрения, не так много точечной съемки 10-битных фотографий с обычными кривыми SDR: данные не хранятся в форме, предназначенной для редактирования, а Raw в любом случае остается более мощным вариантом, поэтому все, что вы делаете, — это захват. что- то, что в конечном итоге будет очень похоже на JPEG, но не так широко поддерживается.

Съемка настоящих HDR-изображений (HLG или PQ) в 10-битном режиме имеет гораздо больше смысла. Они могут выглядеть впечатляюще при отображении на HDR-дисплее, с бликами, которые блестят так, что это трудно передать на обычных фотографиях. Однако на данный момент вам обычно приходится подключать камеру к телевизору с помощью кабеля HDMI для просмотра изображений, что не очень практично. Но для нас именно в этом и заключается ценность 10-битных фотографий с фотографической точки зрения.

В индустрии обработки изображений предстоит проделать большую работу, чтобы повысить поддержку настоящих фотографий HDR. Нам нужны инструменты редактирования, которые позволят нам точно настроить Raw в кадры HDR, как мы привыкли делать при создании собственных JPEG. Но прежде всего нам нужна более широкая поддержка и кросс-совместимость, чтобы мы могли обмениваться и просматривать 10-битные файлы без необходимости подключать нашу камеру к дисплею. Пока эта проблема не будет решена, возможность снимать 10-битные кадры имеет разочаровывающе ограниченное применение.

Что за HEIC? Что такое файлы HEIF?

10-битные режимы фотосъемки на самых последних камерах снимают файлы HEIF в формате HEIC с одним изображением, которые по сути представляют собой отдельные кадры видео H.265. Несмотря на то, что они 10-битные, более эффективное сжатие означает, что они могут сохранять то же качество изображения в файле гораздо меньшего размера. Вместо этого Panasonic использует менее распространенный формат «HSP» для своих 10-битных фотографий, который является частью стандарта HLG. Это еще менее широко поддерживается, чем HEIF, но вам, вероятно, придется подключить камеру к дисплею для правильного просмотра файлов в любом случае.

Кадры за сценой можно смотреть в нашей группе вконтакте тут — https://vk.com/club_fidller

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Bio
Latest Posts

Aleksandr Fidller

Журналист, инженер, автор многочисленных статей и публикацией о киноиндустрии. По всем вопросам сотрудничества, публикаций писать в телеграм - https://t.me/fidller