Как разоблачить фотоманипуляции
Речь в этом материале пойдёт не о грубой фотожабе из ЖЖ, сделанной в стиле мультфильма «Южный парк», а о попытках выдать неправду за правду. И вот вам свежий, но для XXI века нехарактерно нецифровой пример, о котором пишут информационные агентства. В Китае один крестьянин в сентябре прошлого года находит у друга плакат с изображением южнокитайского тигра. Таких тигров, к слову, никто не видел уже лет 30. Злоумышленник сажает постер в кусты недалеко от дома, делает снимки и несёт продавать. Их публикуют агентства и зарубежные газеты, случается мировая сенсация, местный минлесхоз выписывает автору премию в две тысячи долларов в эквиваленте, но в Интернете с самого начала начинается шепоток: мол, тигр какой-то плоский, и вообще, был похожий плакат. В результате всё вскрывается, заводят уголовное дело, и вот только что, 29 июня, официально объявили, мол, извините, братцы, креатив-подделка, автор мошенник.
Или о родном и понятном. Помните знаменитое «Знамя Победы над Рейхстагом» Евгения Халдея, которое было напечатано во всех школьных учебниках по истории? Недавно выяснилось, что эта фотография перед публикацией редактировалась. В оригинале на обеих руках одного из солдат было по паре трофейных часов, которые убрали из этических соображений, потом в фон добавили дыму и законтрастили.
И чем чаще сталкиваешься с подобным, тем больше понимаешь, что хорошо бы научиться отличать подделки. Так что мы сейчас последовательно рассмотрим разные случаи от очень простого к простому, а сложными пусть разработчики софта для ЦРУ занимаются.
Как отличить необработанное фото
Предположим, что мы хотим удостовериться, что изображение не редактировалось в Adobe Photoshop или редактировалось незначительно (например, его только кадрировали или делали тоновую коррекцию). Причём мы говорим о Photoshop просто потому, что это самая популярная программа для работы с растром. Та же логика справедлива для других прекрасных графических пакетов, в частности – Corel Photo-Paint, iPhoto или GIMP. Холивар по выбору лучшего графического редактора на этом объявляется законченным.
Признак 1: информация EXIF
Внутри каждого цифрового фото хранятся текстовые метаданные EXIF. Они записываются туда камерой и могут дописываться программой редактирования изображений. Метаданные хранятся внутри файла, пока пользователь их не удалит. Правда, когда жёсткие диски на серверах были маленькими, а юзеры сидели на dial-up, фотографы чистили EXIF из своих работ при помощи специальных утилит, чтобы сэкономить трафик и соответствовать ограничениям фотосайтов на максимальный размер закачки. Сейчас Интернет стал быстрым, и EXIF чистят в основном из страха, что другие фотографы будут подсматривать.
В EXIF явно указаны модель камеры, последняя программа, при помощи которой файл редактировали, дата и время создания и последнего изменения фотографии и ещё несколько десятков параметров. Посмотреть их в Photoshop можно в File->File Info. Стоит обращать внимание на время создания и последнего редактирования, поле software (Photoshop пишет туда себя), а также изначальный размер фото в пикселях и текущий размер (Edit->Image Size). Проанализировав эти параметры, можно понять, пересохранялось ли фото, кадрировалось ли оно и изменялся ли его размер. Надо сказать, что ещё есть софт, предназначенный для редактирования EXIF, например – бесплатный Quick EXIF Editor, но обычно метаданные не подделывают, а просто стирают.
Кстати, с информацией из EXIF связана забавная история. В прошлом году за 5 дней до официального выхода «Гарри Поттера и роковых мощей» неизвестный перефотографировал книгу и выложил на bittorrent-трекере demonoid.com. При этом в изображениях остались EXIF, содержащие модель и серийный номер его камеры. Злодея стали активно искать, и если бы нашли, наверное, было бы шуму на весь Интернет, но в ремонт ему со своей камерой теперь точно лучше не соваться.
Признак 2: Стандартные пропорции фотографии
Но даже если EXIF удалён, можно сверяться со стандартным списком размеров фото, которые делают цифровые камеры. Это, например:
- 640x480 (VGA) – дешёвые веб-камеры
- 1216x912 – один мегапиксель
- 1600x1200 – два мегапикселя
- 2240x1680 – четыре мегапикселя
- 2580x2048 – пять мегапикселей
- 3000х2000 – шесть мегапикселей
- 3456х2304 – восемь мегапикселей
- 4064x2704 – одиннадцать мегапикселей
Дальше смотрите, например, на http://web.forret.com/tools/megapixel_chart.asp (внимание, английский язык!) или гуглите сами. Понятно, что некадрированное фото должно быть такого же или пропорционально меньшего размера.
Признак 3: фотография в RAW
Считается, что фото в формате RAW чрезвычайно сложно качественно подделать, поскольку это фактически необработанная информация с матрицы камеры. Правда, журнал Popular Science ещё в 2005 году со ссылкой на специалиста по цифровым подделкам профессора Хани Фарида писал, что это возможно, но конкретных рецептов в открытом доступе я до сих пор не нашёл. Если вы умеете подделывать RAW в том виде, в каком его пишут камеры, напишите об этом в нашем форуме. (File->Save As->*.raw не предлагать.)
Кстати, именно наличие фотографии в RAW помогло журналу Esquire в прошлом году защититься от претензий депутата Михаила Гришанкова. Тогда журнал напечатал фото с разгона «Марша несогласных» в Питере 3 мая 2007 года, на котором видно, что на шлеме одного из омоновцев, участвовавших в разгоне, символика нацистской СС. Депутат Гришанков обвинил журнал в фальсификации и ещё бог знает в чём, но те предоставили RAW.
Признак 4: хвосты JPEG-компрессии
Раньше Ferra.ru уже писала об особенностях формата JPEG в рубрике «Принтеры». Перечитайте. Или, если хотите разобраться получше в алгоритме JPEG-компрессии, прочитайте это и потом это.
В общем, по стандарту JPEG размер блока для дискретного косинус-преобразования (не волнуйтесь, для того чтобы читать дальше, не обязательно понимать этот термин) составляет 8x8 пикселей, и при пересохранении с сильным сжатием либо съёмке на ерундовую фотокамеру или телефон границы этих блоков видны. Иногда это помогает однозначно определить, что изображение было кадрировано, потому что с краю остаётся «неправильное» количество пикселей в блоке, или что небольшая фотография увеличивалась, потому что размер блока с резкой границей становится больше.
Признак 5: Photoshop оставляет следы
Исследователи вроде упоминавшегося уже тут профессора Фарида в какой-то момент выяснили, что разные камеры или программы используют отличающиеся форматы записи графических файлов, например – они по-разному вычищают малозаметные детали при сжатии JPEG. Поэтому, даже не имея на руках EXIF-метаданных, если обработать изображение как массив значений пикселей и найти в этом массиве закономерности, можно с большой вероятностью сказать, что кадр, к примеру, был сделан камерой Nikon, а потом обработан в Photoshop. Известно, что существует софт, при помощи которого фотографии анализируют для спецслужб и судов, но в открытом доступе я его не встречал.
Выявляем настоящие фотожабы
Но согласитесь, сам факт того, что съёмку открывали, редактировали или даже кадрировали в Photoshop, мало что значит. В форумах фотографы постоянно пинают друг друга за упоминание Photoshop в метаданных EXIF, и тут же сами друг другу признаются: да, светлил, контрастил – и что с того? Ведь журналы тоже готовят каждую иллюстрацию к печати, но от этого она не становится фотожабой. И при конвертации из RGB в CMYK в зависимости от rendering intent можно получить разные значения одного и того же пикселя.
Нас больше интересуют манипуляции другого характера, например – перенос частей одной фотографии в другую (вспомните «свидетеля из Фрязино», который засветился даже на Потсдамской конференции) или дублирование участков внутри иллюстрации. Тут советы специалистов по выявлению подделки подразделяются на две большие группы: во-первых, проявлять наблюдательность, а во-вторых, использовать специальные технические приёмы.
Проявляем наблюдательность
Известный исследователь Синтия Барон, автор книги «Adobe Photoshop Forensics» («Использование Photoshop в расследованиях»), в недавнем интервью журналу The Christian Science Monitor посоветовала в первую очередь обращать внимание на следующие вещи.
- Положение, угол наклона и длина шеи и головы. Нередки случаи, когда головы звёзд в журналах и рекламных макетах «для красоты» приклеивают на чужие тела.
- Слишком ровные линии. Если человек на фото держит в руках плакат, текст на котором абсолютно горизонтальный, а буквы прямые, кадр может быть подделкой.
- На фото изображено нечто, невозможное в реальной жизни, к примеру – у героев фото слишком большие или маленькие руки или ноги, машины летают по воздуху, людей тошнит оранж-содой.
- Тени и отражения людей и предметов.
А профессор Фарид предлагает обращать внимание на освещение и отражение света от разных объектов. Суть технологии в том, что части смонтированного фото бывают по-разному освещены, правда, иногда приходится поискать объект в кадре, на котором это было бы хорошо видно.
Например, в онлайн-версии журнала Scientific American Фарид анализирует им же собственноручно подделанное фото, для того чтобы показать характерные моменты. Щёлкайте, там занятная картинка. Для того чтобы появились объяснения, нужно нажимать красные кружки. А для того чтобы посмотреть оригинал, жмите на голубую надпись «View Original» над фото. Если вкратце:
- Глаза мужчины: в зрачках у мужчины и у женщины по-разному отражается свет, значит, их фотографировали отдельно, а потом склеивали части кадра.
- Плечо мужчины, шлем женщины: попиксельный анализ показывает, что на плече что-то замазывали, а шлем женщины скопирован из шлема мужчины и перекрашен. (Про то, как именно автоматически анализируют изображения, я расскажу через пару абзацев.)
- Кусты: их клонировали при помощи инструмента Stamp, для того чтобы замазать велосипедистов.
- Лицо женщины: оно освещено не так, как другие части изображения. Свет падает на него справа, в то время как остальные объекты освещены сверху. Таким же образом можно понять, что гидрант – тоже фотожаба.
С отражением света в зрачках есть ещё один интересный пример. В Америке есть телевизионное шоу под названием «American Idol». Какое-то издание должно было делать про них материал, но фоторедактору показалось, что предоставленный телевизионщиками кадр – не настоящая фотография. Обратились к профессору Фариду, и он опять стал сличать блики в зрачках. В результате анализа возможного положения источников света выяснилось, что фото состоит как минимум из трёх частей.
Ещё один прекрасный способ выявить подделку – просмотреть подозрительное фото при большом увеличении, обращая внимание на несовпадение частей по свету, контрасту, зернистости и насыщенности. Часто в этом помогают старые добрые инструменты Image->Adjustments->Levels (гистограмма), Image->Adjustments->Curves (кривые), а также Image->Adjustments->Hue-Saturation (цвет и насыщенность). Попробую объяснить принцип.
Настоящие фотожабы: попиксельный анализ
Вы, конечно, помните, что растровое изображение представляет собой матрицу из точек, каждая из которых имеет числовое значение. Вернее, матрица своя для каждого канала, то есть в RGB-изображении их будет три, R, G и B. Если нам надо увеличить RGB-изображение, например, с размера 10х10 пикселей (всего 100 пикселей в каждом канале) до 20х20 (всего 400 в каждом канале), Photoshop создаст 300 новых пикселей на канал, усреднив значения соседних существующих точек.
Дело в том, что в реальных изображениях подобные строгие закономерности встречаются только одинаково по всей площади кадра и означают, что он увеличивался или уменьшался. Если же в разных участках изображения закономерности разные, есть основания полагать, что это части разных изображений или их размер друг относительно друга в кадре изменялся.
Вот вам пример. Программа, написанная командой десять раз упоминавшегося уже здесь профессора Фарида, помогла вскрыть подлог при проведении прошлогоднего конкурса среди рыбаков. Победитель этого конкурса определяется по фотографиям, которые участники шлют организаторам. Один шутник вытянул рыбу на компьютере, но не учёл строго математического алгоритма работы Photoshop.
Причём подобные следы остаются не только при растягивании. При помощи спецсофта можно выявить поворот части изображения, а также следы клонирования – работы инструментом Stamp и ему подобными.
Известно также, что Adobe Research Labs работал над плагинами для Photoshop, которые называются Clone Tool Detector и Truth Dots. Первый ищет в изображении клонированные области, а второй помогает определить, кадрировалось ли фото, анализируя пиксели по краям. Причём где-то год назад весь англоязычный Интернет хором написал про то, что эти плагины станут частью ожидавшегося тогда Photoshop CS3, и мы стали ждать. Теперь мы уже знаем, что никаких Truth Dots в CS3 нет, но профессор Фарид, который участвует и в этой разработке, говорит, что она продолжается. Просто перед выходом CS3 эти плагины решили в состав пакета не включать. И теперь одному «Адобу» известно, включат ли вообще, и если да, то когда. Хотя, конечно, очень жалко.