Деятельность мозга по улучшению картинки нужно описать подробнее. Еще Декарт заметил, что часто мы визуально воспринимаем вещи правильнее, чем это можно было бы сделать, основываясь только на том, как они видны в реальности. Это явление называется константностью зрительного восприятия.
Существует множество видов константности восприятия: константность восприятия размеров, формы, яркости, цвета и другие.
Так, в изображении на сетчатке размеры предметов подчиняются законам передачи перспективы. Но благодаря механизму константности размеров мы воспринимаем размер очень близких предметов уменьшенным по сравнению с тем размером, который получился на сетчатке. А размер удаленных предметов воспринимается немного увеличенным. То есть, мозг частично исправляет перспективные искажения размеров предметов. Коррекция восприятия осуществляется на основе сведений об условиях просмотра (в том числе, с учетом признаков глубины) и хранящихся в памяти знаний о свойствах предметов, которые мы видим.
Включив лампу накаливания, мы обнаруживаем, что белая бумага стала восприниматься немного желтоватой. Однако через небольшой промежуток времени бумага снова станет восприниматься белой. Произошла адаптация к цвету источника освещения. Влияние цвета источника освещения на воспринимаемый цвет ослабляется свойством зрительной системы человека, которое называется хроматическая адаптация.
Видя нарисованный на картинке эллипс, мы часто можем легко определить по остальным деталям картинки, что на самом деле это – круг, видимый сбоку. Сработала константность формы.
Наличие механизмов константности зрительного восприятия объясняется тем, что человеку важнее выделить в изображении реальные знакомые объекты, чем определить фотометрический уровень освещенности или, к примеру, цвет источника освещения.
Разумеется, мозг корректирует (с помощью накопленных знаний) информацию, получаемую не только от органов зрения, но и от других органов чувств.
Обнаружено, что степень такой коррекции (коэффициент константности), обычно составляет 10–70 %. Константность восприятия наблюдается уже у трехлетних детей, и ее развитие продолжается до 10–12 лет.
Мы можем не только видеть предметы или пейзажи, но и вспоминать их и даже мысленно конструировать их. Различают следующие основные виды визуальной памяти.
• Сенсорная (иконическая) память – это, например, изображение, остающееся в памяти после срабатывании вспышки в темной комнате. Длится около полусекунды, но содержит многие детали. Объясняется продолжающейся активностью фоторецепторов и тех нейронов, которые находятся в сетчатке и, возможно, в первичной зрительной коре.
• Кратковременная память хранит последовательные менее детальные визуальные образы и в более структурированном виде, но не более 30 секунд. Также объясняется продолжающейся деятельностью нейронов, но уже, возможно, той, которая обеспечивается обратными связями между ними.
• Долговременная память может хранить картинки (фрагменты картинок) годами и даже всю жизнь. Объясняется возникшими при запоминании изменениями в структуре связей между нейронами и в свойствах синаптических переходов. Долговременная память ассоциативна. Чтобы вспомнить какой-либо пейзаж, часто бывает нужно сначала вспомнить ту поездку, во время которой он был увиден, или какие-то обстоятельства, с ним связанные. Картинки, хранящиеся в такой памяти, сильно перемешиваются с воспоминаниями других типов (звуки, запахи, эмоции и другие). Запомненные картинки, похоже, с течением времени постепенно деградируют.
Процесс восприятия изображения сложным образом переплетен с деятельностью визуальной памяти:
• восприятие картинки непрерывно корректируется с помощью информации, хранящейся в визуальной памяти;
• воспринимаемые картинки непрерывно поступают в память;
• видимая картинка содержит больше деталей, чем находится в памяти.
Говорят, что встречается фотографическая память (эйдетическая). Это когда человек может взглянуть на лист бумаги с каким-то незнакомым ему текстом, закрыть глаза и по памяти зачитывать этот текст хоть слева направо, хоть наоборот, а хоть и снизу вверх. И даже правильно отвечать на неожиданные вопросы, например, если соединить заданные три слова линиями, то получится острый угол или тупой. Вместо текста может быть взята картинка. Однако, похоже, научным образом этот феномен никогда не исследовался, и существует ли он на самом деле, неизвестно.
Попробуем сравнить процессы обработки изображения (в нашем случае пейзажа) фотокамерой и зрительной системой человека.
Сначала сравним «угол зрения» объектива с углом зрения глаза.
Нормальная острота зрения у человека – это когда не сливаются в одну точку две точки, разделенные углом в 1 дуговую минуту, что соответствует 60 пикселям на градус (пнг). Средняя острота зрения примерно равна 85 пнг, а для пилотов морской авиации США – 150 пнг.
Для человека с остротой зрения 85 пнг и полем зрения 180° × 125° получаем, что полное изображение состоит из 15300 × 10625 пикселей, то есть, около 163 мегапикселей.
Для одного «кадра» поле зрения приблизительно равно 1° 40' × 1° 40', и часть изображения, спроецированного на фовеа, состоит из 142 × 142 пикселей, то есть, около 0.02 мегапикселей.
Для 100-миллиметрового объектива (углы зрения по горизонтали 20° и по вертикали 14°) и камеры с сенсором 5472 × 3648 пикселей получаем «остроту зрения» этой пары в 273 пнг по горизонтали и 243 пнг по вертикали.
Теперь сравним рецепторы сетчатки с пикселями сенсора камеры.
Размер наружной части рецептора, содержащей светочувствительный пигмент, равен 1 ÷ 2 микрон для палочки или 1 ÷ 5 микрон для колбочки. Размер пикселя сенсора равен 2.5 ÷ 8 микрон, размер зерна фотопленки: 0.05 ÷ 3 микрон.
Плотность палочек: 40–150 тысяч на мм2, колбочек: 5–150 тысяч на мм2. Плотность фоторецепторов сенсора – до 40 тысяч на мм2. На цветной фотографии: около 30 тысяч точек на мм2.
Чувствительность: 5–14 фотонов для палочки и в 100–1000 раз больше для колбочки. Для сенсора – несколько фотонов (сенсор ICCD, intensified CCD, усиленный ПЗС-сенсор), для зерна высокочувствительной фотопленки – 4 фотона.
Разрешающая способность: Количество рецепторов сетчатки одного глаза – 130 миллионов. Количество пикселей сенсора обычного фотоаппарата – до 30 миллионов. Максимальный размер кадра на сегодняшний день имеют 80-мегапиксельные матрицы в цифровых задниках Phase One iq280: 53,7×40,4 мм. Разрешающая способность сенсора: от 200 линий на миллиметр (у крупноформатных цифровых фотокамер) до 70 линий на миллиметр (у web-камер и мобильных телефонов).
Получается, что по количеству пикселей и их средней плотности фотоаппараты догоняют глаз. Но вот разрешающая способность сетчатки в центре фовеа пока что в 2–8 раз выше, чем у сенсоров современных камер (если сравнивать только плотности рецепторов и пикселей, без учета «оптики»).
Как воспринимается яркость сцены фотоаппаратом и зрительной системой человека?
Зависимость воспринимаемой глазами яркости от фактической яркости предмета нелинейна. Для того чтобы почувствовать изменение яркости в темных тонах, достаточно очень небольшого изменения фактической яркости. Тогда как для того, чтобы почувствовать изменение яркости в светлых тонах, потребуется более сильное изменение фактической яркости. В такую нелинейность вносят свой вклад следующие факторы:
• переключение рецепторов: при низких яркостях работают палочки, а при более высоких яркостях палочки полностью насыщаются и работают только колбочки; на промежуточных уровнях яркости функционируют и те и другие;
• истощение пигмента рецепторов на высоких уровнях яркости;
• изменение чувствительности сетчатки к свету, осуществляемое на уровне нейронов сетчатки;
• когнитивные механизмы – регулирующие восприятие яркости на основании знания наблюдателем содержимого сцены. Например, мы избегаем смотреть на солнце или на огонь электросварки незащищенными глазами.
Благодаря всему этому наши глаза могут видеть в диапазоне яркостей, границы которого различаются в 224 раз, то есть более чем в 16 миллионов раз! При этом роль сужения зрачка относительно невелика. Максимальные изменения зрачка для здорового человека – от 1,8 мм до 7,5 мм, что соответствует изменению площади зрачка всего в 24 раз.
Теперь о яркости в числах.
Динамический диапазон (диапазон яркостей), воспринимаемый человеком: дневное зрение – 15 000: 1 (13 EV, exposure value), ночное зрение – 10 000 000: 1 (27 EV). Для сравнения, темная ночь: -6 EV, яркий солнечный свет: +22 EV. Контраст, воспроизводимый на бумаге: 8 EV, на пленке: 8–14 EV, воспринимаемый сенсорами цифровых камер: 8–14 EV, на экране монитора: 10 EV.
Снова сравним с фотоаппаратом. Для сенсора камеры зависимость воспринимаемой яркости от фактической яркости предмета линейна, за исключением краев воспринимаемого диапазона. Поэтому диапазон яркостей камеры с 14-битной разрядностью всего лишь 214, что менее 17 тысяч. Но и это только теоретически. На практике из-за наличия шума этот диапазон снижается до 29, что равно 512.
Следовательно, наши глаза лучше приспособлены для среды с широким диапазоном яркостей, чем наши фотоаппараты. Правда, нужно уточнить, что перепад яркостей, для которого темновая адаптация не превышает десятых долей секунды, составляет только 10–13 EV. Чтобы получить значение 27 EV для ночного зрения, приведенное выше, необходимо адаптироваться в течение получаса и более.
Фотоаппарат строит попиксельное отображение 3-мерного пейзажа на плоскость кадра по законам прямой линейной перспективы, которое затем обрабатывается программным обеспечением камеры и, возможно, пользователем с помощью компьютера, и воспроизводится на экране монитора или на каком-нибудь носителе (бумаге, пленке, ткани).
Система «глаз-мозг» превращает 3-мерный пейзаж в серию «кадров», каждый из которых содержит резкое отображение на плоскость (точнее, на внутреннюю поверхность сферы) только небольшого кусочка рассматриваемого пейзажа. Далее, структура границ яркостей и границ цвета каждого кадра превращается в частотно модулированный сигнал и подвергается Фурье-анализу с целью обнаружения только самых важных для мозга деталей. Вся остальная информация об изображении, вероятно, пропадает (не запоминается), а в случае появления необходимости – домысливается мозгом с помощью предыдущих знаний, а также интерполяции поступивших данных об изображении.
Обработанное таким образом изображение пейзажа помещается в память. Увиденная картинка не отображается в голове целиком, а составляется из набора только тех объектов или свойств, которые были важны в момент просмотра. В этот набор входят: суть сцены (общее описание), размещение объектов (или пятен) по сцене и некоторые важные детали опознанных объектов.
Наибольшая разница между двумя этими системами обработки изображений состоит в цели обработки. Зрительная система человека не предназначена для любования пейзажем. Для нее нужно рассортировать элементы пейзажа на важные и неважные и обработать только важные. Таким образом, на выходе фотоаппарата мы имеем попиксельное изображение (фотографию), удобное для просмотра человеком. А «на выходе» зрительной системы человека, то есть в его зрительной памяти, – «разобранное на части» изображение, удобное для анализа структуры картинки и содержащее минимум малосущественных деталей.
Полученная с помощью камеры и распечатанная фотография сделана опять же для человека, который рассматривает ее и снова превращает в разобранную на части картинку, но уже другим образом, с учетом того, что это все-таки не реальный пейзаж, а всего лишь картинка. И, может быть, с учетом того, как понял зритель замысел фотографа.
Поскольку принципы работы сравниваемых систем различны, то приведенные выше цифры трудно сопоставить. Чему ближе соответствует количество пикселей сенсора? Количеству рецепторов сетчатки? Но сигналы от рецепторов не используются напрямую для построения изображения. Они подвергаются структурному анализу и малосущественная часть информации, полученная от сетчатки, пропадает.
Может быть, количеству волокон зрительного нерва (1–1.5 миллиона), по которым визуальная информация передается в мозг? Тоже соответствия нет, потому что по этим волокнам изображение передается в виде серии «частичных» картинок, соответствующих разным положениям проекции на сетчатку относительно фовеа. Да еще и преобразованное в серии нервных импульсов.
Зрительная система человека умеет адаптироваться к условиям наблюдения (яркости, цвету освещения). Цифровые камеры тоже пытаются осуществить баланс белого с помощью разных алгоритмов (рассмотрим в другой главе ниже).
В отличие от фотоаппарата, наблюдаемое изображение в голове находится в виде разных срезов, начиная от выделенных границ и карты движущихся элементов, до распознанных объектов и их значения для наблюдателя. Благодаря наличию прямых и обратных нейронных связей между этими срезами, картинки постоянно уточняются и информация об изображении непрерывно обогащается. Интерпретация картинки высшими слоями зрительной коры сравнивается с картинкой, полученной сетчаткой. И становится ясно, куда надо посмотреть еще и что уточнить. Отсюда – тот большой объем информации, которую можно получить с помощью зрительной системы.
В конце главы сделаем небольшое лирическое отступление. А все-таки, какой крутой «гаджет» дан каждому из нас! Я имею в виду наши головы. Мы пользуемся ими всю жизнь, днем и ночью. В начале жизни эти «гаджеты» имеют только какие-то базовые прошивку и чипы. Но с течением времени прошивка непрерывно обновляется, скачиваются все новые и новые приложения, новые микросхемы появляются, а старые перекоммутируются.
Этот процесс происходит частично автоматически, по мере появления изменений в окружающей нас среде, которые мы замечаем и обдумываем, а частично управляется нашими желаниями, когда нам хочется узнать что-то конкретное или научиться делать что-то нужное, и мы добиваемся этого. Чем больше наполняется начинка нашего гаджета, тем более тонкие детали окружающей среды начинают привлекать наше внимание, хочется их понять и когда это удается, функционал гаджета снова обогащается.
Когда моя дочь училась в пятом классе, она меня спрашивала: «Зачем мне, будущему гуманитарию, учить математику?». Я отвечал, что когда решаешь задачку, мысли в голове протаптывают тропинку, ручейки мыслей пробивают русла. И когда формулы и математические определения забудутся, эти тропинки и русла останутся и будут помогать правильно думать.
Сейчас я бы добавил, что сформированные в процессе изучения школьной математики структуры мозга позволят увидеть будущие, возможно совсем не математические, обстоятельства под новым углом, дадут еще один срез конкретной жизненной ситуации.
О проекте
О подписке