Почему в литературе так много роботов, а в реальной жизни – ни одного? Я бы, например, заплатил кучу денег за робота, который бы убирал за меня посуду или выполнял несложные поручения. Но в этом столетии у меня вряд ли будет такая возможность, а может быть – ив следующем тоже. Конечно, есть роботы, которые выполняют на конвейере такие операции, как сварка или покраска, и роботы, которые разъезжают по коридорам лабораторий; но я имею в виду не их, а такие машины, которые умеют ходить, говорить, видеть и думать – причем зачастую даже лучше, чем создавшие их люди. В 1920 году Карел Чапек впервые использовал слово «робот» в своей пьесе «Р. У. Р.», после чего авторы начали один за другим выдумывать собственных роботов: появились Спиди, Кьюти и Дейв из «Я, робот» Айзека Азимова, Робби из «Запретной планеты», размахивающая руками жестянка из «Затерянных в космосе», далеки из «Доктора Кто», робот-домработница Рози из «Джетсонов», Номад из «Звездного пути», Хайми из «Напряги извилины», безучастные дворецкие и переругивающиеся продавцы одежды из фильма «Спящий», R2-D2 и С-ЗРО из «Звездных войн», Терминатор из одноименного фильма, лейтенант-коммандер Дейта из фильма «Звездный путь: Следующее поколение» и остроумные кинокритики из «Таинственного театра 3000 года».
Эта книга посвящена не роботам. Она посвящена человеческому разуму. Я постараюсь объяснить, что такое разум, как он устроен, как благодаря ему мы можем видеть, думать, чувствовать, взаимодействовать и заниматься такими высокими материями, как искусство, религия и философия. Попутно я постараюсь осветить вопросы, связанные со свойственными исключительно человеку явлениями. Почему воспоминания стираются из памяти? Как макияж меняет лицо? Откуда берутся этнические стереотипы и когда они оказываются необоснованными? Почему люди выходят из себя? Что делает детей непослушными? Почему слабоумные влюбляются? Что заставляет нас смеяться? Почему люди верят в духов и привидений?
И все же начну я именно с различия между вымышленными и реальными роботами, поскольку оно показывает, каким должен быть наш первый шаг в познании себя: нам нужно по достоинству оценить невероятно сложную систему, позволяющую нам ежедневно осуществлять настоящие чудеса мышления, которые мы привыкли воспринимать как должное. Причина, по которой в мире нет человекоподобных роботов, – не в том, что сама по себе идея создания механического разума безрассудна, а в том, что технические задачи, которые мы, люди, ежеминутно решаем, когда смотрим, ходим, планируем свои действия, куда сложнее высадки на Луну и расшифровки генома. Природа, создав человека, в очередной раз сделала гениальное изобретение, которое инженерам повторить пока не по силам. Когда мы вслед за Гамлетом восклицаем: «Что за мастерское создание – человек! Как благороден разумом! Как беспределен в своих способностях, обличьях и движениях! Как точен и чудесен в действии!»[1], то объектом нашего восхищения является не Шекспир, не Моцарт, не Эйнштейн и не Карим Абдул-Джаббар, а четырехлетний ребенок, который по просьбе взрослого кладет игрушку на полку.
В хорошо продуманной системе все элементы устроены по принципу «черного ящика»: они выполняют свои функции как по волшебству. То же самое можно сказать и о нашем мышлении. Мышление, благодаря которому мы познаем мир, лишено возможности обратить взор внутрь себя или увидеть внутренние механизмы, приводящие в движение другие наши способности. В результате мы оказываемся жертвами иллюзии: нам кажется, что наша собственная психика является порождением некоей Божественной силы, мистической сущности или высшего начала. В еврейской мифологии есть легенда о Големе – статуе из глины, которая ожила, когда ей в рот вложили записку с именем Бога. Этот архетип прослеживается в сюжетах многих историй. Статую Галатеи оживила Венера в ответ на молитвы Пигмалиона; Пиноккио обрел жизнь благодаря волшебству Синей Феи. Современные версии архетипа Голема мы находим не только в сказках, но и в научных теориях. Считается, что все явления в психологии человека – размер его мозга, культура, язык, социализация, обучение, познание, самоорганизация, динамика нейронной сети – могут быть сведены к одной первопричине.
Я хочу убедить вас в том, что наш разум не был создан неким Божественным духом или чудесным первоисточником. Наш мозг, как космический корабль «Аполлон», сконструирован для того, чтобы решать самые разные технические задачи, поэтому он напичкан самыми высокотехнологичными системами, каждая из которых нацелена на преодоление отдельного типа проблем. Я начну с краткого описания этих проблем, которые одновременно являются предметом изучения психологии и техническими требованиями к роботу. Я убежден, что полученные исследователями мышления и искусственного интеллекта сведения о том, какие технические головоломки приходится постоянно решать нашему мозгу в повседневной жизни, являются одним из величайших научных открытий. Это откровение сравнимо по своей значимости с осознанием того, что Вселенная состоит из миллиардов галактик, или того, что в капле воды из пруда кишмя кишат микроорганизмы.
Что нужно, чтобы сделать робота? Давайте обойдемся без сверхчеловеческих способностей вроде умения вычислять орбиты планет и начнем с элементарных для человека навыков: умения видеть, ходить, хватать, думать о предметах и людях, планировать свои действия.
В фильмах нам часто показывают происходящее глазами робота, используя привычные для кино эффекты: например, вид через линзу «рыбий глаз» или через перекрестие прицела. Для нас, зрителей, у которых есть глаза и мозг, этого вполне достаточно. Но вот самому роботу такой способ восприятия реальности едва ли пригодится. У него внутри нет кинозала, полного маленьких человечков, которые бы смотрели на мир и рассказывали роботу, что они видят. Если бы мы могли видеть мир глазами робота, он бы выглядел вовсе не как кадр из фильма, украшенный крестиком прицела, а как что-то вроде этого1:
Каждое число здесь соответствует яркости одного из миллиона крохотных участков, вместе составляющих поле зрения. Числа поменьше соответствуют более темным участкам, а числа побольше – светлым участкам. Эти числа, сгруппированные в виде массива, на самом деле представляют собой сигналы, полученные с цифровой камеры, с помощью которой для пробы сделали снимок руки человека. Однако точно таким же образом можно было бы представить частоту разрядов в нервных волокнах, соединяющих глаз человека с мозгом в тот момент, когда человек смотрит на руку2. Для того чтобы мозг робота – и мозг человека тоже – сумел распознать предметы и не позволил своему владельцу с ними столкнуться, ему нужно обработать эти числа и отгадать, какой предмет в реальном мире мог отразить свет таким образом, чтобы получилась подобная последовательность чисел. Эта задача просто невообразимо сложна.
В первую очередь зрительная система должна определить, где заканчивается граница предмета и начинается фон. Но ведь мир – не детская раскраска, где закрашенные фигуры очерчены черным контуром. Мир в том виде, в котором он отражается в наших глазах, представляет собой мозаику из крохотных участков разной степени освещенности. Можно предположить, что зрительные структуры мозга ищут области, где мозаика из больших чисел (более светлый участок) граничит с мозаикой из меньших чисел (более темный участок). Такую границу можно различить и в нашей сетке из чисел: она проходит по диагонали из правого верхнего угла к центру нижней части. К сожалению, в большинстве случаев обнаружить границу предмета с пустым пространством будет непросто. Участки, где большие числа граничат с малыми, могут появляться как следствие очень разных вариантов взаимного расположения объектов. Рисунок, приведенный ниже, предложили психологи Паван Синха и Эдвард Адельсон3. Кажется, что на нем изображено кольцо из светло-серых и темно-серых квадратиков.
На самом деле перед нами прямоугольная прорезь в черной маске, через которую мы видим лишь часть изображения.
На следующем рисунке маска удалена, и мы можем видеть, что все пары серых квадратиков являются частями разных объектов.
Большие числа рядом с малыми могут появляться и в том случае, когда один предмет располагается перед другим. Примерами могут служить темная бумага, лежащая поверх светлой, поверхность, окрашенная в два разных оттенка серого цвета, два предмета, стоящие рядом вплотную друг к другу, серый целлофан, наложенный на белую страницу, угол, соединяющий две стены, а также любая тень. Мозг должен как-то решить эту проблему курицы и яйца: выделить трехмерные объекты из множества затененных участков на сетчатке и определить, что представляет из себя каждый участок (тень или краску, складку или наложение объектов, прозрачную или матовую поверхность), исходя из того, частью какого объекта является этот участок.
Однако на этом сложности не заканчиваются. Разделив визуально воспринимаемый мир на объекты, мы должны определить, из чего они сделаны, например, из снега или из угля. На первый взгляд эта задача представляется простой. Если большие числа соответствуют светлым участкам, а малые числа – темным, то большие числа будут означать снег, а малые – уголь, правильно? Нет. Количество света, попадающего на сетчатку глаза, зависит не только от того, насколько светлый или темный перед нами предмет, но и от того, насколько яркий или тусклый свет его освещает. Используемый фотографами прибор – экспонометр – покажет, что кусок угля на улице отражает больше света, чем комок снега в помещении. Именно поэтому люди нередко оказываются недовольны качеством своих снимков, и именно поэтому фотография – очень непростое ремесло. Фотоаппарат никогда не лжет; если предоставить ему возможность действовать без помощи человека, то все снимки, сделанные на улице, будут выглядеть как молоко, а сделанные в помещении – как грязь. Фотографы (а иногда и микропроцессоры, встроенные в фотоаппарат) добиваются от фотопленки реалистичного изображения, прибегая к таким приемам как регулировка скорости срабатывания затвора и диафрагмы объектива, светочувствительность пленки, вспышка и манипуляции в лаборатории.
Наша система зрительного восприятия справляется с этой задачей гораздо лучше. Она каким-то образом позволяет нам видеть, что блестящий на солнце уголь на самом деле черный, а кажущийся темным в помещении снег – белый. Это очень удобно, поскольку наше представление о цвете и свете совпадает с тем, каким мир является в действительности, а не с тем, каким он предстает перед глазами. Снег – объект мягкий, влажный и способный таять как в помещении, так и снаружи, и мы видим, что он остается белым независимо от того, в помещении он или снаружи. Уголь всегда твердый, маркий, способный гореть, и мы всегда видим его черным. Получившейся гармонией между тем, как выглядит окружающий мир, и тем, каким он является на самом деле, мы обязаны магии своего мозга: ведь сетчатка глаза не может сама по себе воспринимать черный и белый цвета. А если у вас все еще есть сомнения, вот пример из повседневной жизни. Когда телевизор выключен, экран имеет бледный зеленовато-серый оттенок. Когда телевизор включают, некоторые люминофорные точки начинают светиться, образуя светлые участки изображения, а некоторые другие точки не светятся, образуя темные участки; они остаются серыми. Те части изображения, которые мы видим как черные, на самом деле – все тот же бледно-серый оттенок кинескопа выключенного телевизора. Черный цвет – это фикция, результат работы мозга по той же схеме, благодаря которой мы видим, что уголь – это уголь. Именно эту схему работы использовали создатели телевидения, когда разрабатывали телеэкран.
Следующая проблема зрительного восприятия – это глубина. Наши глаза разбивают трехмерный мир на два двухмерных изображения на сетчатке глаз, а третье измерение должен воссоздать мозг. Однако в изображении на сетчатке нет никаких подсказок относительно того, насколько далеко от смотрящего расположен объект. Почтовая марка на вашей ладони оставит на сетчатке такое же квадратное изображение, как стул, стоящий у противоположной стены, или здание, расположенное за много километров от вас (первый рисунок на с. 17). Разделочная доска, если на нее смотреть фронтально, может давать такую же трапециевидную проекцию, как и фигуры неправильной формы, расположенные под углом (второй рисунок на с. 17).
Ближе вы можете познакомиться с этим явлением из области геометрии и с нейронным механизмом, который с ним работает, если посмотрите в течение нескольких секунд на электрическую лампочку или на фотоаппарат в момент вспышки: в результате на вашей сетчатке останется световое пятно. Теперь переведите взгляд на страницу книги; у вас перед глазами по-прежнему будет остаточное изображение лампочки шириной 3–5 см. Если вы посмотрите на стену, то остаточное изображение будет около метра в длину. А если посмотрите на небо, то это изображение будет размером с облако4
Наконец, как заставить модуль зрительного восприятия распознавать предметы, чтобы робот мог назвать их или вспомнить их назначение? Очевидным решением было бы построить для каждого объекта маску или шаблон, в точности повторяющий его форму. В таком случае при появлении объекта в поле зрения его проекция на сетчатке идеально совпадала бы с шаблоном. Шаблону присваивается метка с именем данной формы – в нашем случае это метка «Р», – и каждый раз, когда проекция совпадает с шаблоном, система выдает ее имя5:
Увы, это простое устройство допускает ошибки в обоих возможных случаях. С одной стороны, оно видит букву Р там, где ее нет: например, реагирует на букву R (первый вариант слева на рисунке внизу). С другой стороны, оно не замечает букву Р там, где она есть: например, если она смещена, наклонена, неровно написана, расположена слишком далеко или слишком близко, либо написана слишком затейливым шрифтом:
Столько проблем с распознаванием одной простой и понятной буквы алфавита! А теперь попробуйте представить, как сложно сконструировать устройство, способное распознать рубашку или, скажем, лицо! Конечно, сейчас, после сорока лет исследований в области искусственного интеллекта, технологии распознавания формы значительно улучшились. Вероятно, и у вас есть программное обеспечение, которое может довольно сносно распознать отсканированную страницу и преобразовать ее в цифровой файл. И все же искусственные средства распознавания формы по-прежнему не могут конкурировать с теми, что существуют у нас в голове. Они созданы для среды, где все безупречно и легко узнаваемо, а не для нашего сумбурного, беспорядочного реального мира. Странные цифры, напечатанные в нижней части чека, специально придуманы таким образом, чтобы не иметь даже частичных наложений; специальное оборудование для печати располагает их так, чтобы обеспечить распознование по заданным шаблонам. Когда в подъездах вместо консьержек появятся первые устройства, распознающие лицо, они даже не будут пытаться разгадать хитросплетения света и тени на вашем лице; они будут сканировать четко очерченные контуры радужной оболочки или кровеносные сосуды сетчатки. А вот наш мозг регистрирует форму каждого знакомого нам лица (а также каждой буквы, животного, инструмента и т. д.) и каким-то образом устанавливает ее соответствие с изображением на сетчатке, даже если это изображение искажено любым из рассмотренных выше способов. В главе 4 мы рассмотрим, как мозгу удается добиться таких потрясающих результатов.
О проекте
О подписке