Сэмюэл, который был родом из захолустного городка в Канзасе, в буквальном смысле уговорил руководство Массачусетского технологического института принять его в это учебное заведение, а руководство General Electric – взять его на работу. Получив докторскую степень, он устроился в компанию Bell Telephone Laboratories, где трудился над различными устройствами, включая многокамерный магнетрон и клистрон СВЧ-диапазона. У него было много научных публикаций (например, «Методика получения линейной развертки на электроннолучевом осциллографе») и 57 патентов. Однако в 1946 году в поисках более высокой заработной платы Сэмюэл перебрался в Иллинойский университет.
Получив постоянную профессорскую должность, он занялся интересовавшими его вопросами более теоретического характера, в частности исследованием электрического заряда. Это было связано со сложными математическими вычислениями, для выполнения которых в частном секторе, как рассказывает журнал IEEE Annals of the History of Computing, «требовался штат расчетчиц с электромеханическими настольными калькуляторами». В университете у Сэмюэла не было такого персонала, а сам он не собирался выполнять вычисления вручную. «Нужно было купить или построить компьютер», – писал Сэмюэл. Он остановился на втором варианте. Его декан в Иллинойском университете добился выделения $110 000 на проект, и Сэмюэл поехал по лучшим высшим учебным заведениям страны, где читал лекции и старался привлечь аспирантов к работе над его планами. Но к 1948 году проект застопорился. Поскольку деньги кончились, Сэмюэл решил прибегнуть к пиар-ходу: построить примитивную версию компьютера и заставить ее делать что-нибудь впечатляющее. Ему было известно, что Клод Шеннон, математик из Bell Labs, где он некогда работал, говорил об обучении компьютера игре в шахматы. «Запрограммировать компьютер для игры в шашки наверняка проще», – рассудил Сэмюэл и начал писать программу игры в шашки для грандиозной машины, которой не существовало.
Вскоре после этого Сэмюэл получил место в International Business Machines Corporation. Он начал работать в IBM в 1949 году, когда в компании шла разработка ее первой большой коммерческой цифровой ЭВМ, которая впоследствии получила название IBM 701. Руководство компании обещало акционерам, что эта машина, которую называли «Оборонным вычислителем» (Defense Calculator), станет «самым передовым, самым гибким и быстродействующим компьютером в мире». Одной из первых задач, которые она решала, было исполнение шашечной программы Сэмюэла.
Стоимость аренды машины 701 серии составляла $11 900 в месяц (по сегодняшним меркам – свыше $100 000); она могла выполнять «более 2000» умножений в секунду. Каждую ночь с полуночи до восьми утра Сэмюэл на заводе компании загружал первую версию своей шашечной программы в одну из огромных машин, а вторую – в другую машину, после чего снова и снова заставлял их играть друг с другом. У каждой версии был свой алгоритм обучения, и Сэмюэл, наблюдая за результатами, выяснял, как учатся программы.
«Я стал одним из… первых, кто работал в широкой области, которая позднее получила название искусственного интеллекта, – писал Сэмюэл в неоконченной и неопубликованной автобиографии. – Собственно говоря, я настолько увлекся написанием программы, которая вроде бы проявляет интеллект, что она занимала мои мысли почти в каждый свободный момент в течение всего периода работы в IBM, да и нескольких последующих лет тоже». В своей оценке он был не одинок. Как заметил один из специалистов по истории компьютеров, шашечная программа Сэмюэла, несомненно, была «первой самообучающейся компьютерной программой в мире» и «первым функционирующим искусственным интеллектом».
В IBM не возражали против ночных игр на заводе – на них смотрели как на испытание дорогостоящих машин. Но компания не опубликовала исследование Сэмюэла. Тогда, как и сейчас, многие боялись искусственного интеллекта. Продавцы IBM не говорили своим клиентам об исследованиях в этой области, проводившихся в компании, и не рассуждали о грядущих инновациях. Когда в 1959 году Сэмюэл, наконец, обнародовал свою работу, в ней был такой вывод: «Компьютер можно запрограммировать так, что он научится играть в шашки лучше того, кто написал программу». Сэмюэл мог бы пойти еще дальше. Компьютер можно запрограммировать так, что он будет играть в шашки как сам господь бог.
Так как же играет компьютер? Представьте, что вы стоите у подножия очень высокого дерева и смотрите вверх. Дерево – это совокупность всех возможных вариантов будущего игры. Ствол представляет собой ваш следующий ход, большой сук – какой-то возможный ход после этого, ветви поменьше – дальнейшие ходы, а бесчисленные мелкие веточки и листья наверху – продолжение возможных ходов в отдаленном будущем игры – эндшпили.
Люди смотрят на дерево снизу вверх и вспоминают о деревьях, на которые забирались, которые видели и о которых им раньше рассказывали друзья. У нас есть интуитивное, врожденное понимание того, какие ветви могут легко выдержать наш вес, а какие прогнутся, мы также знаем, какие веточки, судя по всему, крепкие. Мы помним, как падали и как забирались на верхушку. Мы фиксируем, какие ветви надежны, а какие опасны, и делимся этим знанием с окружающими. Мы забираемся на деревья, то есть играем в игры, опираясь на интуицию, опыт, специалистов и литературу.
А вот компьютеры не обладают такой интуицией в отношении дерева. Однако они способны добираться до всех частей кроны, причем очень быстро, точно колония муравьев. Это называется поиском. В каждой точке дерева, куда они попадают, муравьи производят небольшие вычисления, определяя качество этого места и присваивая ему баллы. Это называется оценкой. Перед тем как сделать ход в игре вроде шашек, компьютерные муравьи могут обежать миллионы мест на дереве, накапливая вычисления. Если какой-то путь наверх набирает более высокую оценку, компьютер направится именно туда. Компьютеры забираются на деревья – то есть играют в игры – с помощью поиска и оценки, поиска и оценки, поиска и оценки.
И поиск, и оценка – серьезные технические задачи. Начать с того, что в шашках существует 500 995 484 682 338 672 639 возможных позиций, то есть около 500 миллиардов миллиардов. Шеффер приводит такую аналогию: если бы Тихий океан высох и вам нужно было бы наполнить его с помощью маленькой чашки, то количество вливаемых порций было бы равно количеству возможных позиций в этой игре. Или такую: если бы площадь всей суши на нашей планете представляла совокупность возможных позиций в шашках, то каждой позиции соответствовала бы примерно одна сотая квадратного сантиметра. Таким образом, эффективность поиска имеет важнейшее значение. Если действовать путем простого перебора и смотреть на каждую из позиций в течение тысячной доли секунды примерно так, как машина Сэмюэла, то время, необходимое для просмотра их всех, превысило бы возраст Вселенной.
Оценка каждой позиции, когда мы на нее смотрим, – непростая задача. В шашках определенные особенности позиции являются желательными: хорошо иметь больше шашек, больше дамок, контролировать центральную часть доски и так далее. Есть и нежелательные особенности: расположение шашек по краям доски, незащищенная последняя горизонталь и так далее. Фокус в том, чтобы преобразовать всю эту мозаику особенностей и их сложные нелинейные математические взаимодействия в одно-единственное число, которое будет понятно вашей компьютерной программе.
Марион Тинсли опирался на интуицию и расчет, а также на способность осмысливать и усваивать опыт игры в шашки, накопленный теми, кто играл до него. Он мог взглянуть практически на любое дерево и найти оптимальный путь к его вершине с небольшими затратами энергии, характерными для человеческого мозга. Но в 1970 году, когда он после перерыва возобновил шашечную карьеру, муравьи уже размножались и набирали скорость.
Может возникнуть вопрос: зачем специалисту по вычислительным системам тратить свое дорогое время, энергию и деньги грантодателей на создание компьютерных программ для настольных игр? Специалисты обычно дают один из следующих дежурных ответов: игры – это испытательные стенды; игры обеспечивают контрольные задачи для оценки эффективности систем искусственного интеллекта; игры позволяют легко сравнивать результативность компьютера с результативностью человека; игры – это упрощенные модели аспектов «реального мира». Или (если специалист чуть более откровенен): игры – это увлекательно. Такие ответы хороши, но ни один из них не является до конца правдивым.
Истинная мотивация специалиста по вычислительным системам, разрабатывающего ИИ для игр, не слишком отличается от мотивации родителя, который тратит дорогое время и энергию на воспитание своего ребенка. Это творческий процесс. Придуманный Мэри Шелли доктор Франкенштейн, размышляя о своем творении, говорит: «Новая порода людей благословит меня как своего создателя; множество счастливых и совершенных существ будут обязаны мне рождением. Ни у одного отца нет стольких оснований на получение признательности ребенка, сколько будет у меня». Джонатан Шеффер испытал это чувство, когда одно из его алгоритмических творений впервые одержало над ним победу. «Мне удалось создать разумное поведение, – писал он. – Я испугался».
Шеффер, который родился в Торонто в 1957 году, с детства играл в разные игры. В книге «На шаг впереди» (One Jump Ahead), посвященной его шашечной одиссее и созданию игровой компьютерной программы, он живо рассказывает о своем детском увлечении шахматами с их «фигурами воинов короля Артура, отстаивающими королевскую честь» и «тщательно срежиссированным балетом». Шеффер отмечал сходство между своим пристрастием к этой игре и любовью, испытываемой знатоками «к изящным искусствам или музыке». В 16 лет он завоевал титул мастера спорта по шахматам. В Торонтском университете Шеффер сначала изучал математику, потом занялся физикой, а затем переключился на компьютерные науки, поверив в то, что даже если сам он никогда не станет чемпионом мира по шахматам, ему, возможно, удастся написать программу, которая сумеет завоевать этот титул. Он учился программированию, анализируя существующую шахматную программу, написанную на фортране, одном из первых языков программирования. В Университете Ватерлоо Шеффер тратил так много времени на программирование, стремясь научить компьютеры играть, что «запорол» свою диссертацию. Но это не имело значения. Он оформил в виде диссертации работу в области шахмат, дал ей академически корректное название «Эксперименты в области поиска и знаний» (Experiments in Search and Knowledge) и защитился в 1986 году.
Два года спустя, уже работая преподавателем в Университете провинции Альберта, он решил заняться шашками. По его представлениям, это не должно быть чем-то сложным (так же до него думал Сэмюэл). В конце концов, это всего лишь шашки. Шеффер не испытывал любви к этой игре, и его не трогали таящиеся в ней стратегические сокровища, привлекавшие Тинсли. В основе его интереса лежали приземленные побуждения. «Я мог бы привести множество научно обоснованных причин, но глубоко в душе у меня был настоящий ответ, – писал он. – Я мог победить». Шашки стали главным в жизни Шеффера.
Работа над системой, первоначально носившей название Beast, началась 2 июня 1989 года. Шеффер быстро обзавелся помощниками, подрядив двоих коллег, которые как-то за обедом нечаянно натолкнули его на идею заняться шашками. Он обратился к работам Сэмюэла, написанным три десятилетия назад. Кроме того, он разместил сообщение – по сути, крик о помощи – в конференции Usenet, посвященной шахматам (конференции, посвященной шашкам, не существовало).
Содержание сообщения было следующим: «Требуется функция оценки или рекомендации по ее разработке».
Единственный ответ пришел из Радиоастрофизической обсерватории Доминиона (Британская Колумбия) от Нормана Трелора, который на тот момент был безработным. Шеффер пригласил его в Эдмонтон. Трелор, «низкорослый, типичный англичанин в скромном костюме», внимательно прочитал работу Сэмюэла и заявил, что в ней есть серьезные изъяны, но он знает, как их исправить. Как оказалось, Трелор, в отличие от Шеффера и Сэмюэла, отлично играл в шашки.
Система Beast получила новое название – Chinook. Шеффер взял на себя разработку ее поисковой функции, а Трелор – алгоритм оценки. Они были готовы построить машину, способную взбираться на дерево шашек лучше, чем любой человек, даже сам Тинсли.
В августе 1989 года Шеффер сидел за столиком в лондонской пятизвездочной гостинице Park Lane, он покачивал ногой и грыз ногти. Денег, выделенных ему на исследования в области шашек, не хватало на то, чтобы снять номер в этой гостинице, поэтому, когда нужно было привести себя в порядок, он пользовался туалетом в холле. Каждое утро он вез Chinook на метро в Park Lane и устанавливал рядом с собой все это громоздкое оборудование, которое включало вычислительную машину Sun Microsystems с одним процессором и оперативной памятью 32 мегабайта. Созданная им и Трелором система уже достигла такого уровня, что сам Шеффер не мог ее обыграть.
Люди и машины прибыли в Лондон, чтобы участвовать в первой компьютерной олимпиаде. На десятках столов, расставленных в огромном банкетном зале, компьютеры с помощью посредников вроде Шеффера играли друг с другом в шахматы и шашки, а также в оваре, бридж, китайские шахматы, четыре в ряд, домино, го, гомоку, реверси, рэндзю и скрабл. Разговоры программистов и шорох передвигаемых фишек перемежались клацаньем клавиатур.
Противниками Chinook в категории шашек были такие программы, как Colossus, Sage Draughts, Checker Hustler, Tournament Checkers и, наконец, просто Checkers. Последняя программа заслуживала особого внимания. Ее создателем был разработчик программного обеспечения, концертирующий пианист и редактор журнала Hang Gliding. Тем не менее Chinook оставила позади всех представителей искусственного интеллекта и завоевала в Лондоне золотую медаль.
Шеффер и Трелор праздновали победу, однако не забывали о том, что на лондонской площадке не было самого выдающегося игрока в шашки, Мариона Тинсли. К этому моменту второй этап триумфальной карьеры Тинсли длился уже почти два десятилетия. «Многое смущало меня, – недавно признался мне Шеффер. – Как обыграть Тинсли? Ведь речь идет не об обычном человеке. Речь идет – и я говорю это не в отрицательном смысле – об отклонении от нормы. Речь идет о человеке, наделенном экстраординарными способностями. Сама мысль о нем вселяла в меня ужас».
Помимо быстрого поиска и точной оценки для победы над мастером Шефферу нужно было встроить в Chinook еще два ключевых элемента: дебюты и эндшпили. Каждая партия игры в шашки начинается одинаково: с 24 фишек, расставленных по своим полям определенным образом, иначе говоря, с предсказуемой мозаикой возможностей. Большинство подобных игр заканчиваются тоже одинаково – истощением резервов игроков и победой одного из них или ничьей. Распространенность и типичность этих вариантов порождают обширную теоретическую литературу – горы книг, посвященных дебютам и эндшпилям игр. Типичные дебюты даже получили свои названия: дебют Хендерсона, сицилианская защита, фусэки Сюсаку. Поскольку к концу игры на доске остается очень мало фишек, зачастую можно выполнить всесторонний компьютерный анализ и предсказать итог. Например, в шахматах эндшпиль, в котором слон и конь противостоят слону, теоретически гарантируют ничью, что отлично известно хорошим игрокам. А вот миттельшпиль, чистилище между дебютом и эндшпилем, – это Дикий Запад – много фигур, масса возможностей. Вычисления чрезвычайно сложны, поэтому конкретной теории практически нет.
С точки зрения компьютерных вычислений обсчет каждой позиции эндшпиля в реальном времени обошелся бы слишком дорого. Гораздо рациональнее было обсчитывать корректные розыгрыши эндшпилей заранее и загружать эти знания в Chinook. Поначалу это легко. Если на доске одна шашка (рядовая ситуация для эндшпиля), возможных позиций всего 120: простая шашка может находиться на одном из 28 полей, а дамка – на одном из 32 полей; при этом фишка может быть белой или черной. Однако если шашек две, позиций уже 7000. При трех шашках их больше четверти миллиона. При четырех – семь миллионов, при пяти – 150 миллионов, при шести – два с половиной миллиарда, а при семи – 35 миллиардов.
Иными словами, Шефферу нужно было научить Chinook выполнять с помощью механических операций то, что ведущие игроки делали с помощью интуиции и опыта. Целый месяц Шеффер по два часа в день педантично загружал в компьютер дебютные ходы из семитомного справочника по шашкам. (И это было еще немного. Кен Томпсон, разработчик операционной системы Unix и шахматной машины Belle, три года по часу в день вводил с клавиатуры строки из «Энциклопедии шахматных дебютов».) Что касается эндшпилей, Шеффер запустил на машинах обсчет бесчисленных комбинаций шашек и результатов. Через два с лишним месяца вычислений эндшпили с четырьмя шашками были завершены – как раз к лондонскому турниру 1989 года. В те времена драгоценные базы данных хранили на магнитной ленте – носитель был похож на огромную аудиокассету. С этим необычным предметом Шеффер разъезжал по соревнованиям, проводившимся в разных уголках мира. Даже единственный поврежденный бит информации в его массиве – одна единица вместо нуля – делал всю базу данных бесполезной.
О проекте
О подписке