III. 1. Когда мы узнаем, какое из двух событий имеет место, мы получаем информацию. Предполагается, что оба события равновероятны и что мы находимся в полном неведении относительно того, какое из них произойдет. Вероятность – это отношение числа возможностей ожидаемого исхода к общему числу возможностей. Если я подбрасываю монетку, ожидая, что выпадет: орел или решка, то вероятность составит 1/2.
В случае игральной кости, у которой шесть сторон, вероятность для каждой составит 1/6, если же я бросаю одновременно две кости, рассчитывая получить две шестерки или две пятерки, вероятность выпадания одинаковых сторон будет равняться произведению простых вероятностей, т. е. 1/36.
Отношение ряда событий к ряду соответствующих им возможностей – это отношение между арифметической и геометрической прогрессиями, и второй ряд является логарифмом первого.
Это означает, что при наличии 64-х возможных исходов, когда, например, мы хотим узнать, на какую из 64-х клеточек шахматной доски пал выбор, мы получаем количество информации, равное lg264, т. е. шести. Иными словами, чтобы определить, какое из шестидесяти четырех равновероятных событий произошло, нам необходимо последовательно произвести шесть операций выбора из двух.
Как это происходит, показано на рис. 2, причем для простоты число возможных случаев сокращено до восьми, если имеется восемь непредсказуемых, так как они все равновероятны, возможных исходов, то определение одного из них потребует трех последовательных операций выбора. Эти операции выбора обозначены буквами. Например, чтобы идентифицировать пятый случай, нужно три раза произвести выбор в точке А между В1 и В2, в точке В2 между С3 и С4 и в точке С3 выбрать между пятым и шестым случаями. И так как речь шла об идентификации одного случая из восьми возможных, то
Log28 = 3.
В теории информации единицей информации, или битом (от «binary digit», т. е. «бинарный сигнал»), называют информацию, получаемую при выборе из двух равновероятных возможностей. Следовательно, если идентифицируется один из восьми случаев, мы получаем три бита информации, если один из шестидесяти четырех – то шесть битов.
При помощи бинарного метода определяется один из любого возможного числа случаев – достаточно последовательно осуществлять выбор, постепенно сужая круг возможностей. Электронный мозг, называемый цифровым, или дигитальным, работая с огромной скоростью, осуществляет астрономическое число операций выбора в единицу времени. Напомним, что и обычный калькулятор функционирует за счет замыкания и размыкания цепи, обозначенных 1 и о, соответственно; на этой основе возможно выполнение самых разнообразных операций, предусмотренных алгеброй Буля.
III. 2. Характерно, что в новейших лингвистических исследованиях обсуждаются возможности применения метода бинарных оппозиций при изучении вопроса о возникновении информации в таких сложных системах, как, например, естественный язык[21].
Знаки (слова) языка состоят из фонем и их сочетаний, а фонемы – это минимальные единицы звучания, обладающие дифференциальными признаками, это непродолжительные звучания, которые могут совпадать или не совпадать с буквами или буквой алфавита и которые сами по себе не обладают значением, но, однако, пи одна из них не может подменять собой другую, а когда такое случается, слово меняет свое значение. Например, по‑итальянски я могу по‑разному произносить «e» в словах «bene» и «cena», но разница в произношении не изменит значения слов. Напротив, если, говоря по‑английски, я произношу «i» в словах «ship» и «sheep» (транскрибированных в словаре соответственно «∫ip» и «∫i: p») по‑разному, налицо оппозиция двух фонем, и действительно, первое слово означает «корабль», второе – «овца». Стало быть, и в этом случае можно говорить об информации, возникающей за счет бинарных оппозиций.
III. 3. Вернемся, однако, к нашей коммуникативной модели. Речь шла о единицах информации, и мы установили, что, когда, например, известно, какое событие из восьми возможных осуществилось, мы получаем три бита информации. Но эта «информация» имеет косвенное отношение к собственно содержанию сообщения, к тому, что мы из него узнали. Ведь для теории информации не представляет интереса, о чем говорится в сообщениях, о числах, человеческих именах, лотерейных билетах или графических знаках. В теории информации значимо число выборов для однозначного определения события. И важны также альтернативы, которые – на уровне источника – представляются как со-возможные. Информация – не столько то, что говорится, сколько то, что может быть сказано. Информация – это мера возможности выбора. Сообщение, содержащее один бит информации (выбор из двух равновероятных возможностей), отличается от сообщения, содержащего три бита информации (выбор из восьми равновероятных возможностей), только тем, что во втором случае просчитывается большее число вариантов. Во втором случае информации больше, потому что исходная ситуация менее определенна. Приведем простой пример: детективный роман тем более держит читателя в напряжении и тем неожиданнее развязка, чем шире круг подозреваемых в убийстве. Информация – это свобода выбора при построении сообщения, и, следовательно, она представляет собой статистическую характеристику источника сообщения. Иными словами, информация – это число равновероятных возможностей, ее тем больше, чем шире круг, в котором осуществляется выбор. В самом деле, если в игре задействованы не два, восемь или шестьдесят четыре варианта, а п миллиардов равновероятных событий, то выражение
I = lg2 109n
составит неизмеримо большую величину. И тот, кто, имея дело с таким источником, при получении сообщения осуществляет выбор одной из n миллиардов возможностей, получает огромное множество битов информации. Ясно, однако, что полученная информация представляет собой известное обеднение того несметного количества возможностей выбора, которым характеризовался источник до того, как выбор осуществился и сформировалось сообщение.
В теории информации, стало быть, берется в расчет равновероятность на уровне источника, и эту статистическую величину называют заимствованным из термодинамики термином энтропия[22]. И действительно, энтропия некоторой системы – это состояние равновероятности, к которому стремятся ее элементы. Иначе говоря, энтропия связывается с неупорядоченностью, если под порядком понимать совокупность вероятностей, организующихся в систему таким образом, что ее поведение делается предсказуемым. В кинетической теории газа описывается такая ситуация: предполагается, впрочем, чисто гипотетически, что между двумя заполненными газом и сообщающимися емкостями наличествует некое устройство, называемое демоном Максвелла, которое пропускает более быстрые молекулы газа и задерживает более медленные. Таким образом, в систему вводится некоторая упорядоченность, позволяющая сделать прогнозы относительно распределения температур. Однако в действительности демона Максвелла не существует, и молекулы газа, беспорядочно сталкиваясь, выравнивают скорости, создавая некую усредненную ситуацию, тяготеющую к статистической равновероятности. Так система оказывается высокоэнтропийной, а движение отдельной молекулы газа непредсказуемым.
Высокая энтропийность системы, которую представляют собой буквы на клавиатуре пишущей машинки, обеспечивает возможность получения очень большого количества информации. Пример описан Гильбо: машинописная страница вмещает 25 строк по 60 знаков в каждой, на клавиатуре 42 клавиши, и каждая из них позволяет напечатать две буквы, таким образом, с добавлением пробела, который тоже знак, общее количество возможных символов составит 85. Если, умножив 25 на 60, мы получаем 1500 позиций, то спрашивается, какое количество возможных комбинаций существует в этом случае для каждого из 85 знаков клавиатуры?
Общее число сообщений с длиной L, полученных с помощью клавиатуры, включающей С знаков, можно определить возводя L в степень С. В нашем случае это составит 85 в степени 1500 возможных сообщений. Такова ситуация равновероятности, существующая на уровне источника, и число возможных сообщений измеряется 2895-значным числом.
Но сколько операций выбора надо совершить, чтобы идентифицировать одно-единственное сообщение? Очень и очень много, и их реализация потребовала бы значительных затрат времени и энергии – как нам известно, каждое из возможных сообщений включает 1500 знаков, каждый из которых определяется путем последовательных выборов между 85 символами клавиатуры… Потенциальная возможность источника, связанная со свободой выбора, чрезвычайно высока, но передача этой информации оказывается весьма затруднительной[23].
III. 4. Здесь-то и возникает нужда в коде с его упорядочивающим действием. Но что дает нам введение кода? Ограничиваются комбинационные возможности задействованных элементов и число самих элементов. В ситуацию равновероятности источника вводится система вероятностей: одни комбинации становятся более, другие менее вероятными. Информационные возможности источника сокращаются, возможность передачи сообщений резко возрастает.
Шеннон[24] определяет информацию сообщения, включающего N операций выбора из h символов, как
I = Nlg2h
(эта формула напоминает формулу энтропии).
Итак, сообщение, полученное на базе большого количества символов, число комбинаций которых достигает астрономической величины, оказывается высокоинформативным, но вместе с тем и непередаваемым, ибо для этого необходимо слишком большое число операций выбора. Но эти операции требуют затрат, идет ли речь об электрических сигналах, механическом движении или мышлении: всякий канал обладает ограниченной пропускной способностью, позволяя осуществить лишь определенное число операций выбора. Следовательно, чтобы сделать возможной передачу информации и построить сообщение, необходимо уменьшить значения N и h. И еще легче передать сообщение, полученное на основе системы элементов, число комбинаций которых заранее ограничено. Число выборов уменьшается, но зато возможности передачи сообщений возрастают.
Упорядочивающая функция кода как раз и позволяет осуществить коммуникацию, ибо код представляет собой систему вероятностей, которая накладывается на равновероятность исходной системы, обеспечивая тем самым возможность коммуникации. В любом случае информация нуждается в упорядочении не из-за ее объема, но потому, что иначе ее передача неосуществима.
С введением кода число альтернатив такого высокоэнтропийного источника, как клавиатура пишущей машинки, заметно сокращается. И когда я, человек знакомый с кодом итальянского языка, за нее сажусь, энтропия источника уменьшается, иными словами, речь идет уже не о 85 в степени 1500 сообщениях на одной машинописной странице, обеспечиваемых возможностями клавиатуры, но о значительно меньшем их числе в соответствии с вероятностью, отвечающей определенному набору ожиданий, и, стало быть, более предсказуемом. И даже если число возможных сообщений на страничке машинописного текста неизменно велико, все равно введенная кодом система вероятностей делает невозможным присутствие в моем сообщении таких последовательностей знаков, как «wxwxxsdewvxvxc», невозможных в итальянском языке за исключением особых случаев металингвистических описаний, подобных только что приведенным. Эта система не разрешает ставить «q» после «ass», зато позволяет предсказать с известной долей уверенности, что вслед за «ass» появится одна из пяти гласных: «asse», «assimilare» и т. д. Наличие кода, предусматривающего возможность разнообразных комбинаций, существенно ограничивает число возможных выборов.
Итак, в заключение дадим определение кода как системы, устанавливающей 1) репертуар противопоставленных друг другу символов; 2) правила их сочетания; $) окказионально взаимооднозначное соответствие каждого символа какому-то одному означаемому. При этом возможно выполнение лишь одного или двух из указанных условий[25].
О проекте
О подписке