Читать книгу «Социальная информатика» онлайн полностью📖 — Ирины Соколовой — MyBook.
image

Тема 2
Основные понятия теоретической информатики[45]

Принципиально важным для качественного анализа процессов информатизации общества является глубокое понимание и правильное использование в предметном поле социальной информатики теоретических подходов и понятий, заимствованных из теоретической информатики.

Приведем обоснование необходимости изучения в курсе «Социальная информатика» ряда понятий теоретической, а также «технической» информатики.

Любое уже сложившееся научное направление состоит примерно из 75 % собственно своих и 25 % заимствованных понятий как общенаучного характера, так и понятий из смежных научных областей, предметные же поля новых научных направлений, таких, например, как социальная информатика, содержат существенно большее число заимствованных понятий.

Упомянутые выше «заимствованные» понятия активно используются в своем предметном контексте социальной информатикой, и поэтому принципиально важным является их правильное понимание и применение при анализе информационных процессов в обществе.

Как уже отмечалось, наиболее адекватным возможности глубокого изучения социальных аспектов информатизации общества является определение информатики как научного направления, изучающего информационные процессы в трех средах – обществе, природе и технических устройствах (схема 2).

Схема 2


Общими для информационных процессов во всех трех средах являются такие понятия теоретической информатики, как информация, данные, знания, а также такое понятие «технической» информатики, как «интерфейс».

Часто термин «информация» используют, не задумываясь о его содержании, отождествляя, например, понятия «знание», «данные», «информация». Нередко также термин «информация» наполняется разным смыслом.

Приведем несколько определений понятия «информация» ученых с мировым именем.

Н. Винер: «Информация – это обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств»[46].

В.М. Глушков: «Информация, в самом общем ее понимании, представляет собой меру неоднородности распределения материи и энергии в пространстве и во времени, меру изменений, которыми сопровождаются все протекающие в мире процессы»[47].

С точки зрения А.И. Берга, информация – это отражение в сознании людей объективных причинно-следственных связей в окружающем нас реальном мире.

Таким образом, по мнению Н. Винера и А.И. Берга, информация тесно связана с субъектом восприятия (индивидуумом, социальной группой, обществом), т. е. информация является субъективной, а, по мнению В.М. Глушкова, – объективной категорией. Эти два подхода продолжают существовать и в современной науке[48].

Общая характеристика теоретических концепций и подходов к изучению закономерностей информационного обмена. В процессах информационного обмена нередко складываются ситуации, в которых качество информации зависит от того, насколько человек подготовлен к ее восприятию. Информация может характеризоваться с количественной (статистической) и качественной (ценностной) стороны. Ценность информации в свою очередь может оцениваться как объективно, так и субъективно. В соответствии с этим теоретические подходы к изучению закономерностей информационного обмена могут быть разделены на синтаксические, семантические и прагматические концепции. Аналогично называются основные разделы научного направления семиотики[49]: синтактика, семантика, прагматика.

Синтаксические концепции информационного обмена. Становление статистической теории информации относится к 50-х годам XX века, когда американским инженером Р. Хартли была введена количественная мера информации, передаваемой по каналам связи.

Рассмотрим простую игровую ситуацию. До получения сообщения о результате подбрасывания монеты человек находится в состоянии неопределенности. Сообщение партнера дает ему информацию, снимающее эту неопределенность. Заметим, что число возможных исходов в описанной ситуации равно 2, они – равновероятны, и каждый раз передаваемая информация полностью снимала возникавшую неопределенность.

Понятие «бит». Р. Хартли принял передаваемое по каналу связи «количество информации», снимающее неопределенность относительно результатов события, имеющего два равновероятных исхода путем указания на один из них, за единицу информации, в дальнейшем получившую название бит.

Создатель статистической теории информации К. Шеннон обобщил результаты Хартли. Его труды явились ответом на развитие в середине XX века радио, телефона, телеграфа, телевидения. Теория информации Шеннона позволяла ставить и решать задачи оптимального кодирования передаваемых сигналов с целью повышения пропускной способности каналов связи, подсказывала пути борьбы с помехами на линиях и т. д.

В работах Хартли и Шеннона информация представляется в виде отношений сигналов, знаков, сообщений – синтаксических отношений. Количественная мера Хартли-Шеннона не претендует на оценку содержательной (семантической) или полезной (прагматической) сторон передаваемого сообщения.

Кибернетическая теория информации. Новый этап теоретического расширения понятия информации связан с кибернетикой – наукой об управлении и связи в живых организмах, обществе и машинах. Кибернетика формулирует принцип единства информации и управления, который особенно важен для анализа процессов в самоуправляющихся, самоорганизующихся биологических и социальных системах.

Развитая в работах Н. Винера концепция предполагает, что управление в упомянутых системах является процессом переработки информации некоторым центральным устройством, получаемой от источников первичной информации и передачи ее в те участки системы, где она воспринимается ее элементами как приказ для выполнения действия. По совершении действия сенсорные рецепторы готовы к передаче информации об изменившейся ситуации для выполнения нового цикла управления. Так организуется циклический алгоритм управления и циркуляции информации в системе. При этом важно, что главную роль играет здесь содержание информации, передаваемой рецепторами и центральным устройством.

Таким образом, кибернетическая концепция подводит к необходимости оценить информацию как некоторое знание, имеющее одну ценностную меру по отношению к внешнему миру (<семантический аспект) и другую – по отношению к получателю, накопленному им знанию, его целям и задачам {прагматический аспект).

Семантические концепции информационного обмена. Попытки построить модели понятия информации, охватывающие семантический аспект знания, содержащегося в некотором высказывании относительно объекта, привели к созданию логико-семантических теорий (Р. Карнап, И. Бар-Хиллел, Дж. Г. Кемени, Е.К. Войшвилло и др.). В этих теориях информация рассматривается как уменьшение или устранение неопределенности. Естественно предположить, что средствами какого-либо языка с помощью создаваемых в нем высказываний можно описать некоторую совокупность возможных ситуаций, состояний, альтернатив. Семантическая информация, содержащаяся в каком-либо высказывании, исключает некоторые альтернативы. Чем больше альтернатив исключает высказывание, тем большую семантическую информацию оно несет.

В рассмотренных теоретических конструкциях – статистической и семантической информации – речь шла о потенциальной возможности извлечь из передаваемого сообщения какие-либо сведения. Вместе с тем в процессах информационного обмена очень часто складываются ситуации, в которых мощность или качество информации, воспринимаемое приемником, зависит от того, насколько он подготовлен к ее восприятию.

Понятие «тезаурус»: значение для информационного обмена. Понятие «тезаурус» является фундаментальным в теоретической модели семантической теории информации, предложенной Ю.А. Шрейдером и учитывающей в явной форме роль приемника.

Согласно этой модели, тезаурус – это знания приемника информации о внешнем мире, система категорий и понятий, которыми оперирует в своей мыслительной и практической деятельности человек, в итоге – его способность воспринимать те или иные сообщения. Уровень образования, образ жизни участника информационного обмена в значительной степени определяет глубину содержания и эффективность обмена.

Тезаурус, в широком смысле слова, – это словарный запас человека. Если тезаурус уже содержит информацию, заключенную в сообщении, т. е. он не изменяется с ее получением, то семантическая ценность этого сообщения является нулевой. Очевидно, что к подобной оценке прагматического содержания информации примешивается семантический аспект, скрытый в «установке» тезауруса на осмысление сообщения.

В прагматических концепциях информации этот аспект является центральным, что приводит к необходимости учитывать ценность, эффективность, экономичность информации, т. е. те ее качества, которые определяющим образом влияют на поведение самоорганизующихся кибернетических систем (биологических, социальных, человеко-машинных).

Прагматические концепции информационного обмена. Одной из наиболее ярких прагматических теорий информации является поведенческая модель коммуникации – бихевиористская модель Акоффа-Майлса. Исходным в этой модели является целевая устремленность получателя информации на решение конкретной проблемы и наличие альтернативных путей неодинаковой эффективности для достижения цели. Сообщение информативно, если оно изменяет «целеустремленное состояние» получателя.

Так как это состояние характеризуется последовательностью возможных действий, эффективностью действия и значимостью результата, то передаваемое получателю сообщение может оказывать воздействие на все три компонента в различной степени. В соответствии с этим передаваемая информация разделяется на «информирующую», «инструктирующую» и «мотивирующую». Таким образом, для получателя прагматическая ценность сообщения состоит в том, что оно позволяет ему наметить стратегию поведения при достижении цели. Для каждого типа информации бихевиористская модель предлагает свою меру, а общая прагматическая ценность информации определяется как функция разности этих количеств в «целеустремленном состоянии» до и после его изменения на новое подобное состояние.

Следующим этапом развития прагматических теорий информации явились работы американского логика Д. Харраха, построившего логико-прагматическую модель коммуникации. Одной из слабостей бихевиористской модели является ее неподготовленность к оценке ложных сообщений. Модель Харраха предполагает учет общественного характера коммуникации. В соответствии с ней получаемые сообщения должны быть сначала подвергнуты обработке для выделения подходящих сообщений, к совокупности которых должны быть применены критерии прагматической ценности.

Формализация знаний: характеристика методов и приемов. При поиске наиболее удобных, рациональных средств и форм информационного обмена человек чаще всего сталкивается с проблемой компактного и однозначного представления знаний – процесса, конечная цель которого поместить некоторый объем знаний в своеобразную «упаковку», в которой он может осуществлять движение по информационным каналам. Такой упаковкой может быть фраза устной речи, письмо, книга, географическая карта, картина и т. п.

Каждый вид упаковки имеет свои особенности, но всем им присуще одно качество, хотя и не в одинаковой степени: упаковка призвана обеспечить сохранность вложенного знания. Причем не только и не столько физическую, сколько смысловую (семантическую). Для этого необходимо, чтобы отправитель и получатель информации упакованных знаний пользовались некоторой общей системой правил для их представления и восприятия.

Основные проблемы языкового информационного обмена. Самым естественным, наиболее подходящим для человека вариантом формализации знаний является язык (устная речь и письменность).

Всякую ли мысль или знание можно выразить в языковой форме? По-видимому, нет. Например, существует множество определений таких понятий, как здоровье, счастье, любовь, дружба, интеллект, информация и т. п.

Мысль, которую нельзя выразить в языковой форме, не может быть включена в информационный обмен. Общение людей, таким образом, осуществляется с помощью языка как формы представления знаний. Одному и тому же содержательному знанию можно придать различную словесную форму, что проявляется в художественной прозе, поэзии и т. д. Богатство языка – это одновременно и богатство культуры того или иного народа.

Вместе с тем в различных сферах профессиональной деятельности это богатство и разнообразие выразительных средств естественного языка становится недостатком, а иногда – недопустимо, например, в армии, медицине, судопроизводстве и т. д.

В специальных отраслях науки формируются специфические языковые системы, являющиеся «сужением» естественного языка. Особо выделяется язык математики, как некоторая основа изложения системы знаний в точных, естественных науках. Свой язык имеют также химия, физика, философия, социология, педагогика, экономика, юриспруденция, психология и другие направления.

Целесообразность применения таких суженных языковых систем высока, они позволяют повысить надежность информационного обмена, так как возможность неправильного истолкования передаваемой информации существенно снижается. Главные достоинства такого языка – возможность создавать и использовать типовые упаковки знаний, а также в значительной мере снять полисемию (смысловую многозначность) естественного языка.

При этом, конечно, сужается и круг получателей, поскольку для восприятия информации необходимо владеть соответствующим языком – это, условно говоря, можно считать недостатком суженого языка.

Полисемия – основная проблема языковой формы информационного обмена, фактор внесения искажения и ошибок (семантического шума) на пути передачи информации. Поэтому устранение многозначности является одним из наиболее важных направлений в разработке формальных приемов представления знаний. Создание языка науки или языка деловой прозы, называемого часто «канцеляритом», является естественным шагом на этом пути. «Канцелярит» предназначен для объективизации изложения информации, использует, как правило, переводимые категории и языковые формы, лишен синонимии, оперирует конкретными фактами и понятиями, не избыточно информативен и логичен.

Все перечисленные выше свойства не присущи литературному языку, которому свойственна субъективность форм, возможность применения непереводимых конструкций, бесконечно богатая синонимия, образность высказываний и т. д.

Продвижение в сторону формализации знаний приводит к понятиям «класс» и «классификация».

Классификация – распределение предметов, объектов и понятий по группам (классам) в соответствии с обнаруженными свойствами.

В контексте информатизации общества ставится, например, вопрос о необходимости анализа и построения логических моделей сети Интернет с целью более полного извлечения содержащейся в нем информации: не фактической, как это делается в настоящее время, а аналитической, не представленной в сети явным образом[50].

Рассмотрим основные системы классификации знаний: иерархическую, морфологическую, древовидную, реляционную.

Классификация как метод научной систематики играет важную роль в формировании ядра знаний того или иного научного направления. Классификационные системы такого типа имеют выраженную иерархическую структуру, в которой все объекты (понятия, факты) разделены на уровни, связанные между собой отношением «старший – младший».

Классификация может проявить себя не только как инструмент организации научных знаний, но и как фактор социального порядка, способствующий активизации социальных отношений. Так, существующие системы тарифов и ставок, ученых степеней и званий, структура должностей и служебных постов в гражданской службе и армии играют не только организующую, но и стимулирующую роль. Подобная модель классификации знаний получила в науке и практике название иерархической.

Достоинства данной системы классификации заключаются в том, что она проста в освоении, легко обновляется и эффективно решает задачу разнесения новых понятий по иерархическим уровням.

Недостатки иерархической модели знаний: прямые связи между понятиями соседних уровней обозначены слабо, или вовсе отсутствуют; иерархическая классификация наиболее эффективна, когда при переходе от уровня к уровню работает один и тот же тип отношений, например, родовидовой.

Систематика, лежащая в основе классификации, может применяться как сильное средство исследования. Так, иногда оказывается полезным при рассмотрении группы объектов выделить несколько характерных для них признаков в качестве определяющих и ввести меру степени их проявления. Подобный подход называется морфологическим, так как использует идею разложения объекта на его части (признаки). Часто подобная группировка приводит к выявлению неизвестных закономерностей, связывающих объекты каждой группы.

Упомянутые выше недостатки иерархической модели классификации свойственны и морфологическим моделям. Их удается устранить, используя так называемые ветвящиеся (древовидные) структуры (модели) представления знаний, которые, в частности, лежат в основе актуальных в контексте развития Интернет гипертекстовых технологий. В последнее время исследователи активно разрабатывают способы автоматического построения гипертекстов. Идея динамического гипертекста состоит в том, что вместо разбивки текста на фиксированные узлы, текст связывается большим количеством связей между входящими в текст одноименными поисковыми единицами: словами, терминами, текстовыми константами и т. д. Разработанная в ИПИ РАН по концепции динамического гипертекста система ТЕРМИН-3[51] обеспечивает построение гипертекстовых сред в автоматическом режиме. Система предназначена для разработки конкретных гипертекстов, информационно-поисковых систем фактографического типа, электронных книг и тезаурусов, частотных словарей и т. п.

Отдельные понятия, факты, знания, связаны между собой отношениями, выражающими суть имеющихся между ними связей. Как и в иерархической модели, это могут быть родовидовые отношения, но также и другие типы отношений: «быть представителем», «иметь», «наследовать» и т. п. Однозначность связей в древовидной структуре и разнообразие охватываемых ею отношений позволяет повысить «динамизм» системы знаний. Действительно, система знаний, представленной иерархической или морфологической моделями, статична (декларативна).





1
...
...
9