Читать книгу «Слова и числа» онлайн полностью📖 — Владимира Валентиновича Трошина — MyBook.
image

В начале было слово

Действительно, в начале было слово, слово произнесенное, слово прозвучавшее и услышанное. Ведь речь бывает устной и письменной. Устная речь, в которой человек передает информацию с помощью различных звуков, исторически предшествовала возникновению графической передачи информации, то есть письменности. Многие народы тысячелетиями имели свой язык, но не могли записать сказанное, потому что не имели своей письменности. В истории мировой цивилизации развитие письменности шло тоже от слова к букве. Первым этапом развития письма была идеография – метод, при котором единицей графического обозначения является слово. Древнейшими идеографическими письменностями являются древнеегипетская, шумерская и китайская. Для обозначения предметов окружающего мира создавались рисуночные знаки – пиктограммы, которые постепенно становились все более условными, отрываясь от своих предметных прототипов.

Создание индивидуального знака для каждого слова языка шло относительно легко при обозначении предметов с более или менее определенными внешними контурами: гора, человек, солнце, дерево и т. д. Трудности начались при обозначении различного рода абстрактных понятий, действий, качеств и с увеличением количества знаков, требующих запоминания. Подобными знаниями мог владеть только узкий круг посвященных. Египетские письмена с изображениями людей, животных, растений, небесных тел и многого другого с давних пор казались чем-то таинственным и получили наименование – иероглифы, что означает «священные знаки».


(сайт: freeimg.ru/kartinka/158011)

Древнеегипетская и шумерская письменности в какой-то период исторического развития были забыты на долгое время. Только археологические раскопки и упорный труд многих ученых-энтузиастов по дешифровке найденных надписей и текстов возвращают нам знания об этих древнейших видах письменности.

Специфика древнекитайского языка, где преобладали односложные слова, и административное деление Древнего Китая на отдельные царства, говорившие на собственных диалектах, способствовали тому, что китайская иероглифическая письменность оказалась удобным средством междиалектного общения. Знак, передающий на письме слово, мог быть по-разному произнесен на различных диалектах китайского языка, но смысл текста понимался правильно. В результате китайская письменность постоянно развивалась и является единственным в мире последовательным иероглифическим письмом, эффективно действующим и в настоящее время. Вот для примера китайский иероглиф «книга».



Универсальные свойства китайской иероглифической письменности позволили легко приспособить ее для письма на японском, корейском, вьетнамском языках. Для многих покажется неожиданным, но иероглифами на нашей планете в настоящее время пользуется более 1 млрд. населения. Китайские филологи утверждают, что в китайском современном языке примерно 60 тыс. знаков. Минимальное количество иероглифов, которыми должен владеть выпускник средней общеобразовательной школы 3-4 тысячи символов. Те, кто занимается умственным трудом, должны владеть, как минимум 5 тысячами знаков. Иностранцы, которые желают получить сертификат об идеальном владении китайским языком, должны знать около 3000 иероглифов. Установлено, что для понимания смысла 99% текста достаточно знать 2500 наиболее распространенных символов. Мы, не задумываясь, покупаем китайские товары, сложнобытовую технику, в том числе смартфоны и компьютеры. Они постарались для нас и все надписи адаптировали, уж если не к русскому потребителю, то к американскому точно, переведя их на английский язык. Вот теперь задумайтесь: как пишут китайцы между собой СМС сообщения на своих телефонах[?] Клавиатура у них не содержит 3 тысячи кнопок по числу иероглифов, она такая же (почти) как у нас, но сообщения у них состоят из иероглифов. Задумались? Вот вам тема для собственного исследования.

Следующий вопрос: как китайцы работают на компьютерах, если тексты они тоже пишут иероглифами[?] Может у них клавиатура огромная на нескольких столах[?]

Наконец, как составить словарь, допустим, на 3 тысячи иероглифов? Какой поставить первым, какой последним. У нас словари составляются по алфавиту, а у них как сделать[?]

Вот что значит письменность. Характер письменности меняет полностью методику общения, при использовании иероглифов возникают сложности, о которых мы с вами и не задумываемся, а им приходится выкручиваться. Поставленные вопросы, возможно, заинтересуют вас, а поиск ответов на вопросы пробудит интерес к изучению китайского или японского языка. Уверен, пригодится обязательно!

Остальная часть человечества испугалась иероглифических трудностей и пошла другим путем: от знака-слова к слогам и буквам.

Следующим этапом развития письменности стало слоговое письмо, знаки которого уже не связывались с обозначаемыми предметами, а каждый из них соответствовал сразу нескольким звукам речи, целому слогу. Появление слоговых знаков было качественным и количественным скачком в истории письма. Качественным – потому, что слоговые знаки связывались только со звучанием и свидетельствовали о том, что люди стали осознавать членение слов на слоги. Количественным – потому, что на смену большому числу идеографических знаков-слов приходит ограниченное количество слоговых знаков. Первые слоговые знаки возникли в процессе развития идеографического письма, когда отдельные знаки начали утрачивать связь со значением слова, сохраняя лишь свое звучание, и превратились тем самым в звуковые знаки. Подобный процесс проходил в шумерском идеографическом письме. Шумеры писали на табличках из сырой глины: первоначально чертили знаки заостренной палочкой, а позднее стали выдавливать их палочкой, заточенной в виде треугольника – «клина».

Внешние обстоятельства часто определяют пути развития цивилизации. Доступность глины и отсутствие равноценной замены этому материалу, вязкость глины, вынудившая сменить рисование знаков на их выдавливание – все это способствовало распространению письменности, упрощению и схематизации условных знаков. Знаки-символы все дальше уходили от своего рисуночного прототипа, превращаясь в сочетания клиньев, имеющие звуковое слоговое соответствие в устной речи. Подобные же процессы проходили и в древнеегипетской письменности, но ни та, ни другая не стали чисто слоговыми, а только наметили пути развития.

Третий этап развития письменности – это появление буквенного письма и алфавитов. Создание алфавита не было одномоментным процессом, а происходило эволюционно. Предок всех алфавитов – финикийское письмо, состояло из 22 букв, обозначающих только согласные. Читающий должен был догадываться, какие гласные находятся между ними. Пользоваться таким набором знаков было сложно, но именно финикийское письмо послужило основой для создания современного консонантно-вокалического письма (то есть содержащего согласные и гласные буквы).

В 9 веке до нашей эры с финикийским письмом познакомились греки, которые, оставив порядок букв, изменили их форму и во многих случаях звучание, но самое главное – ввели знаки для обозначения гласных и тем самым создали первый настоящий алфавит. Греки экспериментировали и с последовательностью написания букв: писали справа налево, вертикально, смешанной записью справа налево и слева направо. Наконец около 500 года до нашей эры запись слева направо становится общепринятой.

Греческий алфавит, наряду с финикийским использовали этруски, а от их алфавита возник самый распространенный в настоящее время латинский алфавит. Такова краткая история развития письменности в целом.

Буквы и алфавит

Любая форма письменности представляет собой кодирование информации с помощью специальных значков. Чтобы понять закодированное сообщение, нужно знать код, то есть знать, что обозначает каждый знак. Между количеством знаков в коде и длиной текста, записанного с его помощью, прослеживается интересная закономерность, называемая в математике обратной пропорциональностью. Чем больше знаков содержит сам код, тем короче текст, записанный с его помощью, и наоборот, чем меньше знаков в коде, тем длиннее записанный текст. Например, чтобы читать текст на китайском языке, нужно помнить начертание тысяч иероглифов, но иероглифические тексты, сравнительно с текстами других систем письма, наиболее короткие. В то же время, самый короткий код может состоять всего из двух знаков. Пример подобного кода, успешно применявшегося в практике общения и передачи информации – это телеграфная азбука Морзе, которая содержит только два знака · и , то есть «точку» и «тире». В фильмах о разведчиках мы видим, как радисты передают секретные сообщения с помощью этой азбуки. Назван этот код в честь американского изобретателя и художника Сэмюэля Морзе, который в 1838 году предложил систему передачи текстов с помощью телеграфа. Потом система менялась и совершенствовалась, адаптировалась к другим языкам. Покажем интернациональную кодировку букв и цифр по принципу Морзе.


Две буквы можно закодировать, используя один знак: точка – буква E, тире – буква T. При составлении кода учитывалась частота соответствующих букв в англоязычных текстах. С помощью двух знаков можно закодировать еще четыре буквы – это две точки – буква I, два тире – буква M, точка тире – буква A, тире точка – буква. N. Здесь идет чистая математика. С помощью трех знаков можно закодировать 23=8 букв, с помощью четырех знаков 24=16 букв. Таким образом, используя от одного до четырех знаков (точек и тире) можно закодировать 2+4+8+16=30 букв. Практически остались неиспользованными четыре варианта кодировки четырьмя знаками, так как для английского алфавита в 26 букв хватило знаков с избытком. Цифры решили кодировать, используя по пять знаков для каждой. С математической точки зрения наборами из пяти точек или тире можно закодировать еще 25=32 знака.

В фильмах о разведчиках сообщения дополнительно для большей секретности кодируется цифрами и бедным радистам приходится выстукивать вместо коротких букв, пятизначные коды цифр. Не подумал Морзе о секретных службах, а то бы начал свою систему кодировки не с букв, а с цифр: точка – ноль, тире – единица и так далее. Сообщения были бы намного короче, и радистов труднее было бы запеленговать.

В наше время в вычислительной технике используется двоичное кодирование. Двоичный код состоит тоже из двух знаков 0 и 1, с помощью которых происходит промежуточное кодирование всех знаков алфавитного письма, а затем уже кодирование текста. Количество информации содержащейся в 0 или 1 принимается за 1 бит. Подход к кодированию букв, цифр и знаков изначально был принят другой. Все они кодируются наборами из восьми нулей или единиц. Набор из восьми нулей или единиц несет 1 байт информации. Следовательно, любой знак обычного текста содержит 1 байт информации. Этим кодом, который назвали КОИ-8 можно закодировать 28=256 различных знаков. Хватит на буквы английского и родного алфавита, а так же на знаки препинания, цифры и еще массу дополнительных знаков. В последнее время перешли с КОИ-8 на Юникод, который представляет собой кодировку с фиксированным размером символа в 16 бит или 2 байта и позволяет закодировать 216=65 536 знаков. Юникод включает в себя знаки почти всех письменных языков мира. В результате применения подобной системы кодирования, даже короткое предложение будет представлено сотнями знаков 0 и 1 в определенной последовательности, и только быстродействие компьютеров оправдывает использование двоичного кодирования информации.

Таким образом, при создании новых систем передачи информации, приходится учитывать специфику задач конкретной области знаний и балансировать между оптимальной длиной кода и оптимальной длиной текста. Для современной письменности такой золотой серединой являются буквенные алфавиты, содержащие от 25 до 35 знаков, которыми кодируется звуковая речь. Большинство языков имеют алфавитную письменность. Самый короткий алфавит распространен на острове Бугенвиль Соломоновых островов. Он содержит только 11 букв. Гавайский алфавит, созданный на основе латинского, имеет 13 букв. В самом длинном камбоджийском алфавите 72 буквы. С тех пор, как 3500 лет назад был создан первый алфавит, появилось более 200 различных способов записи звуков устной речи.

Большинство языков использует алфавиты, созданные на основе латинского алфавита или латиницы. Сюда относятся многие европейские языки и наиболее значимый из них в современном мире – английский. Если мы произнесем «латинский алфавит», и возьмемся перечислить его буквы, то сразу можем столкнуться с путаницей. Латинский алфавит обособился примерно в VII веке до н. э. и первоначально включал только 21 букву: A, B, C, D, E, F, Z, H, I, K, L, M, N, O, P, Q, R, S, T, V, X. В I веке до н. э., после завоевания Римом Греции, были добавлены буквы Y и Z для записи слов, заимствованных из греческого языка. В итоге получился классический латинский алфавит из 23 букв. Уже в новое время, около XVI века произошла дифференциация слоговых и неслоговых вариантов букв I и V и добавились буквы J и U. В итоге получился новый латинский алфавит из 25 букв. Чем же отличается английский алфавит от нового латинского по буквенному составу? В английском языке 26 букв, добавлена еще буква W.



...
8