Выделение класса и термина «историко-ориентированные информационные системы» связано с практикой создания исторических баз данных, которые долгое время были и все еще часто остаются технологической основой информационных систем. Развитие понятийного аппарата, подходы к созданию и классификация, а также другие теоретические и прикладные вопросы тесно связаны и во многом схожи для исторических баз данных и информационных систем. Можно отметить и такой признак, как типичное объединение двух видов ресурсов в одну секцию на профильных конференциях по исторической информатике и цифровой гуманитаристике.
Феномен внимания историков и других гуманитариев к технологии баз данных интересен сам по себе. «База данных становится центром творческого процесса в компьютерную эпоху», – пишет Л. Манович в 1999 г. Анализируя базы данных как культурную форму, он приходит к выводу, что база данных и нарратив являются «естественными врагами»: база данных представляет предметную область как неотсортированный список; нарратив же, напротив, создает линейное, а значит, последовательное и, возможно, причинно-следственное повествование, которое кажется неупорядоченными событиями. «Конкурируя на одной и той же территории человеческой культуры, каждый из них претендует на исключительное право сделать смысл из мира» [Manovich, 1999]. В некотором роде базы данных являются новой, текущей и будущей формой знаний, заменяя повествование в изучении истории и литературы [Drucker, Kim, Salehian, Bushong, 2013].
Базы данных относятся к эффективным средствам структурирования и организации информации. В зависимости от модели, которая положена в основу базы данных, она может быть иерархической, сетевой или реляционной. Возможность организации данных в базе на основе разных моделей позволяет наиболее адекватно представлять информацию об отображаемых объектах и эффективно работать с ней. Проектирование и создание информационных систем на основе реляционных баз данных будет подробно рассмотрено в главе 2; задача этого раздела – показать влияние исторических баз данных на формирование теории и понятийного аппарата информационных систем, используемых в области истории.
Наиболее значимо и комплексно исторические базы данных рассмотрены в исследованиях М. Таллера. В его работах, изданных в период с 1980-х по 2000-е годы, зафиксированы возникновение исторических баз данных, их эволюция, состояние и значимость на разных этапах информатизации истории.
Технология баз данных была и продолжает оставаться одной из наиболее востребованных в исторической информатике, цифровой истории и цифровых гуманитарных науках. На ее основе создаются электронные каталоги, цифровые архивы и библиотеки, тематические исторические ресурсы, коллекции машиночитаемых источников, публикаций и др. Созданные на основе технологии баз данных исторические информационные системы позволяют оптимальным образом сохранять, организовывать, визуализировать историческую информацию и обеспечивают необходимый доступ к ней.
Ч. Харви и Д. Пресс в обобщающем труде «Базы данных в исторических исследованиях. Теория, методы и приложения», изданном в 1996 г., говорят о том, что «проектирование и разработка баз данных играют центральную роль в трансформации методов исследований в истории». Авторы отмечают значимость этой технологии для разработки систем хранения первичных и вторичных источников, создания исследовательских ресурсов, связывания записей (record linkage), организации, поиска и сортировки исследовательских материалов, анализа и представления исторической информации в целом [Harvey, Press, 1996].
С началом внедрения систем управления базами данных (СУБД) перед историками встал вопрос об использовании программ общего назначения или разработке собственных решений. Данный вопрос решался индивидуально: «некоторые историки экспериментировали со стандартным программным обеспечением для баз данных: недружелюбными иерархическими СУБД, которые требовали программирования для навигации и поиска данных, или еще не полностью развитыми реляционными базами данных» [Boonstra, Breure, Doorn, 2006, p. 26].
С развитием и распространением реляционных баз данных, в силу своей простоты, адаптивности и универсальности, они быстро стали популярными и у историков [Denley, 1994; Harvey, Press, 1996]. Однако, как было показано в работах М. Таллера и других ученых, реляционная модель имеет серьезные ограничения при структурировании исторических источников. Так, исторические данные плохо вписываются в поля фиксированной длины, которые часто оказываются пустыми из-за отсутствия информации или содержат более одного значения; историки постоянно имеют дело с недесятичными системами счисления, изменяющимися топонимами; одно и то же слово может означать географическую принадлежность или просто быть фамилией [Thaller, 1988].
Решением этих проблем стало создание М. Таллером в начале 1980-х годов специализированной СУБД Клио (др. – греч. Κλειω) [Таллер, 1995], которая отличалась поддержкой нечеткости исторической информации и гибкостью форматов данных. Создание специализированной системы, как пишут О. Бонстра, Л. Брере и П. Доорн, «ознаменовало новый период исторического компьютинга» [Boonstra, Breure, Doorn, 2006, p. 26].
Существенным шагом в осмыслении рассматриваемых проблем являлась дискуссия о подходах к созданию историко-ориентированных баз данных, начатая М. Таллером и П. Доорном [Доорн, 1995; Таллер, 1993]. Ее результатом стало обоснование и утверждение двух основных подходов: проблемно-ориентированного и источнико-ориентированного, которые вполне можно рассматривать в качестве подходов к созданию историко-ориентированных систем в целом (что будет сделано в главе 2). Помимо указанных были предложены методо-ориентированный и пользовательско-ориентированный подходы, однако они не оказали определяющего влияния на развитие направления.
Постановка вопросов об источнико-ориентированном и проблемно-ориентированном подходах к созданию баз данных для исторических исследований означала видение специфики информационных ресурсов для исторической науки не только в том, что они содержат информацию особого рода – историческую, но и в переносе акцентов в понимании специфики исторических ресурсов вообще и историко-ориентированных баз данных в частности в область организации информации исторических источников и методов их обработки.
В этом смысле показательна позиция В. Леверманна, который через обоснование понятия «источнико-ориентированная обработка данных» развивает понятия «источнико-ориентированный подход» и «источнико-ориентированная информационная система» [Леверманн, 1994]. При этом содержание указанного понятия раскрывается словами М. Таллера о том, что источнико-ориентированная обработка данных, в противоположность так называемой методо-ориентированной, – «это стремление смоделировать в компьютере весь объем информации, содержащейся в историческом источнике; это попытка обеспечить возможность использования источника в самых разнообразных целях. Предоставляя историку средства для различных типов анализа, он не требует от него на этапе создания базы данных принятия решения о том, какие методы будут позднее использованы» [Таллер, 1993]. Отмечая достоинства и значение источнико-ориентированной обработки данных, В. Леверманн акцентирует внимание на том, что она ориентирована на максимально точное сохранение источника и предоставление широкого диапазона средств, позволяющих использовать различные аналитические подходы к ним [Леверманн, 1994].
Примечательно, что в предисловии редакции к сборнику научных трудов, в котором была опубликована цитируемая работа В. Леверманна, вводится и такое понятие, как «специализированное источнико-ориентированное программное обеспечение» [Круг идей…, 1994, с. 5]. Здесь же сформулирован вопрос о соотношении источнико-ориентированных технологий и информационных систем для обработки исторических данных. Отвечая на него, авторы указали, что проблема источнико-ориентированных технологий не сводится только к соответствующим системам, а связана с идеологией отношения к информации, в центре которой – сохранение инфраструктуры данных (структурной, семантической), возможность воспроизвести историографическую и культурную среду исследовательского процесса. Приведенные положения обогащают понимание историко-ориентированного подхода и историко-ориентированных информационных систем аспектами, связанными с программным обеспечением и технологиями. Кроме того, в них сформулированы и важнейшие принципы обеспечения специфики исторической информации, создания и эффективности историко-ориентированных информационных систем: сохранение инфраструктуры исторических данных, возможность воспроизведения историографической и культурной среды исторического исследования [Круг идей…, 1994, с. 7, 8].
Можно однозначно констатировать, что базы данных на много лет заняли нишу основного средства организации исторической информации и структурирования исторических источников. Историки и в настоящее время активно используют СУБД общего назначения для решения своих задач. Но нельзя не отметить, что в последнее десятилетие ведущим стандартом представления текстовых источников в гуманитарных науках (особенно в лингвистике и литературоведении) стал стандарт TEI (Text Encoding Initiative), позволяющий на основе XML проводить глубокую разметку текстов. Эта технология, с одной стороны, нивелирует недостатки реляционной модели и стандартных СУБД, а с другой – является более простой и доступной по сравнению с Κλειω.
О проекте
О подписке