Электронные библиотеки: принципы создания
4.1. Разработка концепции электронной библиотеки
Создание электронных библиотек влечет за собой необходимость разрешения множества традиционных и вновь возникающих вопросов, обусловленных электронным документным пространством. Как справедливо замечают специалисты, в настоящее время работа с электронными изданиями ведется в условиях значительной — терминологической, типологической, правовой, технологической неопределенности, а сама идея электронной библиотеки базируется на еще неустоявшейся концепции, подлежащей систематическому пересмотру и обновлению.
Проблемы формирования электронной библиотеки можно разделить на четыре группы.
- Содержательные, связанные с определением состава фонда, контингентом пользователей, формулированием целей создания электронной библиотеки, ее функциональных возможностей.
- Организационные, в том числе поиск партнеров и источников финансирования, вопросы управления ЭБ, особенно для распределенных систем.
- Технологические, включая описание электронных документов, их учет, организацию их долговременного сохранения и т. д.
- Технические (например, методика перевода традиционных изданий или издательских оригинал-макетов в форматы электронной библиотеки; разработка средств контроля доступа и т. д.).
Все эти аспекты отражаются в концепции электронной библиотеки, которая должна включать обоснование основных направлений ее развития и принципы организации, политику формирования и условия доступа.
В самом общем виде концепцию электронной библиотеки целесообразно изложить по следующим разделам.
- Введение, в котором обосновывается необходимость создания электронной библиотеки.
- Формулирование цели и задач, которые будут решены посредством ее создания.
- Описание потенциальных пользователей, их особенностей, структуры информационных потребностей.
- Описание архитектуры электронной библиотеки.
- Формулирование функциональных требований.
- Определение принципов и источников формирования фонда.
- Организация поискового аппарата.
- Статус ЭБ в структуре организации.
- Принципы взаимодействия с другими структурами и организациями в ходе создания и функционирования электронной библиотеки.
- Экономическая модель функционирования ЭБ.
Вне зависимости от того, является ли электронная библиотека локальной или она выставлена в Интернете (с различными условиями доступа), ее создание должно быть направлено на достижение основной цели, которая видится в удовлетворении определенного сегмента информационных потребностей методами, наиболее отвечающими специфике этих»потребностей, на основе организованного массива электронных документов, сформированного по определенным критериям. Посредством электронной библиотеки могут быть решены такие задачи, как:
- обеспечение более широкой доступности документов, предоставление которых читателям затруднено или ограничено (редких книг, фотоальбомов, рукописных книг, диссертаций, архивов и т. п.);
- организация фондов документов/изданий, существующих исключительно в электронной форме, их каталогизация и предоставление в доступ;
- предоставление пользователям качественно новых возможностей работы с большими объемами электрон
Среди основных функций электронной библиотеки могут быть названы:
информационная, направленная на удовлетворение потребности в информации различных категорий пользователей по всем отраслям знаний либо в одной из предметных областей;
просветительская, реализуемая в том числе за счет популяризации книг, манускриптов и других документов, относящихся к истории и культуре;
научно-исследовательская, ориентированная на содействие глубокому изучения темы (предмета) научными работниками и специалистами высокого уровня подготовленности, в том числе посредством предоставления диссертаций и возможности качественно нового изучения рукописных материалов;
образовательная, в рамках которой осуществляется поддержка как формального, так и неформального образования (путем предоставления не только учебного материала, но и необходимой дополнительной литературы в виде авторитетных монографий);
справочная, позволяющая получать достоверные сведения, отраженные в документах определенного вида.
Для электронной библиотеки характерна важная роль интерфейса, отражающего и организующего ее основные функциональные возможности: учета и регистрации читателей, комплектования, навигации и поиска, библиотечной статистики и др. Многие электронные библиотеки служат для привлечения пользователей к другим функциям портала, например, к электронной торговле, что также влияет на интерфейс. Если электронная библиотека служит рекламной площадкой, то баннерная или контекстная реклама также является необходимым компонентом интерфейса.
В то время как традиционные библиотеки придерживаются принципа открытого и бесплатного доступа к фондам электронных публикаций, большинство создателей электронных библиотек используют многовариантные подходы — свободный доступ, достул по регистрации, коммерческое использование. Выбрр режима доступа должен быть отражен в концепции ЭБ.
При формировании электронной библиотеки нельзя не принимать во внимание ее читательское назначение. Интернет-аудито- рия в целом характеризуется высоким образовательным уровнем и молодым возрастом. Быстро растет количество детей, имеющих необходимые навыки работы в компьютерной среде. В настоящее время социологические исследования не позволяют выявить однородные читательские группы с устойчивыми и в достаточной степени локализованными информационными потребностями.
Таким образом, формирование электронных библиотек может опираться либо на известные их создателям целевые группы (студенты, специалисты в конкретных отраслях знания и т. д.), либо на экстраполяцию профессиональных представлений о функциях библиотеки в электронную среду.
Например, фонд электронных документов национальной библиотеки должен быть предназначенным максимально широким категориям пользователей и, с одной стороны, выполнять просветительские и образовательные функции, а с другой — служить поддержкой развития науки. Исходя из этого, Российская государственная библиотека, осуществляя отбор коллекций или отдельных изданий для оцифровки, руководствуется двумя базовыми положениями. Во-первых, в основу отбора положены просветительский подход и общественная миссия национальной библиотеки России, что делает приоритетными такие качества издания, как их долговременная научная и культурная значимость. Во-вто- рых, электронный фонд образуется по модульному принципу, позволяющему создавать и предлагать пользователям отдельные коллекции (диссертации, учебники и т. д.) достаточного объема.
Функциональные требования к электронной библиотеке определяются ответами на ряд важных вопросов.
- Разнородные или однородные электронные документы включает библиотека ?
- Будут ли созданы единые средства поиска по разнородным коллекциям?
- Какие формы библиотечного и информационного обслуживания будут предоставлены пользователям в электронной библиотеке?
- Как будет обеспечена сохранность фондов электронной библиотеки?
В зависимости от того, какие методы комплектования предполагается использовать, определяются важнейшие особенности ЭБ. Например, если электронная библиотека будет формироваться путем оцифровки, то важно принять решение об использовании технологии распознавания и, возможно, корректуры распознанных текстов.
Важную роль в концепции должны занимать правовые вопросы. Если предполагается перевод в цифровую форму изданий, охраняемых авторским правом, то необходимо четко и детально определить принципы взаимоотношений со всеми правообладателями.
В случае, если электронная библиотека создается несколькими организациями, важно прописать механизмы их взаимодействия и основные функции каждого участника, выполняемые в процессе совместной работы.
Принципы, источники и организация комплектования фонда электронной библиотеки в концепции указываются в общем виде, поскольку более детально эти вопросы раскрываются в Положении об электронной библиотеке и Профиле ее комплектования. Аналогично определяются общие экономические принципы функционирования (составляющие основу Бизнес-плана).
Общие принципы проектирования ЭБ. Выше было указано, что основной задачей ЭБ является удовлетворение информационных потребностей определенной группы пользователей. Естественно, что для разных групп пользователей эти потребности не совпадают. Речь идет не только о тематическом и видовом содержании фонда, но также о способах представления информации в ЭБ, ее достоверности, актуальности, полноте и других качественных характеристиках.
Также не совпадают потребности пользователей в функциональных возможностях ЭБ: чем более широким является круг пользователей, тем проще должны быть функциональность системы, ее интерфейс. Для квалифицированных пользователей необходимо предусмотреть значительно большие возможности, чем для массового потребителя.
На принципы проектирования ЭБ оказывает существенное влияние характер информационной деятельности организации, в которой она создается. Библиотеки, архивы, музеи, учебные заведения, научные учреждения, информационные агентства имеют свои, сильно различающиеся требования к организации информационных процессов, которым должна удовлетворять проектируемая система. Эти требования, естественно, минимизируются, если создается любительская ЭБ или ЭБ в рамках неформального сообщества. Самостоятельным классом с этой точки зрения следует признать коммерческие ЭБ, главным требованием к которым является рентабельность.
В общем, при проектировании ЭБ следует рассматривать два класса требований, которые можно назвать пользовательскими и общесистемными.
Пользовательские требования определяют содержание фонда, его структуру, систему метаданных и функциональные возможности ЭБ.
Общесистемные требования определяют общую структуру ЭБ, технологию ее функционирования с учетом поставленных задач и определенной специфики, порядка использования и администрирования, характера взаимодействия с другими организациями.
Например, для библиотек и архивов дополнительной функцией ЭБ может служить ее использование в качестве страхового фонда для обеспечения сохранности документов в иной форме, чем традиционные документы.
И, конечно, для проектирования ЭБ решающими условиями являются финансовые возможности и наличие квалифицированных разработчиков.
Очевидно, что качественная крупная многофункциональная электронная библиотека требует значительных затрат. Спектр возможных решений, с финансовой точки зрения, чрезвычайно разнообразен: электронная библиотека может быть создана практически бесплатно или с минимальными затратами. Например, в учебных заведениях для этой цели широко используется труд студентов. Существуют и бесплатные свободно распространяемые программные оболочки для ЭБ, например, достаточно известна система Greenstone. Как показывает опыт, практически бесплатно можно обеспечить и комплектование фонда электронных документов, например, за счет присылаемых авторами произведений. Такие собрания создаются в российском Интернете в значительном количестве, но, как правило, имеют не очень высокое качество, слабую функциональность; часто не соблюдаются требования законодательства, не обеспечивается сохранность электронных документов и др.
Один из первых вопросов, который приходится решать в концепции ЭБ, — будет ли она создаваться собственными силами или для разработки предполагается привлечение специализированной организации (принцип аутсорсинга). Понятно, что аутсорсинг ведет к использованию уже реализованных технологических решений, что имеет как положительные, так и отрицательные стороны. Для стандартной ЭБ, создаваемой в организации, не имеющих своего квалифицированного персонала, технических средств и т. д., аутсорсинг может быть единственным реальным и разумным решением. Так, правовая ЭБ на правительственном портале полностью создана и поддерживается известной специализированной фирмой «Гарант».
Естественно, следует рассматривать возможность промежуточных решений. В частности, распространена передача специализированным организациям функции оцифровки (особенно, если она планируется в значительных масштабах), функций хостинга, разработки веб-дизайна, специальных программных приложений и др. Например, Фундаментальная электронная библиотека, которая в целом создавалась собственными силами специалистов НТЦ «Ин- формрегистр» и ИМЛИ РАН, использует поисковую систему компании Яндекс.
Требования к ЭБ, которые необходимо учесть при ее концептуальном проектировании, будут рассмотрены с двух упомянутых точек зрения — пользовательской и административной.
В настоящем разделе приводятся функциональные требования к развитой электронной библиотеке. Для более простых и дешевых решений эти требования должны адаптироваться разработчиками ЭБ применительно к конкретным условиям.
Общие требования к пользовательским функциям и технологиям электронных библиотек. На концепцию ЭБ, а также на их программное обеспечение существенное влияние оказывают требования, связанные с представлением и возможностью использования информации.
В принципе, ЭБ могут представлять собой достаточно широкий спектр информационных систем с различным набором задач и возможностей: от простейших, позволяющих пользователю только просматривать и копировать документы, до весьма развитых. Из простых вариантов реализации ЭБ можно указать на широко известную Библиотеку М. Мошкова . Примером функционально развитой ЭБ является Фундаментальная электронная библиотека «Русская литература и фольклор» .
Все информационное пространство ЭБ, доступное пользователю, должно быть представлено в виде совокупности самостоятельных объектов (в том числе и электронных документов). Электронные объекты могут представлять собой текстовые произведения, изображения, фонограммы, базы данных или их фрагменты, отдельные имена и т. д. Организация информационного пространства как совокупности объектов и однозначная идентификация последних необходимы для обеспечения эффективной навигации и выполнения некоторых видов информационных поисков.
Инструментом описания и идентификации выступают метаданные, в том числе библиографические записи, поскольку основную часть фонда будут составлять обычные документы.
Как уже отмечалось, ЭБ реализуются в виде определенных информационных систем. Это должны быть полнотекстовые системы, обеспечивающие поддержку и использование объектов (например, текстовых документов) с разнообразной и по возможности достаточно развитой структурой. Развитые ЭБ должны иметь достаточно мощный механизм поиска, позволяющий работать с лексикой естественных языков с учетом их грамматики — как минимум словоизменения, поддерживать систему связей между объектами и между элементами этих объектов, в частности систему гипертекстовых и гипермедийных связей, которые бывают различных типов. Для пользователя информация должна отображаться в виде, максимально соответствующем исходному материалу.
Большинство из перечисленных требований предполагает, что эти системы работают с информацией, размеченной с помощью БСМЬподобных языков, что, в свою очередь, задает определенные условия для технологии обработки информации и загрузки ее в системы.
Кроме того, должна быть предусмотрена возможность конструирования в системах сложных информационных объектов со своими характеристиками и идентификаторами. При этом новый, сложный объект обладает структурой, включающей в себя структуры входящих в него компонентов.
К основным функциональным возможностям, которые должны обеспечивать информационные системы этого класса, следует отнести:
- навигацию во всем доступном информационном пространстве — наглядное предоставление пользователю логической структуры информационного пространства, например в виде дерева, организующего все информационные объекты системы, и средств работы с ней (частичное или полное раскрытие структуры, сокращение ее до заданных элементов и т. п.). Конечными узлами дерева («листьями») являются информационные объекты, которые пользователь может вызывать на экран непосредственно из этой структуры при работе с ней;
- лексический поиск — информационный поиск по свободной лексике русского языка (как современного, так и дореформенного) и языков, использующих латинский алфавит. При этом поиск по лексике русского языка должен проводиться с учетом его грамматических особенностей (изменения по падежам, наличие беглых гласных и т. п.). При составлении поисковых предписаний должно допускаться применение логических (И, ИЛИ, И-НЕ) и контекстных операторов, учиты-вающих порядок следования операндов и расстояние между ними. Результат лексического поиска представляет собой совокупность информационных объектов, содержащих лексику поискового предписания (с точностью до критерия соответствия), которая в текстах должна быть выделена (например, подсвечена);
- символьный поиск — разновидность лексического поиска, где в качестве лексической единицы выступает определенная последовательность допустимых символов, например, даты;
- атрибутный поиск — информационный поиск объектов по значениям их характеристик. Для текстовых объектов к таким характеристикам могут относиться «автор», «название», «место издания», «дата издания» и т. п. Атрибутный поиск должен допускать использование логических операторов (И, ИЛИ, И- НЕ), а также возможность проведения поиска по значениям двух и более характеристик одновременно. Результат атрибутного поиска — совокупность информационных объектов, значения характеристик которых удовлетворяют условиям поискового предписания. Результаты поиска должны допускать различные сортировки;
- просмотр содержания информационного объекта и его структуры: последовательный (например, страница за страницей) и выборочный (переход на любую заданную страницу или на любой элемент, отраженный в структуре). Разумеется, структура и текст произведения должны быть синхронизированы — любое изменение положения в структуре вызывает соответствующее изменение положения в тексте и наоборот;
- многооконный режим работы, позволяющий пользователю одновременно видеть на экране два окна (как минимум) с разным содержанием;
- одновременный вывод на экран (в разных окнах) текстов двух разных произведений или двух экземпляров одного произведения;
- манипулирование со структурой информационного объекта аналогичное работе со структурой всего информационного пространства;
- поддержка аппарата гипертекстовых и гипермедийных связей, обеспечивающего пользователю оперативный переход от объекта или некоторого его элемента к друго
взаимосвязанному с ним объекту или его элементу. Допускается существование связей типа «один-к-одному» и «один-ко-многим»; |
- протоколирование сеанса работы пользователя с возможностью перехода в любое из ранее существовавших состояний системы;
- выполнение пользователем настройки системы (задание определенной конфигурации окон, размеров шрифтов и др.).
- установка закладок в тексте информационных объектов и возможность оперативного перехода на них;
- экспорт информации из системы с указанием на источник (собственно ЭИ или ЭБ и информационный объект, из которого копируется информация);
- списки, допускающие сортировку по значениям любого поля, определенного как ключевое.
Общесистемные требования к ЭБ. Обычно ЭБ формируется как единая база данных, состоящая из электронного каталога (ЭК) и фонда. Однако возможна и трехуровневая структура: коллекция (и ее метаинформация) — документ (и его метаинформация) — объект (и его метаинформация).
Необходимо определить, как будет организован электронный документ, включающий несколько составляющих с различными типами данных, как будут связаны эти составляющие с другими материалами. Электронный документ может состоять из страниц, глав, индексов, иллюстраций и других элементов, может физически сохраняться в виде нескольких файлов, содержащих текст и графику со связями между ними. При этом любой отдельный документ, состоящий из нескольких файлов, может быть «собран» в один файл (папку, директорию) и снабжен титульным листом. На каждый многостраничный документ, включаемый в ЭБ, формируется новый титульный лист.
Одним из центральных вопросов проектирования ЭБ является организация метаданных, включая информационно-поисковые языки атрибутного, классификационного и вербального типов. Выбор метаданных во многом определяет и функциональность ЭБ, и стоимость работ по ее формированию и поддержанию.
Выбор формата хранения документов. Для представления документов в ЭБ могут использоваться разные форматы, в том числе:
- формат PDF;
- формат Deja Vue;
- форматы DOC, TXT;
- форматы для изображений TIFF, JPEG;
- аудиоформаты, например, mp3;
- гипертекстовый язык разметки HTML;
- расширенный язык разметки текста XML. При этом для всех типов документов, включаемых в ЭБ, определяются стандартные или специфические определители типа документа (DTD) в качестве грамматик, описывающих комплекс метокХМ1_и их взаимосвязей, или схемы описания ресурса (RDF-схемы).
Могут быть также предусмотрены особые форматы для представления геоданных, трехмерных или анимационных объектов экспериментальных данных и других особых видов информации.
Выбор одного или нескольких форматов для хранения определяется в рамках концепции ЭБ с учетом пользовательских и общесистемных требований.
Общесистемные требования к доступу к ЭБ. При разработке требований к доступу ЭБ необходимо принимать во внимание условия создания и использования входящих в нее электронных документов. Свободный доступ ко всей ЭБ возможен только в том случае, если все входящие в нее документы не имеют ограничений с точки зрения охраны авторских прав (наличие разрешения правообладателя, истек срок охраны, документ изначально не охраняется авторским правом). В противном случае необходимо формировать отдельные модули по условиям доступа.
Например, полный и свободный доступ в режиме чтения к документам в ЭБ, создаваемым в рамках библиотечной системы страны, обеспечивается только с рабочих мест в специально оборудованном читальном зале. Копирование электронных документов и их фрагментов выполняется на платной основе с соблюдением авторских прав.
Общесистемные требования к программному обеспечению. Программное обеспечение (ПО) для развитых ЭБ может иметь клиент-серверную архитектуру. Для большинства обычных ЭБ в качестве клиента используется стандартный браузер, а сама ЭБ поддерживается стандартным интернет-сервером.
Основные функции ПО для развитой ЭБ могут быть сформулированы следующим образом:
- достижение интероперабельности разнородных информационных ресурсов в рамках ЭБ;
- обеспечение создания, поддержки и выбора баз данных, интерфейсов, структур данных и сервисов, обеспечивающих наилучший поиск и актуализацию данных в разнородных коллекциях электронных документов;
- участие в формировании и эксплуатации корпоративных информационных ресурсов;
- обеспечение защиты и авторизованного доступа к информации со статистикой о времени, проведенном пользователем в ЭБ и использованных документах;
- возможности передачи одного запроса пользователя одновременно в несколько коллекций, составляющих ЭБ, и обработки ответов от нескольких источников;
- визуализация информации, полученной в ответ на запрос, в формате, выбираемом пользователем из списка возможных;
- наличие лицензионных соглашений на ПО;
- учет при функционировании принятых стандартов представления, хранения и передачи информации;
- обеспечение адекватного использования выбранных или разработанных в рамках проекта метаданных;
- возможность автоматизированного расчета с пользователями, владельцами и авторами электронных ресурсов;
- минимальные требования к программному обеспечению рабочего места клиента (стандартное программное обеспечение клиента);
- независимость функционирования ЭБ от платформы на стороне клиента и независимость от используемой СУБД;
- возможность увеличения количества типов данных и подключаемых электронных коллекций;
- поддержка распределенных систем хранения информации;
- возможность обработки многоязычной текстовой информации с использованием оригинальной графики документов и метаданных; использование имСООЕ.
Общесистемные требования к взаимодействию ЭБ с другими проектами. Электронные библиотеки, создаваемые в государственных учреждениях, должны рассматриваться как часть национального информационного ресурса и разрабатываться в тесной связи с другими федеральными проектами создания электронных библиотек. Организационные механизмы для решения практических вопросов координации создания электронных библиотек находятся в центре внимания Российской ассоциации электронных библиотек (Некоммерческое партнерство «Электронные библиотеки» — НП ЭЛБИ). Например, для членов НП ЭЛБИ разработан конкретный порядок взаимодействия при формировании фондов ЭБ, опубликованный на сайте млллл/.еИЬгаги. Предполагается создать систему методических пособий, включающую и вопросы взаимодействия электронных библиотек и коллекций.
Для ЭБ, создаваемых в библиотечном сообществе, весьма популярным техническим решением является работа по протоколу г39.50. Протокол г39.50 определяет форматы и процедуры, управляющие обменом сообщениями между клиентом и сервером: позволяет клиенту посылать на сервер запрос на поиск в базе данных с тем, чтобы отобрать записи, удовлетворяющие указанным критериям, и переслать клиенту некоторые или все отобранные им записи. Официальная версия протокола представлена по адресу на сайте Агентства поддержки 239.50.
Для организации работ по этому протоколу в ЭБ должен быть установлен специальный сервер г39.50. Взаимодействие ЭБ с внешними ресурсами означает, что она должна обеспечивать возможности формирования поисковых запросов к внешним электронным каталогам и обработки поисковых запросов, пришедших из внешних систем, поддерживающих работу по протоколу 239.50.
ЭБ обязана обеспечить возможность импорта и экспорта библиографической записи из файла в формате 1БО 2709 и ХМ1_-фай- ла. Импорт библиографических записей должен осуществляться с одновременным добавлением электронных документов в фонд ЭБ.
В библиотечном сообществе наиболее популярными форматами библиографического описания являются РиЭМАРС и МАРС21. Поэтому желательно, чтобы ЭБ имела возможность настройки правил преобразования библиографических записей из формата РиЗМАЯС в формат МАВС21 и обратно. Однако в последние годы среди создателей ЭБ, особенно вне библиотечного сообщества, популярность получают и более простые форматы, прежде всего Дублинское ядро метаданных, форматы 1_ОМ, МООБ, СЕЯ1Р и некоторые другие. Кроме того, многие ЭБ работают с использованием собственных форматов. Поэтому ЭБ, проектируемая с учетом взаимодействия с другими ресурсами, должна учитывать возможность обмена с системами, использующими другие форматы метаданных. Наиболее универсальным способом обмена метаданными является использование RDF — схем на языке XML.
Источник