Электронная коллекция казанских газет конца XIX – начала XX вв: проблемы создания коллекции
Научная библиотека им. Н.И. Лобачевского обладает значительной коллекцией казанских газет и журналов конца XIX - начала XX вв. Представленные в ней издания отражают процесс развития русской периодической печати. В 118 периодических изданиях опубликованы десятки тысяч статей, информационных сообщений, различных статистических данных, которые представляют огромный интерес для современного историка, этнографа, филолога, краеведа и др.
В связи с вышеизложенным, приоритетным направлением в создании электронной библиотеки КГУ (ЭБ КГУ) является создание коллекций электронных документов на основе коллекции периодической печати конца XIX – начала XX вв.
Метод формирования коллекции периодической печати – сканирование имеющихся в библиотеке газет. Для удобства читателей полученное изображение газетного листа (как правило формата А2, а цензорские экземпляры имеют еще и дополнительные поля) уменьшается до размера примерно 750*750 точек, что позволяет отчетливо видеть заголовки статей и рекламные объявления. Оригинал изображения листа разрезается по газетным рубрикам, не более четверти газетного листа. Так же могут быть выделены отдельные, особо значимые статьи.
Наиболее удобным для читателя было бы предоставление функции полнотекстового поиска, но, к сожалению, распознавание газетного текста невозможно из-за плохого качества печати. В связи с этим необходимо организовать атрибутный поиск по коллекции с максимально широкими возможностями. Это достигается за счет расширения набора метаданных, то есть включения дополнительных метаданных, не входящих в стандартное библиографическое описание.
Структура описания коллекции периодической печати иерархическая:
- описание коллекции;
- описание разделов. Разделом данной коллекции является отдельная газета;
- описание конкретных номеров газет;
- описание рубрик, статей номера.
Описание каждой части имеет свой набор метаданных, состоящий, в общем случае, из двух частей – общепринятое библиографическое описание и индивидуальное описание. Индивидуальная часть содержит метаданные ориентированные на расширение возможностей поиска, включающие дополнительную, не традиционную информацию о документе, ссылки на дополнительные материалы и т.д. Она может содержать научное описание, составленное на основе многоаспектного исследования документа и включающее в себя: внешнее описание материала, описание содержания, описание изобразительного материала и т.п.
Дополнительно в электронном каталоге Научной библиотеки КГУ создается библиографическое описание газет, содержащее ссылку на описание раздела коллекции. Такой подход дает возможность обращения к коллекции и через электронный каталог библиотеки.
Для представления метаданных в структурированном виде был выбран язык XML (eXtensible Markup Language) по следующим причинам:
- широкое распространение языка XML при разработке Интернет - приложений, опора на XML и RDF (Resource Description Framework) в создании Semantic Web;
- отсутствие ограничений при определении наборов метаданных, широкие возможности структурирования метаданных;
- возможность осуществлять семантический поиск информационных ресурсов;
- возможность интеграции с другими электронными библиотеками, как на национальном, так и на международном уровнях.
Доступ к коллекции осуществляется по HTTP протоколу с использованием программного обеспечения собственной разработки.
Работы по формированию коллекции периодической печати конца XIX – начала XX вв. ведутся по гранту Российского гуманитарного научного фонда «Создание электронной коллекции периодической печати 19-20 вв.»
|