Российский опыт работы в европейской системе EROS,
необходимость использования совместимых стандартов и форматов
Начало сотрудничества ГИМа и научно-исследовательского центра музеев Франции C2RMF датируется 1994 годом – временем присоединения музея к работе в рамках проекта NARCISSE.
Спустя 10 лет на основе результатов проекта C2RMF создает систему EROS.
В 2003 году ГИМ русифицирует структуру и сценарий БД «EROS», интегрирует в нее русские словари-тезаурусы.
EROS
В настоящее время в режиме online доступны оцифрованные изображения более 300 000 фотографий и рентгеновских снимков, 10 000 технических отчетов, 500 трехмерных объектов, 200 000 количественных анализов, относящихся к 56 000 произведений искусства.
Система включает в себя:
• многоязычные словари индексации
• научно-исследовательские отчеты
• оцифрованную реставрационную документацию
• данные количественных анализов
• спектральные характеристики, диаграммы, химические формулы
• фотографии, сделанные в УФ, ИК лучах, при боковом свете…
• отсканированные изображения, полученные с помощью электронного микроскопа.
База данных содержит информацию административного характера: учетную, о движении фондов, реставрационную, осмотров коллекций.
Новые технические возможности системы:
• автоматическое распознавание изображений
• показ географического местонахождения объекта
• панорамный просмотр объекта
• работа с многоспектральным изображением сверхвысокого разрешения
• реконструкция трехмерных моделей
Система EROS –полностью открытый ресурс, который можно получить по общедоступной лицензии GPL. Система основывается на лидирующем в своей отрасли бесплатном программном обеспечении, куда входят Linux, Apache, MySQL, PHP. Веб-доступ осуществляется с помощью Firefox.
Для формирования запроса можно воспользоваться несколькими настройками: язык, предметная область, количество результатов и пр.
Тезаурус системы организован в виде набора иерархических словарей, переведенных (или находящихся в процессе перевода) на французский, итальянский, английский, русский, японский, португальский, арабский, греческий и китайский языки. Информация внутри базы хранится в независимом от языка формате, под короткими кодами. В момент вывода на экран результатов поиска информация переводится на нужный язык. Возможности тезауруса позволяют работать как со всей иерархической лексикой, так и с синонимами и, благодаря кодировке Unicode (UTF-8), полными наборами знаков алфавитов - русского, арабского, японского и китайского. Дефиниции к словарным единицам из словарей индексации доступны в режиме on line на разных языках.
Для ввода новой информации или внесения изменений в базу данных пользователь должен иметь права на ввод (или изменение) информации и пароль для регистрации. Права на ввод регламентированы в соответствии с категорией пользователя (администратор, менеджер или пользователь) и в соответствии с категорией метаданных (предметы, изображения, документы или анализы).
Русификация EROS
В 2003 году русифицирована структура описания и сценарий базы данных.
Из 35 словарей системы 30 переведены полностью, 4 новых словаря требуют перевода, словарь «авторы» (около 5 000 имен) находится в работе
Полностью переведены названия картин Айвазовского, Боровиковского, Боттичелли, Ватто, Веррокио, Гончаровой, Кандинского, Коро, Ларионова, Латура, Леонардо, Писсарро, Рафаэля, Шагала, Щедрина Сильвестра.
Большую помощь в переводе имен авторов и названий произведений искусства оказывают средства, предоставляемые самой системой:
• вывод на словарный экран всех имеющихся в базе переводов словарной единицы.
• разнообразные форматы вывода результатов на экран: «нормальный» (возможность рассмотреть изображение и ознакомиться с информацией), HTML (быстрый доступ к кодам), временная шкала (творчество художника в его хронологическом развитии).
Системой разработан географический формат вывода результатов на экран, позволяющий изучать результаты в зависимости от того, где были созданы, найдены или хранятся музейные предметы
Использование Интернета:
а) словарь института Гетти «ULAN», который дает сведения относительно национальности художника и, следовательно, руководство к тому, правила чтения какого языка следует использовать при записи имени на русский язык;
б) поисковые машины Yandex, Google и т.п. помогают проверить правильность записи имени на русском языке;
с) при работе с названиями произведений искусства широко используется автоматический словарь Мультитран - система для переводчиков с русского, английского, немецкого, французского, испанского и нидерландского языка.
Использование совместимых стандартов и форматов в корпоративной сети EROS – необходимое условие развития системы
В настоящее время информационные технологии позволяют осуществлять исследования в международном масштабе. Вокруг EROS возникла корпоративная сеть, целью которой является дальнейшее развитие системы. Для содействия развитию системы особенно важным становится использование совместимых стандартов и форматов, куда относятся:
• стандарты изображения (качество и компрессия)
• цветовая настройка (калибровка, отображение не входящих в CMYK цветов, цветовые трансформации)
• защита системы архивизации (маркировка водяными знаками, ограничение доступа к данным),
• системы управления компьютерами и приложения
• форматы языкового обмена
• многоязычные словари для индексации и т.д.
Сноски: Библиография
1.C.Lahanier, G. Aitken, J. Shindo, R. Pillay, K. Martinez, P. Lewis, EROS : an open source, multilingual research system for image content retrieval dedicated to conservation-restoration exchange between cultural institutions, ICOM-CC 13th Triennial Meeting, Rio de Janeiro, 22-27 September 2002 vol 1, pp. 287-294
2. CD ROM NARCISSE. Glossaire multilangue - Lisboa, 1993
3. Christian Lahanier, Geneviève Aitken et Ruven Pillay, EROS : European Research Open System, ICHIM2003 Congres 10-12 September 2003, Paris
4. Geneviève Aitken et Christian Lahanier, La base EROS, source de connaissance multilingue, actes du Symposium Diderot, "cartographier la connaissance", Langres, 14 au 17 avril 2003
5. NARCISSE. Systeme documentaire des peintures et enluminures - Lisboa, 1993
6. R. Pillay, D. Pitzalis, C. Lahanier and G. Aitken, EROS: New developments in digital archiving for research in conservation. - http://merovingio.c2rmf.cnrs.fr
7. Кузьмина Е.С., Мееров К.А., Многоязычный доступ к информации: NARCISSE ---> EROS – международная конференция «Румянцевские чтения 2004», РГБ, Москва, апрель 13-15, 2004, www.rsl.ru.
8. Кузьмина Е.С., Веб-сайты российских музеев и проблема многоязычного доступа к информационным ресурсам в Европейской сети культурного наследия – международная конференция «EVA 2004 Москва», ГТГ, 30 ноября 2004 г.
|