АДИТ-2007. Тезисы доклада
Тема: "Современные информационные технологии и сверка музейных коллекций"
Иванов В.В.
  Казань
  Казанский государственный университет
  E-mail: vivanov@ksu.ru

Подход к интеграции разнородных описаний музейных предметов

Начиная с 2005 года, в КГУ совместно с НИВЦ МГУ ведется работа по созданию информационной системы для доступа к культурному наследию России с использованием лингвистических ресурсов: тезаурусов и онтологий. На настоящий момент русифицирована существенная часть крупного тезауруса AAT (Art and Architecture Thesaurus. Second Edition. Toni Petersen, Director. New York: Oxford University Press, 1994. 5 vols. URL: http://www.getty.edu/research/conducting_research/vocabularies/aat/), а также подготовлен русскоязычный вариант онтологии CIDOC CRM. Эти два ресурса, связанные вместе, образуют ядро системы интеграции разнородных музейных описаний. В докладе описывается круг задач, решаемых с помощью объединенного ресурса, приводятся результаты экспериментов, проведенных на данных музеев России.

В настоящее время в музеях России используется множество разнообразных моделей данных для описания музейных предметов, ни одна из которых не является официально утвержденным стандартом. Наиболее широко применяются на практике следующие модели:

- стандарт краткого описания музейного предмета (12 полей);
- паспорт научного описания предмета, разработанный РЭМ (около 30 полей);
- модель данных, используемая во Всероссийском реестре музеев (9 полей).

Каждая из этих моделей данных в отдельности может быть отображена на онтологию CIDOC CRM. Но их количество и разнородность требуют автоматизировать этот процесс. Для отображения разнородных схем на единую концептуальную модель в нашей системе используется формат представления межсхемных отображений, близкий к формату, предлагаемому CIDOC в (Kondylakis H., Doerr M., Plexousakis D. Mapping Language for Information Integration URL: http://cidoc.ics.forth.gr/docs/Mapping_TR385_December06.pdf).

CRM содержит 81 концепт (класс), которых явно недостаточно для полного описания текстового содержимого, представленного в той или иной исходной концептуальной модели (схеме). Для более полного покрытия текстовых значений необходимо использовать тезаурус данной предметной области. В качестве такого тезауруса был выбран AAT. На текущий момент переведены и адаптированы к российской культуре следующие фасеты тезауруса: МАТЕРИАЛЫ, ОБЪЕКТЫ. Общее число переведенных понятий около 10 тыс. Использование двуязычного тезауруса позволяет индексировать русскоязычные музейные описания, как русскими, так и английскими понятиями и обеспечивает двуязычный поиск в музейных коллекциях.

Тезаурус (RusAAT) может быть внедрен в существующие музейные информационные системы для решения практических задач:

- унификации терминологии музейных описаний
- поддержки процесса решения задачи ретроспективной конверсии (Noll L. Real and Virtual Art in Pushkinskiy - Digital imagery and presentation of cultural heritage of museums / URL: http://www.meta.se/cidoc06/uploads/_PAPERS_/full_text/NOL - Real and Virtual Art in Pushkinskiy.doc)

В ближайшее время планируется связывание тезауруса RusААТ с CRM. Параллельно разрабатывается программное средство для интеграции разнородных концептуальных схем с онтологией CRM, и проводятся эксперименты по индексированию с помощью RusAAT текстовых описаний более чем 10 тыс. музейных предметов из БД трех различных музеев.

 

 
  © АДИТ, 1997-2007