Опыт интеграции музейных данных с глобальными базами знаний в среде Web
В докладе описываются цели и результаты проекта Open Kunstkamera Data (OKD), выполненного совместно с Музеем антропологии и этнографии имени Петра Великого (Кунсткамера) РАН и компанией КАМИС. Цель проекта OKD состояла в том, чтобы представить данные каталога МАЭ РАН в открытом и стандартизированном виде в среде Web. Задача заключалась в том, чтобы построить хранилище данных, которое соответствует рекомендациям международного совета музеев и стандартам среды Web. В хранилище представлены взаимосвязанные данные о предметах, персоналиях, событиях создания и сбора этнографических материалов, датах и т.п.
Ключевой особенностью хранилища является то, что данные каталога МАЭ РАН переведены в машиннопонятную форму, а смысл каждого музейного описания выражен в явном виде с помощью онтологии CIDOC CRM [1], разработанной Комитетом по документации международного совета музеев (ICOM).
Созданное хранилище данных тесно интегрировано с интернет-каталогом, построенным на базе системы КАМИС, который доступен на сайте музея (www.kunstkamera.ru). Каждое описание в хранилище имеет ссылку на соответствующее описание из интернет-каталога. Для поддержки актуальности хранилища данных выполняются регулярные обновления и синхронизация с базой данных КАМИС. Определены связи музейных предметов из каталога МАЭ РАН с внешними базами знаний, такими как Википедия и Geonames [2].
Построенное хранилище уже сейчас позволяет реализовывать новые сервисы и решать новые задачи. Прототип геоинформационного сервиса позволяет отображать на глобальной карте как совокупности сущностей из каталога, например, места сбора материалов, так и отдельные предметы. Глобальные координаты получены посредством связывания музейных справочников с внешней базой географических названий Geonames.
Прототип энциклопедического сервиса позволяет переходить от описания предмета к связанным по смыслу статьям из онлайновой энциклопедии Википедия. При этом выполняется не поиск статьи по ключевым словам, а прямой переход по релевантной ссылке, что позволяет избавиться от информационного шума.
Для поддержки выполнения сложных запросов к хранилищу открыта точка доступа по протоколу SPARQL [3]. Следствием чего стало включение каталога МАЭ РАН в среду Linked Data [4] — общемировое распределенное хранилище взаимосвязанных знаний.
Сноски: 1. http://cidoc.ics.forth.gr/
2. http://geonames.org
3. http://www.w3.org/TR/rdf-sparql-query/
4. http://linkeddata.org/
|