Многие библиотеки оцифровывают музыкальные партитуры, хранящиеся в их фондах. Но исследователи все еще не могут пользоваться преимуществами онлайн-доступа к этим источникам. Почему?
Я распознаю эту мелодию с пяти нот. Или нет
Первое препятствие — недостаточная точность технологии оптического распознавания музыкальных знаков (OMR) по сравнению с другими символами (OCR). В результате музыкальные партитуры, оцифрованные библиотеками, доступны только в виде изображений, без возможности поиска по содержимому.
Коллекции кодированных партитур — такие, как Josquin Research Project или MuseData — состоят из нотных текстов, набранных вручную. Это занимает много времени, поэтому коллекции упомянутых сайтов невелики по объему. Исследователям, которым хотелось бы применять компьютерные методы музыкального анализа, приходится либо пользоваться существующими коллекциями, либо набирать произведения вручную.
Еще одна проблема — формат кодирования. Инициатива кодирования музыки (MEI) — молодой проект по сравнению с аналогичным для текста (TEI). Отсутствие унифицированной системы кодирования тормозит развитие компьютерного музыкального анализа.
Семь бед, один стандарт
На преодоление этих проблем направлен проект «Единый интерфейс для поиска и анализа музыкальных партитур» (SIMSSA). Его сотрудники работают над улучшением технологии OMR, построением инфраструктуры для обработки музыкальных документов с целью создания обширной коллекции кодированных партитур и разработкой интерфейса с инструментами для поиска и анализа документов этой коллекции. Чтобы проект заработал, библиотекам необходимо оцифровывать свои фонды в соответствии со стандартами SIMSSA. Чтобы понять, какие обстоятельства могут помешать принятию стандартов SIMSSA, было проведено интервьюирование сотрудников библиотек. Библиотекарей спрашивали о сложностях при оцифровке нотных фондов.
Опрос показал, что cамая большая проблема — недостаток средств. Оцифровка — это дорого. Она отнимет массу ресурсов — в частности, рабочего времени сотрудников. Необходимо подготовить, обработать и отсканировать документы, проверить качество сканов, заполнить метаданные вручную, а затем еще и организовать доступ к коллекциям через сайт или поисковый интерфейс.
Опрос проводился в виде глубинных полуструктурированных интервью с сотрудниками библиотек. Было разработано два набора вопросов: для тех библиотек, где уже есть опыт завершенного проекта по оцифровке и для тех, кто только планирует такой проект. Данные опроса были обработаны программой качественного анализа данных QDA Miner. Наиболее частые проблемы, упоминаемые респондентами, были такими:
- Слишком краткосрочное финансирование;
- Отсутствие планирования;
- Отсутствие понимания конечного результата (в каком виде, на каком ресурсе будут опубликованы документы);
- Сложность создания метаданных (потребность в более подробных данных, чем традиционные MARC-записи, используемые в библиотечных каталогах);
- Отсутствие квалифицированного персонала;
- Недостаток технических специалистов, обладающих также и знаниями в области музыковедения;
- Плохо налаженная коммуникация библиотекарей с исследователями;
- Проблемы с использованием технологии OMR, недостаточная осведомленность сотрудников библиотек о возможностях этой технологии.
Важным открытием стало то, что никто из респондентов не использовал в своей работе технологию OMR. Также музыкальные исследователи почти не принимают участия в планировании проектов по оцифровке нотных фондов библиотек. Участники опроса считают целью проектов по оцифровке популяризацию своих библиотек и научных организаций, а не формирование и поддержание связей с музыкальными исследователями. Зато копирайт оказался не такой серьезной проблемой: значительная часть музыкальных фондов находится в общественном достоянии.
Что делать?
Многие респонденты считают, что библиотеки могут и должны играть более важную роль в создании ресурсов и инструментов для компьютерных исследований. Это требует тесного сотрудничества между исследователями и сотрудниками библиотек. Пока исследователям приходится самим создавать корпуса из набранных вручную нотных партитур, а также собственные инструменты для их анализа. Библиотекари могли бы облегчить эту часть работы, освоив технологию OMR.
Библиотеки обладают инфраструктурой и компетенциями для обеспечения долгосрочного доступа к корпусам музыки. — Исследователи если и могут получить финансирование на создание корпуса, почти никогда не обладают средствами для его долгосрочной поддержки. Еще библиотеки могут быть полезны при создании метаданных и пользовательских интерфейсов.
Библиотеки выиграют от такого сотрудничества. В эпоху, когда все больше информационных ресурсов находятся в интернете, встает вопрос о необходимости библиотек в принципе. Но библиотеки могут стать местом, где ученые будут пробовать новые методы и технологии. Это подразумевает значительные изменения, но такая деятельность согласуется с ценностями библиотечной профессии.
Источники
Audrey Laplante, Ichiro Fujinaga. Digitizing musical scores: Challenges and opportunities for libraries. 2016
The Josquin Research Project
MuseData
MEI
SIMSSA