Cyfrowe repozytorium

Jednym z głównych celów projektu Polska muzyka tradycyjna – dziedzictwo fonograficzne. Stan aktualny, zachowanie, udostępnianie jest tworzenie, rozwój i utrzymanie centralnego cyfrowego repozytorium (etnofon.ispan.pl) zdigitalizowanych i opracowanych merytorycznie dokumentalnych nagrań fonograficznych i filmowych, w których utrwalono polską pieśń i muzykę tradycyjną a także taniec ludowy.

Repozytorium – zasadniczy efekt projektu Polska muzyka tradycyjna – dziedzictwo fonograficzne jest przestrzenią, w której gromadzone są cyfrowe odwzorowania treści utrwalonych pierwotnie na historycznych nośnikach dźwięku i obrazu jak również współcześnie tworzone obiekty born digital. Otrzymane w procesie digitalizacji obiekty cyfrowe (kopie wzorcowe) są archiwizowane zaś tzw. kopie użytkowe są demonstrowane i udostępniane użytkownikom: przede wszystkim naukowcom (etnomuzykologom a także badaczom innych dziedzin, zwłaszcza humanistyki) i innym zainteresowanym poprzez stworzoną w ramach projektu aplikację, dedykowaną zasobowi etno-fonograficznemu i etno-filmowemu agregowanemu w repozytorium.

Digitalizacja

Archiwalia oryginalne poddawane są badaniu i konserwacji zaś proces digitalizacji poprzedzają analizy i wypracowanie optymalnego modelu zarówno odczytu źródła jak i stworzenia oraz utrwalenia i administracji jego odwzorowania cyfrowego. Po procesie cyfryzacji, obejmującym – wg holistycznej koncepcji autora projektu – także digitalizację wszelkich nie-audialnych obiektów związanych ze źródłem i wszelkich metadanych archiwalia są zabezpieczane i magazynowane w odpowiednich warunkach by mogły nadal służyć jako wzorce zapisanej informacji analogowej.
Digitalizacja obiektów dziedzictwa kulturowego jest potocznie rozumiana jako proces tworzenia cyfrowych kopii (odwzorowań, duplikatów) tych obiektów. Głównym celem digitalizacji jest przede wszystkim dystrybucja (udostępnianie) kopii oraz ich długotrwałe (wieczyste) przechowywanie, będące formą zabezpieczenia (a raczej zaoszczędzenia) dóbr kultury dla przyszłych pokoleń, przy czym należy podkreślić, iż zabezpieczeniu podlegają tu nie tylko odwzorowania, ale przede wszystkim oryginalne obiekty w formie analogowej. Przez termin „digitalizacja” należy zatem rozumieć sytuację, w której sporządza się kopie cyfrowe w postaci wysokiej jakości plików komputerowych, przechowywanych następnie w tzw. pamięci masowej. Procesu digitalizacji nie należy mylić ani utożsamiać jako procesu równoczesnego z rekonstrukcją dźwięku ani również z archiwizacją czy konserwacją fonogramu. Sporządzanie kopii cyfrowych na indywidualnych egzemplarzach w takiej postaci, że fonogramy z nośników analogowych kopiuje się na płyty CD-R, nie powinno być utożsamiane z digitalizacją, podobnie jak kopiowanie nagrań do postaci plików zredukowanej jakości (np. popularny format MP3). Przeniesienie danych (nagrań dźwiękowych) oraz tzw. metadanych, tzn. istotnych informacji o obiektach digitalizowanych (zapisanych również na nośnikach analogowych lub w dokumentacji tradycyjnej w postaci np. protokołów, list utworów, fiszek katalogowych, inskrypcji itp.) do postaci zapisu cyfrowego (pliku, katalogu komputerowego, bazy danych) jest obecnie najbardziej popularnym sposobem duplikowania zbiorów archiwalnych, o czym świadczy także praktyka wielu archiwów dźwiękowych na całym świecie. Proces digitalizacji pozwala również, bez nadmiernej eksploatacji nagrań oryginalnych, na upowszechnienie kopii cyfrowych zbiorów i dokumentacji oraz stwarza możliwość łatwego i szybkiego dostępu do informacji.

W 2004 r. Instytut Sztuki PAN, jako pionierska humanistyczna placówka naukowo-badawcza, zainicjował systematyczną digitalizację własnej, najstarszej i największej kolekcji dokumentalnych nagrań dźwiękowych polskiej muzyki tradycyjnej. Równocześnie, przy użyciu nowoczesnych metod, rozpoczęto także udostępnianie zasobów archiwalnych do badań. Istotnymi czynnikami, które wpłynęły na decyzję rozpoczęcia cyfryzacji dziedzictwa etno-fonograficznego była z jednej strony troska o nagrania archiwalne, z drugiej: możliwość wykorzystania  unikatowego, coraz trudniej dostępnego i coraz droższego, zarówno w cenie rynkowej jak i serwisowej, odpowiedniego sprzętu do odtwarzania nagrań historycznych. Przy użyciu wypracowanej metody, w ramach poszczególnych etapów strategicznego i wieloetapowego projektu Polska muzyka tradycyjna – dziedzictwo fonograficzne. Stan aktualny, zachowanie, udostępnianie dokonano digitalizacji, opracowania merytorycznego i archiwizacji części Zbiorów Fonograficznych Instytutu Sztuki PAN, a także, w ramach postępu prac zidentyfikowano, zdigitalizowano i opracowano nagrania pochodzące z kilkunastu innych placówek naukowych, muzealnych, kulturalnych i in. Zdigitalizowane nagrania wraz z metadanymi dostępne są w specjalnie zaprojektowanym i zbudowanym dla etnomuzycznych Zbiorów Fonograficznych systemie – centralnego repozytorium cyfrowego dokumentalnych nagrań fonograficznych i filmowych, w których utrwalono polską pieśń i muzykę tradycyjną, a także taniec ludowy (etnofon.ispan.pl). 

System: cyfrowe repozytorium i dedykowane aplikacje

Tworzenie, rozwój i utrzymanie centralnego repozytorium cyfrowego zdigitalizowanych i opracowanych dokumentalnych nagrań fonograficznych i filmowych jest jednym z głównych celów projektu Polska muzyka tradycyjna – dziedzictwo fonograficzne, realizowanym w Zbiorach Fonograficznych od 2014 roku.

Repozytorium jest przestrzenią, w której gromadzone są cyfrowe odwzorowania treści utrwalonych pierwotnie na historycznych nośnikach dźwięku i obrazu. Jego zasób jest systematycznie powiększany także o obiekty born digital. Wytworzone w procesie digitalizacji obiekty cyfrowe zostają zabezpieczone jako kopie wzorcowe, natomiast tzw. kopie użytkowe są demonstrowane i udostępniane badaczom i zainteresowanym poprzez stworzone w ramach projektu aplikacje, dedykowane ogólnopolskiemu zasobowi etno-fonograficznemu i etno-filmowemu, agregowanemu w repozytorium. Repozytorium, wraz z aplikacjami i bazą danych, tworzy system służący: 

►naukowemu opracowywaniu obiektów i metadanych wytworzonych i powiązanych wg holistycznej koncepcji digitalizacji i archiwizacji. Takie podejście, stworzone i wdrożone przez autora projektu zakłada cyfryzację i powiązanie wszelkich obiektów, danych i procesów związanych z nagraniem (źródłem audialnym) i jego odtworzeniem np. wszelkiej dokumentacji pisanej, odwzorowań graficznych obiektów i in.; nie tylko treść nagrania, lecz także sam nośnik i towarzysząca mu, zwykle w postaci rękopisów, dokumentacja są tu równowartościowymi obiektami archiwalnymi, zawierającymi wiele informacji (metadanych) o kontekście powstania nagrań;
►udostępnianiu zasobu badaczom;
►zarządzaniu i administrowaniu obiektami i danymi.

Obecnie w repozytorium znajduje się ok. 100 000 zdigitalizowanych archiwalnych nagrań pieśni
i melodii. Zważywszy, iż zasób nagrań analogowych samych tylko Zbiorów Fonograficznych szacowany jest na ok. 150 tysięcy nagrań, można uznać, iż projekt jest w fazie rozwojowej. 

Dostęp do zasobu obiektów i treści odbywa się poprzez dwie aplikacje dedykowane tym zbiorom. W 2017 r., po etapie badań i analiz obiektów, danych i procesów, został zaprojektowany system służący do opracowywania i eksplorowania zasobów etnofonograficznych.

We wstępnym etapie projektu i podczas prac nad architekturą systemu wykorzystano dotychczasowe doświadczenia zespołu Zbiorów Fonograficznych, oparte o pracę na różnych aplikacjach. Jesienią 2018 r., początkowo tylko jako środowisko testowe dla pracowników Zbiorów Fonograficznych ISPAN, system został wdrożony i oddany do użytku.

Prace koncepcyjne nad repozytorium i aplikacjami, od lewej: dr Jacek Jackowski, mgr inż. Aleksander Hajzik, dr Hubert Klekowicz

System i omawiany projekt zostały zaprezentowane i poddane dyskusji i ocenie podczas licznych konferencji etnomuzykologicznych oraz w środowisku bibliotekarzy muzycznych odpowiedzialnych za fonoteki a także specjalistów w dziedzinie inżynierii i reżyserii dźwięku.

System został zbudowany z myślą o wsparciu szeroko rozumianego obszaru przetwarzania informacji o zdigitalizowanych nagraniach muzycznego dorobku kulturowego w zakresie polskiej pieśni i muzyki ludowej. Przetwarzanie to obejmuje dwa obszary: edytora i użytkownika; dotyczy zatem zarówno administracji informacjami, a więc możliwość wprowadzania i modyfikacji danych, jak również ich eksplorację i udostępnianie w sposób kontrolowany i zapewniający zachowanie poufności określonych danych przechowywanych w systemie. W repozytorium przechowywane są obiekty (nie tylko dźwiękowe) wraz ze wszelkimi metadanymi je opisującymi. Zakres informacji przechowywanych w systemie jest zatem bardzo szeroki a problem deskrypcji dokumentu etnofonograficznego jest istotnym założeniem i celem działań realizowanych w ramach projektu. Sfera deskrypcji obejmuje m.in.:

► opisy i odwzorowania obiektów: pieśni, melodii, nagrań muzycznych, wizualnych i audiowizualnych, nośników oraz obiektów graficznych (transkrypcji tekstowych, nutowych, protokołów, fiszek, fotografii wykonawców, instrumentów etc.);
► biogramy i charakterystyki wykonawców;
►opisy okoliczności utrwalania wykonywanych przez artystów utworów;
►zapis wykonanych czynności, związanych z pracą archiwizacyjną i procesem digitalizacji informacji dostępnych na tradycyjnych nośnikach danych (nośnikach analogowych i zapisach w wersji papierowej).

Ten szeroki katalog informacji podzielony został na rejestry obejmujące swoim zakresem merytoryczne obszary np. informacji o artystach, nośnikach danych, utworach, nagraniach itd.

Zdefiniowany został złożony zbiór relacji pomiędzy obiektami poszczególnych rejestrów, umożliwiający odzwierciedlenie złożonych zależności pomiędzy nimi, a wszystko po to, aby jak najwierniej odwzorować faktyczne zależności i móc szybko a zarazem precyzyjnie wyszukiwać potrzebne informacje.

Każdy z rejestrów jest zbiorem jednorodnych obiektów opisanych przez zestaw pojedynczych atrybutów. Aktualnie opracowano ponad 100 kategorii opisowych – atrybutów. Część z tych atrybutów jest zesłownikowana. Praca nad słownikami i listami jednoznacznie sformułowanych danych jest nadal kontynuowana, podobnie jak prace nad redakcją danych i ich waloryzacją. System zintegrowany jest z repozytorium plików audiowizualnych i umożliwia prezentowanie tych zasobów, odtwarzając je użytkownikowi bezpośrednio w systemie. Unikatową funkcjonalnością, zaprojektowaną na podstawie analiz wyszukiwań użytkowników systemu jest mechanizm raportów, który pozwala na generowanie bogatych zestawów informacji w oparciu o bardzo złożone kryteria wyszukiwania, które mogą być konfigurowane przez użytkowników nie znających technicznych zapytań do bazy danych. Korzystanie z tych kryteriów wyszukiwania możliwe jest za pomocą dedykowanego interfejsu, pozwalającego na budowanie praktycznie dowolnie zagnieżdżonych warunków wyszukiwania opartych na filtrach zbudowanych na dowolnym z atrybutów. Efektywność wyszukiwań zależy przede wszystkim od jakości przechowywanych w systemie danych, dlatego nadrzędnym celem kontynuacji projektu Polska muzyka tradycyjna – dziedzictwo fonograficzne jest – obok wzbogacania repozytorium o nowe obiekty i dane – praca nad redakcją i waloryzacją ogromnej ilości już istniejących danych o najstarszych nagraniach polskiej muzyki tradycyjnej.