Przejdź do głównej treści

Widok zawartości stron Widok zawartości stron

Pomiń baner

Widok zawartości stron Widok zawartości stron

ARCARIUM

Arcarium (ARC) będzie systemem informatycznym składającym się z bazy wiedzy i towarzyszących jej interfejsów ułatwiających szeroki zakres badań nad rękopisami: historycznych, filologicznych, amatorskich itp.

Głównym zadaniem bazy wiedzy będzie gromadzenie informacji wyekstrahowanych z metadanych obiektów opisywanych w ramach Projektu – dokumentów należących do Zbioru *Sammlung Autographa*. Baza wiedzy zostanie zbudowana przy użyciu technologii grafów wiedzy. Różne jednostki informacji - takie jak nazwiska, instytucje, lokalizacje geograficzne, tytuły dokumentów, daty i tak dalej - zostaną zintegrowane w ustrukturyzowaną sieć powiązaną ze sobą różnorodnymi relacjami (np. bycia autorem dokumentu, bycia nadawcą lub odbiorcą listu, wzmiankowania o czymś, korespondowania z kimś). Cały graf będzie oparty na dedykowanym modelu formalnym (The Arcarium Ontology; TAO). Poszczególne dokumenty Zbioru będą miały swoją złożoną reprezentację w bazie, która uwzględniać będzie zarówno dokumenty jako całości, jak i ich składowe, tj. karty i strony. Każda strona będzie powiązana z linkiem do jej fotokopii udostępnianej na serwerach Biblioteki Jagiellońskiej.

Ze względu na to, że wiele z opisywanych w ramach Projektu obiektów – dokumentów, osób, miejscowości, instytucji – ma już swoje reprezentacje w istniejących ogólnodostępnych światowych bazach wiedzy, takich jak Wikidata i Geonames (oraz innych zbiorach Linked Open Data), tworzenie ARC zakłada jego ścisłą integrację z tymi zewnętrznymi zasobami. Duży nacisk zostanie położony przede wszystkim na standardy wykorzystywane w zarządzanym przez Staatsbibliothek zu Berlin zunifikowanym katalogu manuskryptów i publikacji Kalliope oraz ogólnoeuropejskiej bazie obiektów dziedzictwa kulturowego Europeana.

Interfejs projektowanej bazy wiedzy umożliwi wygodne wyszukiwanie informacji i przeglądanie fotokopii samych dokumentów. Wykorzystując tak zbudowany graf wiedzy, system ARC będzie ponadto oferował moduły bazujące na metodach i algorytmach sztucznej inteligencji ułatwiające specjalistyczne badania w obszarze humanistyki cyfrowej, takie jak zaawansowane wizualizacje zebranych danych, rekonstrukcja historii dokumentów na podstawie informacji o proweniencji dokumentów, rekonstrukcja sieci powiązań pomiędzy osobami, instytucjami, miejscami i dokumentami, (pół-)automatyczne metody ulepszania wiedzy oparte o zanurzenia grafów w przestrzeni wektorowej, automatyczne rozpoznawanie pisma odręcznego, analiza wizualna i tworzenie semantycznych adnotacji dokumentów nie zawierających tekstu (rysunków, nut, itd.). Co więcej, otwarta struktura ARC umożliwi jego dalszą rozbudowę lub korektę przez wspólnotę badaczy. Baza umożliwi również reprezentowanie wielogłosu uczonych w pewnych kwestiach spornych: możliwe będzie modelowanie wielu alternatywnych powiązań między jednostkami tworzącymi bazę wiedzy.