Osobní knihovny > Technologické řešení projektu

Technologické řešení projektu

Webová aplikace, v rámci níž je vytvořen redakční systém Hyperion, jenž byl upraven pro potřeby projektu, je postavena na platformě Java s využitím technologií J2EE, Jakarta Struts a XML. Řešení je založeno na aplikačním serveru JBoss ve spojení s osvědčenou a výkonnou relační databází PostgreSQL. Umožňuje klasifikaci obsahu (článků, obrazových dokumentů, článků, odkazů) z několika hledisek, možnost vícenásobného zařazení článku. Data lze vkládat pomocí této aplikace odkudkoli.

Redakční systém Hyperion je používán např. pro redakci webových stránek Ústavu informačních studií a knihovnictví FF UK v Praze, InfoScience Praha s.r.o. www.infoscience.cz, webových stránek Průvodce informacemi o vědě a výzkumu www.veda.cz.

 Aplikace „osobních knihoven" je umístěna na serveru firmy MathAn s.r.o., která zajišťuje také profesionální údržbu serveru, zálohování a dobrou konektivitu. Původně bylo plánováno přesunutí aplikace na server Jinonice, ukázalo se však, že obsah je příliš rozsáhlý, proto bude aplikace umístěna na stejném serveru i nadále.

Struktura obsahu digitální knihovny a uživatelského rozhraní byla vytvořena na základě potřeb pro spravování a zpřístupňování informací ze zkoumání osobních knihoven.

Pro každou ze zpřístupňovaných osobních knihoven byla vytvořena speciální sbírka, do níž jsou začleňovány soubory vytvořené digitálními kopiemi, popisem těchto kopií a původních svazků (v případě šesti hlavních knihoven).

Ke každé sbírce se pojí obsah článků týkajících se zpracování či rekonstrukce knihovny a charakteristiky knihovny. Statické texty uveřejněné na uživatelském rozhraní (O projektu, aktuality) jsou sdruženy mimo ostatní články. Samostatnou strukturu tvoří mapa dalších dochovaných knihoven.

Řešení metadatových formátů pro potřeby zpřístupňování a uchovávání dat z osobních knihoven použitá ve webové aplikaci

Po zvážení použití metadatového formátu Dublin Core byl pro potřeby popisu a komunikaci strukturovaných metadat společně s digitálním obsahem implementován kontejnerový formát METS (Metadata Encoding and Transmission Standard), který by měl zajistit konzistenci všech částí digitálních objektů a jejich snadnou komunikovatelnost v případě jejich sdílení nebo začlenění do širších aktivit zastřešujících zpřístupňování kulturního bohatství. 

Pro popisná metadata začleněná do struktury formátu METS byl použit formát MODS (Metadata Object Description Schema), který se ukázal jako dostatečně podrobný a proto vhodnější nežli formát Dublin Core.

Při tvorbě prvků administrativních, resp. technických metadat využili řešitelé projektu jako inspiraci doporučení obsahující sadu prvků, které byly vytvořeny pro potřeby partnerů participujících na obsahovém plnění systému Kramerius (dokument vytvořil pro tento účel Mgr.Jan Hutař).  Toto doporučení bylo ještě porovnáváno s dalšími prvky schématu PREMIS (Preservation Metadata), z něhož také samo vychází. Mezi výsledně stanovené prvky technických metadat byly  „zapouzdřeny" také prvky ze schématu MIX  (NISO Metadata for Images in XML Schéma/Technical Metadata for Digital Still Images Standard) , týkající se hardwaru, na němž byly digitální kopie vytvořeny a informace týkající se výšky a šířky digitální kopie. 

Pro prvky týkající se právních informací bylo použito schématu METS Rights a navíc i licence Creative Commons.

Při implementaci formátu MODS a METS a použití dalších schémat a formátů řešitelé postupovali podle pravidel, manuálů a příkladů implementací formátu METS na webových stránkách Library of Congress.

V systému byly naprogramovány funkce pro generování záznamů ve formátu METS. Po vyplnění dat o příslušném svazku osobní knihovny systém pomocí funkcí po zvolení typu exportu (METS) a zadání odpovídající ID objektu systém na základě těchto zadání  vygeneruje z dat ke svazku záznam ve formátu METS, který se nabídne k uložení jako xml soubor.

Dlouhodobá archivace digitálních dat a jejich případná komunikace přes OAI-PMH protokol je zajištěna díky spolupráci s Univerzitním digitálním repozitářem UK pro kvalifikační práce, který používá nástroj Digitool firmy ExLibris. Digitool umožňuje provést replikaci z formátu METS/MODS (dávka dat metadatových záznamů exportovaných z webové aplikace osobních knihoven ve formátech METS/MODS byla úspěšně testována pro sklízení dat v protokolu OAI-PHM). Proběhlo také testování konverze metadat z formátu MODS („zapouzdřeného" do formátu METS) do formátu Dublin Core, který systém Digitool umožňuje. V případě konkrétní potřeby konverze obsahu jednotlivých polí je možno OAI výstup konkrétního setu ještě upravit.

Záznamy ve formátu METS všech digitálních objektů ze šesti hlavních osobních knihoven byly exportovány z redakčního systému a importovány do digitálního repozitáře Univerzity Karlovy. Díky umístění v digitálním repozitáři Univerzity Karlovy je zajištěna dlouhodobá ochrana a uchování vytvořených digitálních kopií i jejich popisu a tedy také originálních individualizujících prvků pro případ, že by originály byly zničeny. Jako silný institucionální repozitář je repozitář UK schopen zajistit vývoj a využití nových vyvíjejících se technologií pro uchovávání digitálního obsahu i do budoucnosti.  

Pořízování digitálních kopií a jejich zpracování                   

Pořizování digitálních kopií probíhalo za pomoci přenosného skeneru Epson, Canon CanoScan CS4400F (místního HP Scanjet 5500c v případě skenování knihovny Z.Fibicha a místního skeneru CanoScan 5200F v případě K.H.Borovského) a digitálního fotoaparátu Canon EOS 400 (s výjimkou  6 případů, kdy byly skeny pořízeny institucí samotnou). Byly vytvořeny digitální kopie (ve formátu JPEG, v rozlišení 300 a 400 dpi, standardní JPEG komprese). Ve formátu JPG jsou kopie také zpřístupňovány uživatelům v rámci aplikace „Knihovny významných českých osobností". 

Z několika verzí kopií jednoho dokumentu byly vybrány nejkvalitnější kopie, které byly v případě nutnosti upraveny v programu Adobe Photoshop7 a Microsoft Office Picture Manager.

Metadatový popis

Pro popisná metadata byl stanoven soubor dat, která podávají uživateli informaci o originálním svazku a významných prvcích v něm obsažených. Protože bylo cílem  zachovat „civilnost" popisu na výsledném uživatelském rozhraní, nebyl zvolen popis „řádkový" ale popis podobající se bibliografické citaci, pro uživatele upřednostňující důležitá data před daty méně důležitými. Z prvků běžného identifikačního popisu klasických dokumentů byly vybrány prvky základní (název a podnázev svazku, název části a číslo části, příjmení a jméno autora, místo a rok vydání, vydavatel, počet stran, edice). V případě, pokud individualizující prvky pocházejí ze strany dalších původců podílejících se na tvorbě svazku (dedikace překladatele, editora, vydavatele, tiskaře, ilustrátora) a pro zaznamenání významných spolutvůrců podílejících se na výtvarné stránce tvorby knihy, jejichž práce na svazku dokresluje estetické vlivy v době života majitele knihovny byla vytvořena pro zápis také pole: překladatel, ilustrátor, typograf, tvůrce návrhu obálky a vazby, grafické úpravy a tiskař (doplňované informace byly v případě potřeby ověřovány podle záznamů v Národní bibliografii katalogu Národní knihovny ČR či zahraničních národních knihoven). 

Pro představu velikosti dokumentu byl přidán také rozměr dokumentu v centimetrech. Vedle tohoto popisu je důležitou částí popisu každého svazku údaj o místě jeho uchovávání (ve formě: instituce, město, název sbírky). Nejdůležitější částí popisu je potom slovní vyjádření individualizujícího prvku, který je ve svazku obsažen, příp. možný kontext prvku s dílem či životem majitele.

U časopisů byla přidána data týkající se ročníku a čísla. Uživatelům v rámci popisu knihy na webovém rozhraní již nepřístupné uvedení signatury, které identifikuje lokaci svazku v rámci fondu uchovávající instituce. 

Pod tímto popisem se nabízí uživateli tři možné úrovně náhledu zveřejněných digitálních kopií, konečný náhled je doplněn o přepsané vpisky z prezentovaných digitálních kopií.

Vybraná data byla zapisována podle pravidel prvků popisného formátu MODS. Do formuláře byla doplňována vedle výše zmíněných dat a dat potřebných v rámci redakčního systému data identifikující formát popisované digitální kopie, jazyk, v němž je svazek vytištěn, volně tvořená klíčová slova charakterizující popisovanou digitální kopii (nejdůležitějším údajem jsou klíčová slova: osobní knihovna, dále jméno majitele, popř. další osoby v popisku zmiňované a název individualizovaného prvku). Jako prvky dalších metadatových schémat byla vyplňována i další metadata, jako je název skeneru, a typ dokumentu (dle typologie MIME). Na úrovni popisu digitálních kopií byl zapisován název obrázku (obálka, vpisky aj.), typ objektu (still image), identifikace souboru v rámci systému (local identificator). Poznámka na úrovni jedné stránky i původního dokumkentu jako celku byla realizována prvkem (mods:note).

Orientace v zpřístupňovaném obsahu

soupisu knihovny jsou knihy řazeny podle prvního písmene příjmení autora knihy. Uživatel se může v tomto soupisu pohybovat podle volby písmene v abecedním řazení dostupném na stránce nebo se  volně pohybovat v soupisu pomocí posuvníku.

Vyhledávání je realizováno:

  • prohlížením seznamu individualizovaných svazků jednotlivých knihoven a textovým vyhledáváním v seznamu všech zjištěných svazků osobní knihovny
  • zadáním dotazu, kdy uživatel může zvolit, zda bude vyhledávat odpověď na dotaz vjedné knihovně či ve všech knihovnách a textových souborech

Při zobrazení konkrétní knihy se uživateli zobrazí informace o knize: příjmení autora, název knihy, rok a místo vydání, nakladatel, počet stran a náhled pořízených digitálních kopií stránek této knihy. Při rozkliknutí jednoho z náhledů je uživateli nabídnut větší náhled spolu s informacemi o knize a o původních rozměrech knihy (popř. informace o dalších původcích spolupracujících na tvorbě svazku).

Pokud uživatel nezvolí popis knihy, ale přímo stránku v prvním náhledu, otevře se mu tato stránka přímo v plném zobrazení. 

U plného zobrazení stránky je nad obrázkem přepsáno věnování či vpisky pro snazší  porozumění uživatele.

Pro pohyb na stránkách je užívána tzv.drobečková navigace, díky níž má uživatel možnost orientovat se, na které úrovni ve struktuře webové aplikace se nachází.

Uživatelské rozhraní webové aplikace "Knihovny významných českých osobností" je přístupné v české a anglické verzi.