Národní knihovna České republiky

  • na webu
  • v katalogu
  • eds katalog
Nacházíte se zde: Úvod O knihovně Odborné činnosti Odbor ochrany knihovních fondů zzz_OSOF

Digitalizace a digitální zpřístupnění dokumentů

NK ČR provozuje dvě pracoviště digitalizace. Prvním je pracoviště přímé digitalizace rukopisů a vzácných dokumentů, které vzniklo na základě aktivit soustředěných kolem programu Paměť světa, a které NK ČR provozuje ve spolupráci s firmou Albertina icome Praha.

Druhým pracovištěm je pracoviště digitalizace mikrofilmů, které bylo vybudováno díky realizaci projektu “Digitalizace mikromédií“ v letech 1997 až 1999. Spojením mikrofilmu a digitálního záznamu se vytváří tzv. hybridní technologie, využívající předností obou formátů. Mikrofilm zajišťuje trvalé dochování obsahu dokumentu, digitální záznam jeho snadné zpřístupnění uživatelům. Pracoviště zajišťuje přípravu dokumentů pro mikrofilmování a digitalizaci včetně tvorby metadat, skenování mikrofilmů, spojování indexních údajů s obrazovými soubory a zpřístupňování dokumentů prostřednictvím internetu, lokální sítě NK ČR a CD-R médií.

2.1 Příprava dokumentů a tvorba metadat

Obdobně jako v případě mikrofilmování spočívá příprava pro hybridní zpracování v kompletaci dokumentu za pomoci všech dostupných exemplářů a v podrobném prolistování a zjištění potřebných údajů včetně všech nepravidelností. V prvé fázi přípravy se ve formuláři zaznamenají indexní údaje pro každou individuální stranu. V další fázi se údaje z formuláře přepisují do pracovního listu počítače, čímž vzniká textový soubor, který se automaticky konvertuje do formátu DOBM. Takto se vytváří metadata popisující strukturu dokumentu. Používání metadat hraje klíčovou roli pro dlouhodobé zachování přístupu k digitálním dokumentům.

2.2 Skenování mikrofilmů a úpravy obrazových dat

Pro skenování mikrofilmů NK ČR používá skener SunRise, který umožňuje skenovat svitkové mikrofilmy 35 a 16mm a mikrofiše. Výstupem jsou obrazové soubory v jednobitovém zobrazení nebo v 16 bitové šedé škále, ve formátech TIFF, JPEG a GIF. Obrazové soubory vyžadují následné úpravy, zejména pootočení a ořez, převod a pro zpřístupnění na Internetu konverzi do jednobitové škály, převzorkování ve formátu J JPEG, nebo konverzi do formátu DjVu. U vybraných titulů budou obrazové soubory zpracovávány technologií OCR pro získání textového formátu. Textový formát však nebude sloužit pro zpřístupnění uživatelům, ale pouze pro vyhledávání pomocí nástroje Retrieval Ware (Excalibur). Obrazový formát považujeme za základní, protože zachovává původní grafickou podobu dokumentu a zabezpečuje vyšší úroveň autenticity.

2.3 Zpřístupňování digitálních dokumentů

Pro uchovávání, archivaci i zpřístupňování dokumentů slouží velmi složitý systém sestávající z magnetopáskové robotické knihovny ADIC Scalar 1000, diskového subsystému, systému SAM FS a programové aplikaci AIP Safe. Všechna metadata budou uložena na diskovém poli, stejně jako část nejžádanějších obrazových souborů. Všechny obrazové soubory budou umístěny v robotické magnetopáskové knihovně. Jedná se o přístup označovaný jako near-line, protože vyžaduje delší lhůty. Celý systém je možné dynamicky podle potřeby rozvíjet jak v diskové části, tak i magnetopáskové a to do značných paměťových kapacit. Zařízení budou moci využívat pro ukládání, archivování a zpřístupňování digitalizovaných dokumentů ostatní veřejné knihovny a další instituce. Systém umožní zpřístupňovat dokumenty prostřednictvím internetu a lokální sítě. NK ČR je schopna zpřístupňovat digitální dokumenty i prostřednictvím CD-R médií.

2.4 Archivace a zálohování digitálních dokumentů

Pro archivaci digitálních dokumentů NK ČR používá dva nezávislé systémy. První využívá CD-R médií a slouží pro menší objemy dat (rukopisy). Vzhledem k tomu, že CD-R média podléhají degradaci, bylo třeba vyvinout systém kontroly založený na měření chybovosti, díky kterému lze určit dobu, kdy je nutné data přepsat na jiný nosič. Dokumenty se uchovávají na dvou archivních médiích. Druhý systém využívá magnetopáskovou robotickou knihovnu, které eviduje expirační lhůty pásek a automaticky provádí kompletní recyklaci médií (dekompresi dat, dopočítání, kompresi a přepis na nové médium) bez zásahu pracovníka. Všechny obrazové soubory jsou v knihovně 2x na dvou identických médiích (on-line), třetí je uložena v jiné budově (off-line).

2.5 Seznam digitalizovaných dokumentů

16.07.2013
E-zpravodaj Facebook Twitter Instagram Youtube