DjVu/DjVu - formát pro elektronickou archivaci dokumentů
< DjVu
Formát DjVu je podobně jako PDF určen pro elektronickou konzervaci dokumentů. Mezi jeho silné zbraně patří:
- Komprimace obrazových vrstev wavelet kompresí - tím DjVu dosahuje dobrého poměru mezi čitelností dokumentu a celkovým objemem uložených dat.
- Bezproblémové slučování a rozdělování jednotlivých stránek (dokumentů), přičemž každý dokument ba i každá extrahovaná vrstva může existovat jako samostatný dokument.
- Obrazové a textové informace umístěné v oddělených vrstvách. Každá stránka DjVu dokumentu má svou vlastní editovatelnou textovou vrstvu, kterou lze fulltextově prohledávat a indexovat. Obsah do této vrstvy lze doplnit pomocí editačního nástroje djvused i dodatečně pomocí OCR rozpoznáním černobílé vrstvy.
- Skrytá textová vrstva také může obsahovat řadu dalších informací, díky nimž lze vyloučit jakoukoliv dodatečnou úpravu originálního dokumentu.
Tyto vlastnosti přímo předurčují formát DjVu k archivaci tiskovin a listin, neboť umožňují naskenované dokumenty zredukovat na přijatelnou velikost, aniž by tím nějak výrazně utrpěla jejich čitelnost. U takto „zakonzervovaných“ dokumentů zůstává zachováno vše co bylo na originálu (např. nejrůznější vpisky, otisky atp.), a přitom s nimi lze dále pracovat. Skrytá textová vrstva navíc dává možnost doplnit indexovatelný obsah zvláště u dokumentů psaných rukopisem či znakovým písmem. Díky tomu je tento formát velmi výhodný pro publikování archivovaných materiálů prostřednictvím internetu.
Obsah | ||
◄ Obálka | DjVu - formát pro elektronickou archivaci dokumentů | DjVu versus PDF ► |