Pokud chcete mít nějakou knihu v elektronické podobě, není až tak těžké si ji vyrobit. Pokusím se to popsat v následujícím článku.
Máme dvě základní možnosti jak knihu skladovat – jako obrázky, nebo jako text. Obrázky je jednoduší získat (stačí si je nafotit nebo naskenovat), ale zabírají víc místa. S textem je to přesně naopak. Je potřeba knihu buď opsat, nebo naskenovat (nafotit) a výsledné obrázky převést na text (OCR). To se dá sice dělat částečně automaticky, ale výsledný text, stejně potřebuje ruční korekce a navíc OCR program, který umí češtinu zadarmo žádný dobrý neznám. Budeme se tedy zabývat knihami jako obrázky.
Než se pustíme do tvorby knihy budeme se věnovat jednolivým formátům jak výslednou knihu skladovat. První co vás napadne je asi některý z obrazových formátů.
- JPEG je formátem naprosto nevhodným, protože se nehodí pro ukládání obrázků, které obsahují mnoho malých detailů a hran (což text je).
- PNG nebo GIF by byly trochu lepší, ale zase to bude mnoho souborů, které se budou nepohodlně prohlížet.
- PDF by se mohlo zdát jako ideální formát, ale narazíme na problémem, že výsledný soubor asi bude dost veliký.
- DjVu (http://djvu.org/) je celkem neznámým souborovým formátem určeným k archivaci elektronických knih. Tím je dáno, že používá i lepší kompresi, než ostatní konkurenční formáty. Další výhoda je, že jde otevřený formát, jenž není problém zobrazit na mnoha platformách a operačních systémech. Nevýhodou je, že prohlížeč tohoto formátu nemá většina uživatelů nainstalovaný.
Teď už se můžeme pustit do výroby vlastní knihy. Nejprve musíme získat obrázky jednotlivých stránek. Ty můžeme buď naskenovat, nebo nafotit digitálním fotoaparátem. Pokud se rozhodnete fotit, doporučuji použít stativ a nějaký lepší fotoaparát, ať ty fotky za něco stojí. Na fotoaparátu, doporučuji nastavit manuální režim expozice i ostření, ať se na všechny fotky použije stejné nastavení. Dále doporučuji fotit za denního světla a to tak abyste co nejvíce omezili stíny na fotkách.
- Nafocený materiál ideálně uložený v bezztrátovém tif formátu si převedeme do PBM pomocí programu
convert
s balíčku ImageMagick.convert $input_dir/$filename.tif $output_dir/$filename.pbm
- Vytvoříme si DjVu soubor z každé stránky:
cjb2 -clean $output_dir/$filename.pbm $output_dir/$filename.djvu
- Nakonec jednotlivé stránky spojíme v knihu
djvm -c book.djvu $output_dir/*.djvu
Potřebné programy cjb2
, djvm
a prohlížeč DjView najdete v balíku DjVuLibre, který je ke stažení na http://djvu.sourceforge.net/. Tam také je k nalezení potřebná dokumentace.