Inspirace pro vaše podnikání a marketing

Co to je Webarchiv.cz a proč by váš web měl být archivován?

Rychlé čtení

Webarchiv.czMladý podnikatel byl nově zařazen do webarchivu Národní knihovny ČR. Při té příležitosti jsem vyzpovídal Mgr. Barboru Rudišinovou z oddělení archivace a zjistil, proč byste měli chtít mít archovaný web také.

Webarchiv.cz funguje podobně jako světový Archive.org. Zadáte do něj URL adresu webu a on se pokusí dohledat jeho starší verze. U mnoha webů tak najde i jejich podoby několik let zpátky, spousta webů dnes už ani neexistuje.

V Česku tento archiv spadá pod Národní knihovnu. „Jejím posláním je uchovávat veškeré národní kulturní dědictví v tištěné podobě,“ říká Rudišinová. Prostředkem, jak tento cíl naplnit, je především zákonem stanovený povinný výtisk, který ukládá autorům či vydavatelům (např. tištěným novinám) povinně odevzdat jeden výtisk svého díla Národní knihovně. Díky tomu do ní můžete přijít a přečíst si noviny i 30 let zpátky.

webarchiv.cz

Stačí vložit název webu či jeho adresu a zobrazí se jeho starší verze, pokud je archivován.

Problém je ale v tom, že se doba mění. Dnes se většina informací digitalizuje a mnoho vydavatelů působí už jen na internetu. Ten je ale typem média, které se neustále vyvíjí – weby se redesignují, zanikají, mění svůj obsah apod.

A právě to je důvod, proč Národní knihovna vytvořila Webarchiv a začala elektronicky publikované informace archivovat. Inspirovat se mohla i v zahraničí, kromě nejznámějšího webového archivu Archive.org, který provozuje americká nezisková organizace Internet Archive, vytváří webové archivy i např. Britská knihovna, Francouzská národní knihovna nebo např. Chorvatská národní knihovna.

„Uživateli Webarchivu jsou zejména jednotliví badatelé, kteří vyhledávají v archivu historické informace, které dnes již na živém webu nejsou,“ prozrazuje Rudišinová a dodává, že aktuálním zejména zahraničním trendem je také využití metadat z webových archivů (tzv. big data) k vědeckým bádáním, např. historickým, jazykovědným, sociologickým aj.

Proč se do archivu zaregistrovat?

Nechoďme kolem horké kaše. Nejspíš vás napadá otázka, proč byste se měli do Webarchivu registrovat. Ve skutečnosti vám to nezdvojnásobí návštěvnost webu ani jeho ziskovost, na druhou stranu se ale zařadíte mezi výběrové zdroje s historickou, kulturní nebo vědeckou hodnotou. Výhodou je i to, že váš pracně vytvořený obsah může být dohledatelný i v budoucnu, až už váš web třeba nebude existovat (což jednoho dne nejspíš nebude).

Přiznám se, že já osobně se Mladého podnikatele pokoušel zaregistrovat již poměrně dlouho, protože tvořím obsah především proto, aby pomohl čtenářům, inspiroval je a obohatil český internet. V minulosti jsem byl ale odmítnut. Přesto jsem to zkusil znovu a konečně to vyšlo. Zajímalo mne proto, podle jakých kritérií se určuje, který web archivován bude a který nikoliv.

„Není snadné určit, jaké informace budou v budoucnosti společnost zajímat. V ideálním případě by bylo vhodné tedy archivovat vše. To však není z technických a kapacitních důvodů možné, proto ve Webarchivu provádíme tzv. celoplošné sklizně (zpravidla jednou ročně), kdy je archivován celý český internet, tedy zdroje s doménou .cz, a to do určité hloubky, přičemž je to omezeno počtem stažených objektů na doménu,“ říká Rudišinová.

Do hry vstupuje i autorský zákon. Podle něj nemohou být tato data zpřístupněna online, ale pouze na terminálech v budově knihovny. Pro uživatele je však budována navíc také kolekce vybraných webů, která je přístupná online, prostřednictvím webu webarchiv.cz. Zpřístupněny nejsou ale žádné weby, jejichž provozovatel s tím výslovně nesouhlasil (mě teď čeká i podpis smlouvy, aby byl můj web skutečtě do archivu zařazen).

Weby do této kolekce vybírají kurátoři Webarchivu, případně mohou být navrženy uživateli prostřednictvím formuláře na webu. „Všechny weby prochází hodnocením a schvalovacím procesem. Hodnoceny jsou jak z technického, tak z obsahového hlediska. Z technického hlediska se jedná především o kontrolu, zda bude technicky možné dané stránky archivovat a zobrazit alespoň podstatnou část obsahu (např. některé interaktivní prvky, jako jsou mapy Google, videa aj. nelze aktuálně archivovat). Z obsahového je posuzována zejména originalita a unikátnost informací (nejsou převzaté z jiného zdroje), aktuálnost nebo nekomerční povaha,“ dodává Rudišinová.

Z toho vyplývá, že jsou preferovány zejména weby významných institucí, jako jsou vědecké ústavy, profesní komory, odborné časopisy atd. Šanci ale mohou mít i webové stránky jednotlivců (třeba blogy), pokud obsahují unikátní obsah. Jedním z nejčastějších důvodů odmítnutí je malá informační hodnota stránek (informace na stránkách jsou stručné a běžně dostupné). Odmítnutý web pak může být archivován jen v rámci celoplošné sklizně, nebo se svým obsahem něco udělat, aby Národní knihovně stál za archivaci. :-)

Statistiky Webarchivu

Webarchiv Národní knihovny ČR neexistuje dlouho. Poprvé vznikl až v roce 2000, o rok později proběhla archivace prvních webových stránek a běžný provoz probíhá od roku 2006. V současnosti obsahuje přes 200 TB dat a v rámci výběrové kolekce nabízí přes 4700 webových stránek.

Podle mě je to super nástroj pro rozvoj vlastního webu. Mě osobně naštvalo, když mě Webarchiv poprvé odmítl. O to větší motivaci zlepšit svůj web jsem cítil a nutilo mě to přemýšlet nad kvalitou obsahu Mladého podnikatele, nad jeho dlouhodobým smyslem, přínosem pro čtenáře a hodnotou pro český internet.

A i když vím, že je stále na čem pracovat a je stále co zlepšovat, je zařazení do Webarchivu při nejmenším důkazem, že jsme na dobré cestě a že kvalita našeho obsahu roste. Přál bych si, aby podobně uvažovali všichni provozovatelé webů a aby se snažili tvořit co nejkvalitnější obsah, který bude Národní knihovna ráda archivovat. Jak sami víme, řada provozovatelů se zaměřuje jen na svůj zisk a na to, jak ošulit své uživatele. Na hodnotu obsahu už ale zapomíná.

Možná, že kdybychom se při tvorbě obsahu všichni ptali, zda stojí za archivaci Národní knihovně a zda má takovou hodnotu, aby se dostal do její výběrové kolekce, vypadal by výsledek naší práce přeci jen trochu jinak…

Okomentovat článek

Sdílejte článek přátelům:

Autor: Jiří Rostecký

Jirkovi je 23 let. Podniká už od střední školy. Hned po ní založil svou první firmu. Nejvíce ho baví tvorba rozhovorů, kterými se snaží na internet přinášet více know-how a inspirace od českých profesionálů a podnikatelů. Píše blog o podnikání na internetu.

Komentáře čtenářů: 1

  1. Miloš Hamsa

    -

    Vyzkoušeno a píše mi to, že obsah je blokován nebo web není v databázi. Tak nevím, co znamená když je web blokován.

    Odpovědět

Přidejte vlastní komentář