Více než 1300 videorozhovorů a podcastů o byznysu

Inzerce

Inzerce

Co to je Webarchiv.cz a proč by váš web měl být archivován?

Jiří Rostecký
Před 8 roky
Webarchiv.cz
Zdroj fotky: Fotolia.com | Autor: Cybrain

Mladý podnikatel byl nově zařazen do webarchivu Národní knihovny ČR. Při té příležitosti jsem vyzpovídal Mgr. Barboru Rudišinovou z oddělení archivace a zjistil, proč byste měli chtít mít archovaný web také.

Webarchiv.cz funguje podobně jako světový Archive.org. Zadáte do něj URL adresu webu a on se pokusí dohledat jeho starší verze. U mnoha webů tak najde i jejich podoby několik let zpátky, spousta webů dnes už ani neexistuje.

V Česku tento archiv spadá pod Národní knihovnu. „Jejím posláním je uchovávat veškeré národní kulturní dědictví v tištěné podobě,“ říká Rudišinová. Prostředkem, jak tento cíl naplnit, je především zákonem stanovený povinný výtisk, který ukládá autorům či vydavatelům (např. tištěným novinám) povinně odevzdat jeden výtisk svého díla Národní knihovně. Díky tomu do ní můžete přijít a přečíst si noviny i 30 let zpátky.

webarchiv.cz
Stačí vložit název webu či jeho adresu a zobrazí se jeho starší verze, pokud je archivován.

Problém je ale v tom, že se doba mění. Dnes se většina informací digitalizuje a mnoho vydavatelů působí už jen na internetu. Ten je ale typem média, které se neustále vyvíjí – weby se redesignují, zanikají, mění svůj obsah apod.

Inzerce

A právě to je důvod, proč Národní knihovna vytvořila Webarchiv a začala elektronicky publikované informace archivovat. Inspirovat se mohla i v zahraničí, kromě nejznámějšího webového archivu Archive.org, který provozuje americká nezisková organizace Internet Archive, vytváří webové archivy i např. Britská knihovna, Francouzská národní knihovna nebo např. Chorvatská národní knihovna.

„Uživateli Webarchivu jsou zejména jednotliví badatelé, kteří vyhledávají v archivu historické informace, které dnes již na živém webu nejsou,“ prozrazuje Rudišinová a dodává, že aktuálním zejména zahraničním trendem je také využití metadat z webových archivů (tzv. big data) k vědeckým bádáním, např. historickým, jazykovědným, sociologickým aj.

Proč se do archivu zaregistrovat?

Nechoďme kolem horké kaše. Nejspíš vás napadá otázka, proč byste se měli do Webarchivu registrovat. Ve skutečnosti vám to nezdvojnásobí návštěvnost webu ani jeho ziskovost, na druhou stranu se ale zařadíte mezi výběrové zdroje s historickou, kulturní nebo vědeckou hodnotou. Výhodou je i to, že váš pracně vytvořený obsah může být dohledatelný i v budoucnu, až už váš web třeba nebude existovat (což jednoho dne nejspíš nebude).

Přiznám se, že já osobně se Mladého podnikatele pokoušel zaregistrovat již poměrně dlouho, protože tvořím obsah především proto, aby pomohl čtenářům, inspiroval je a obohatil český internet. V minulosti jsem byl ale odmítnut. Přesto jsem to zkusil znovu a konečně to vyšlo. Zajímalo mne proto, podle jakých kritérií se určuje, který web archivován bude a který nikoliv.

„Není snadné určit, jaké informace budou v budoucnosti společnost zajímat. V ideálním případě by bylo vhodné tedy archivovat vše. To však není z technických a kapacitních důvodů možné, proto ve Webarchivu provádíme tzv. celoplošné sklizně (zpravidla jednou ročně), kdy je archivován celý český internet, tedy zdroje s doménou .cz, a to do určité hloubky, přičemž je to omezeno počtem stažených objektů na doménu,“ říká Rudišinová.

Do hry vstupuje i autorský zákon. Podle něj nemohou být tato data zpřístupněna online, ale pouze na terminálech v budově knihovny. Pro uživatele je však budována navíc také kolekce vybraných webů, která je přístupná online, prostřednictvím webu webarchiv.cz. Zpřístupněny nejsou ale žádné weby, jejichž provozovatel s tím výslovně nesouhlasil (mě teď čeká i podpis smlouvy, aby byl můj web skutečtě do archivu zařazen).

Weby do této kolekce vybírají kurátoři Webarchivu, případně mohou být navrženy uživateli prostřednictvím formuláře na webu. „Všechny weby prochází hodnocením a schvalovacím procesem. Hodnoceny jsou jak z technického, tak z obsahového hlediska. Z technického hlediska se jedná především o kontrolu, zda bude technicky možné dané stránky archivovat a zobrazit alespoň podstatnou část obsahu (např. některé interaktivní prvky, jako jsou mapy Google, videa aj. nelze aktuálně archivovat). Z obsahového je posuzována zejména originalita a unikátnost informací (nejsou převzaté z jiného zdroje), aktuálnost nebo nekomerční povaha,“ dodává Rudišinová.

Z toho vyplývá, že jsou preferovány zejména weby významných institucí, jako jsou vědecké ústavy, profesní komory, odborné časopisy atd. Šanci ale mohou mít i webové stránky jednotlivců (třeba blogy), pokud obsahují unikátní obsah. Jedním z nejčastějších důvodů odmítnutí je malá informační hodnota stránek (informace na stránkách jsou stručné a běžně dostupné). Odmítnutý web pak může být archivován jen v rámci celoplošné sklizně, nebo se svým obsahem něco udělat, aby Národní knihovně stál za archivaci. :-)

Statistiky Webarchivu

Webarchiv Národní knihovny ČR neexistuje dlouho. Poprvé vznikl až v roce 2000, o rok později proběhla archivace prvních webových stránek a běžný provoz probíhá od roku 2006. V současnosti obsahuje přes 200 TB dat a v rámci výběrové kolekce nabízí přes 4700 webových stránek.

Podle mě je to super nástroj pro rozvoj vlastního webu. Mě osobně naštvalo, když mě Webarchiv poprvé odmítl. O to větší motivaci zlepšit svůj web jsem cítil a nutilo mě to přemýšlet nad kvalitou obsahu Mladého podnikatele, nad jeho dlouhodobým smyslem, přínosem pro čtenáře a hodnotou pro český internet.

A i když vím, že je stále na čem pracovat a je stále co zlepšovat, je zařazení do Webarchivu při nejmenším důkazem, že jsme na dobré cestě a že kvalita našeho obsahu roste. Přál bych si, aby podobně uvažovali všichni provozovatelé webů a aby se snažili tvořit co nejkvalitnější obsah, který bude Národní knihovna ráda archivovat. Jak sami víme, řada provozovatelů se zaměřuje jen na svůj zisk a na to, jak ošulit své uživatele. Na hodnotu obsahu už ale zapomíná.

Možná, že kdybychom se při tvorbě obsahu všichni ptali, zda stojí za archivaci Národní knihovně a zda má takovou hodnotu, aby se dostal do její výběrové kolekce, vypadal by výsledek naší práce přeci jen trochu jinak…

Veškerá doporučení, informace, data, služby, reklamy nebo jakékoliv jiné sdělení zveřejněné na našich stránkách je pouze nezávazného charakteru a nejedná se o odborné rady nebo doporučení z naší strany. Podrobnosti na odkazu zde.

Autor: Jiří Rostecký

Jirka ve svých 18 letech založil MladýPodnikatel.cz. Posledních 8 let na něj zpovídá úspěšné osobnosti ze světa byznysu a vydává s nimi videorozhovory a podcasty, kterých má za sebou už více než 1 300. Jeho posláním je vzdělávat české a slovenské podnikatele, živnostníky, majitele firem a jejich zaměstnance. Pořádá také off-line akce, přednáší na vysokých školách a pomáhá s podnikáním ostatním v rámci konzultací. Časopis Forbes ho zařadil do žebříčku 30 pod 30 a získal řadu dalších ocenění a nominací.

Komentáře

Miloš Hamsa Sledovat @miloslavhamsa

Před 8 roky

Vyzkoušeno a píše mi to, že obsah je blokován nebo web není v databázi. Tak nevím, co znamená když je web blokován.

Odpovědět »

Přidej vlastní komentář

Tyto stránky jsou chráněny pomocí reCAPTCHA a platí s tím související ochrana soukromí a smluvní podmínky společnosti Google.

Vybraná témata

Nenechte si ujít

jiri-rostecky-kariera-web

Jak na úspěšnou kariéru? Přednáška Jirky Rosteckého

Premium
denisa-havrdova-web

Prodala přes 500 tisíc diářů a zápisníků. Jak Denisa Havrdová řídí papelote?

konstantin-margaretis-web

Posílá zboží do 180 zemí a sbírá světová ocenění. Jak se buduje Skladon? | Konstantin Margaretis

marek-cech-web

Jak se řídí malá digitální agentura? | Marek Čech (Digitální architekti)

jiri-rostecky-smb-web

Nejčastější chyby majitelů malých a středních firem. Přednáška Jirky Rosteckého

Premium
ondrej-machala-web

Ovečkárna se osamostatnila od zakladatele. Jak se změnila? | Ondřej Machala

jiri-jemelka-web

Loni řídili 113 firem s tržbami 21 miliard. Jak se dostávají z krizí? | Jiří Jemelka (JPF)

juraj-harkabuzik-web

Outsourcing v podnikání: Kdy dává smysl? | Juraj Harkabuzík (CustomerHero)