Inzerce

Inzerce

Co to je Webarchiv.cz a proč by váš web měl být archivován?

Webarchiv.cz
Zdroj fotky: Fotolia.com | Autor: Cybrain

Mladý podnikatel byl nově zařazen do webarchivu Národní knihovny ČR. Při té příležitosti jsem vyzpovídal Mgr. Barboru Rudišinovou z oddělení archivace a zjistil, proč byste měli chtít mít archovaný web také.

Webarchiv.cz funguje podobně jako světový Archive.org. Zadáte do něj URL adresu webu a on se pokusí dohledat jeho starší verze. U mnoha webů tak najde i jejich podoby několik let zpátky, spousta webů dnes už ani neexistuje.

V Česku tento archiv spadá pod Národní knihovnu. „Jejím posláním je uchovávat veškeré národní kulturní dědictví v tištěné podobě,“ říká Rudišinová. Prostředkem, jak tento cíl naplnit, je především zákonem stanovený povinný výtisk, který ukládá autorům či vydavatelům (např. tištěným novinám) povinně odevzdat jeden výtisk svého díla Národní knihovně. Díky tomu do ní můžete přijít a přečíst si noviny i 30 let zpátky.

webarchiv.cz
Stačí vložit název webu či jeho adresu a zobrazí se jeho starší verze, pokud je archivován.

Problém je ale v tom, že se doba mění. Dnes se většina informací digitalizuje a mnoho vydavatelů působí už jen na internetu. Ten je ale typem média, které se neustále vyvíjí – weby se redesignují, zanikají, mění svůj obsah apod.

A právě to je důvod, proč Národní knihovna vytvořila Webarchiv a začala elektronicky publikované informace archivovat. Inspirovat se mohla i v zahraničí, kromě nejznámějšího webového archivu Archive.org, který provozuje americká nezisková organizace Internet Archive, vytváří webové archivy i např. Britská knihovna, Francouzská národní knihovna nebo např. Chorvatská národní knihovna.

„Uživateli Webarchivu jsou zejména jednotliví badatelé, kteří vyhledávají v archivu historické informace, které dnes již na živém webu nejsou,“ prozrazuje Rudišinová a dodává, že aktuálním zejména zahraničním trendem je také využití metadat z webových archivů (tzv. big data) k vědeckým bádáním, např. historickým, jazykovědným, sociologickým aj.

Proč se do archivu zaregistrovat?

Nechoďme kolem horké kaše. Nejspíš vás napadá otázka, proč byste se měli do Webarchivu registrovat. Ve skutečnosti vám to nezdvojnásobí návštěvnost webu ani jeho ziskovost, na druhou stranu se ale zařadíte mezi výběrové zdroje s historickou, kulturní nebo vědeckou hodnotou. Výhodou je i to, že váš pracně vytvořený obsah může být dohledatelný i v budoucnu, až už váš web třeba nebude existovat (což jednoho dne nejspíš nebude).

Přiznám se, že já osobně se Mladého podnikatele pokoušel zaregistrovat již poměrně dlouho, protože tvořím obsah především proto, aby pomohl čtenářům, inspiroval je a obohatil český internet. V minulosti jsem byl ale odmítnut. Přesto jsem to zkusil znovu a konečně to vyšlo. Zajímalo mne proto, podle jakých kritérií se určuje, který web archivován bude a který nikoliv.

„Není snadné určit, jaké informace budou v budoucnosti společnost zajímat. V ideálním případě by bylo vhodné tedy archivovat vše. To však není z technických a kapacitních důvodů možné, proto ve Webarchivu provádíme tzv. celoplošné sklizně (zpravidla jednou ročně), kdy je archivován celý český internet, tedy zdroje s doménou .cz, a to do určité hloubky, přičemž je to omezeno počtem stažených objektů na doménu,“ říká Rudišinová.

Do hry vstupuje i autorský zákon. Podle něj nemohou být tato data zpřístupněna online, ale pouze na terminálech v budově knihovny. Pro uživatele je však budována navíc také kolekce vybraných webů, která je přístupná online, prostřednictvím webu webarchiv.cz. Zpřístupněny nejsou ale žádné weby, jejichž provozovatel s tím výslovně nesouhlasil (mě teď čeká i podpis smlouvy, aby byl můj web skutečtě do archivu zařazen).

Weby do této kolekce vybírají kurátoři Webarchivu, případně mohou být navrženy uživateli prostřednictvím formuláře na webu. „Všechny weby prochází hodnocením a schvalovacím procesem. Hodnoceny jsou jak z technického, tak z obsahového hlediska. Z technického hlediska se jedná především o kontrolu, zda bude technicky možné dané stránky archivovat a zobrazit alespoň podstatnou část obsahu (např. některé interaktivní prvky, jako jsou mapy Google, videa aj. nelze aktuálně archivovat). Z obsahového je posuzována zejména originalita a unikátnost informací (nejsou převzaté z jiného zdroje), aktuálnost nebo nekomerční povaha,“ dodává Rudišinová.

Z toho vyplývá, že jsou preferovány zejména weby významných institucí, jako jsou vědecké ústavy, profesní komory, odborné časopisy atd. Šanci ale mohou mít i webové stránky jednotlivců (třeba blogy), pokud obsahují unikátní obsah. Jedním z nejčastějších důvodů odmítnutí je malá informační hodnota stránek (informace na stránkách jsou stručné a běžně dostupné). Odmítnutý web pak může být archivován jen v rámci celoplošné sklizně, nebo se svým obsahem něco udělat, aby Národní knihovně stál za archivaci. :-)

Statistiky Webarchivu

Webarchiv Národní knihovny ČR neexistuje dlouho. Poprvé vznikl až v roce 2000, o rok později proběhla archivace prvních webových stránek a běžný provoz probíhá od roku 2006. V současnosti obsahuje přes 200 TB dat a v rámci výběrové kolekce nabízí přes 4700 webových stránek.

Podle mě je to super nástroj pro rozvoj vlastního webu. Mě osobně naštvalo, když mě Webarchiv poprvé odmítl. O to větší motivaci zlepšit svůj web jsem cítil a nutilo mě to přemýšlet nad kvalitou obsahu Mladého podnikatele, nad jeho dlouhodobým smyslem, přínosem pro čtenáře a hodnotou pro český internet.

A i když vím, že je stále na čem pracovat a je stále co zlepšovat, je zařazení do Webarchivu při nejmenším důkazem, že jsme na dobré cestě a že kvalita našeho obsahu roste. Přál bych si, aby podobně uvažovali všichni provozovatelé webů a aby se snažili tvořit co nejkvalitnější obsah, který bude Národní knihovna ráda archivovat. Jak sami víme, řada provozovatelů se zaměřuje jen na svůj zisk a na to, jak ošulit své uživatele. Na hodnotu obsahu už ale zapomíná.

Možná, že kdybychom se při tvorbě obsahu všichni ptali, zda stojí za archivaci Národní knihovně a zda má takovou hodnotu, aby se dostal do její výběrové kolekce, vypadal by výsledek naší práce přeci jen trochu jinak…

jiri-rostecky

Jiří Rostecký

Jirkovi je 27 let a je zakladatelem MladýPodnikatel.cz. Podnikat začal ještě na střední škole, ale jeho první firma mu vůbec nevyšla. Po ní se začal naplno věnovat natáčení rozhovorů a podcastů, kterých má za sebou už bezmála 7 stovek. Ročně pořádá desítky akcí pro podnikatele a často přednáší na vysokých školách. Časopis Forbes ho umístil do českého výběru 30pod30, několikrát byl nominován na Osobnost digitálního marketingu WebTOP100 a opakovaně se umísťuje i v Křišťálové Lupě. Píše blog a sledovat ho můžete třeba na Facebooku.

Nenechte si ujít

muz-kafe-pocitac-web

Kdo v Česku provozuje e-shopy?

podnikatel-box-web

Jde to i bez Heureky? Možná jde. Alza.cz je první, kdo se přidá?

Konkurence Optimizely

Jak špehovat AB testování konkurence v Optimizely?

Právě vyšlo

pavel-roder-web

Jak mohou startupy získat velké klienty? | Pavel Röder (OMG Nest)

vit-endler-web

Financování e-shopu: Crowdfunding jako nedoceněná možnost | Vít Endler (finGOOD.cz)

marek-lecian-web

Zvyšování odbornosti u specialistů na volné noze | Marek Lecián

Nejoblíbenější

andrej-kiska-web

Jak získat investora a vybudovat úspěšný startup? | Andrej Kiska (Credo Ventures)

petr-bena-web

Budoucnost e-commerce a role marketplaces | Petr Bena z Alza.cz

margareta-krizova-web

Margareta Křížová: Rozjezd podnikání, ženy a kariéra, podnikání ve vyšším věku

Komentáře

Miloš Hamsa Sledovat @miloslavhamsa

Před 5 roky

Vyzkoušeno a píše mi to, že obsah je blokován nebo web není v databázi. Tak nevím, co znamená když je web blokován.

Odpovědět »

Přidej vlastní komentář

Tyto stránky jsou chráněny pomocí reCAPTCHA a platí s tím související ochrana soukromí a smluvní podmínky společnosti Google.

Doporučené články

muz-pc-unava-web

3 chyby, kterých se dopouštíme při sebevzdělávání

tomas-zetek-web

Tomáš Zetek: Budování úspěšné kariéry, vyhoření a naše vnitřní motivace

kosiky-cerna-web

Jak naučit zákazníky nakupovat opakovaně?

jarda-kaucky-web

Jaroslav Kaucký: Obdivuji freelancery, že si tak věří

Inzerce