Mladý podnikatel byl nově zařazen do webarchivu Národní knihovny ČR. Při té příležitosti jsem vyzpovídal Mgr. Barboru Rudišinovou z oddělení archivace a zjistil, proč byste měli chtít mít archovaný web také.
Inzerce
Webarchiv.cz funguje podobně jako světový Archive.org. Zadáte do něj URL adresu webu a on se pokusí dohledat jeho starší verze. U mnoha webů tak najde i jejich podoby několik let zpátky, spousta webů dnes už ani neexistuje.
V Česku tento archiv spadá pod Národní knihovnu. „Jejím posláním je uchovávat veškeré národní kulturní dědictví v tištěné podobě,“ říká Rudišinová. Prostředkem, jak tento cíl naplnit, je především zákonem stanovený povinný výtisk, který ukládá autorům či vydavatelům (např. tištěným novinám) povinně odevzdat jeden výtisk svého díla Národní knihovně. Díky tomu do ní můžete přijít a přečíst si noviny i 30 let zpátky.
Stačí vložit název webu či jeho adresu a zobrazí se jeho starší verze, pokud je archivován.
Problém je ale v tom, že se doba mění. Dnes se většina informací digitalizuje a mnoho vydavatelů působí už jen na internetu. Ten je ale typem média, které se neustále vyvíjí – weby se redesignují, zanikají, mění svůj obsah apod.
Doporučujeme
Premium rozhovoryexkluzivně pro předplatitele
Praktické know-how pro řízení vašeho byznysu. Rady a tipy TOP podnikatelů a manažerů. Podrobné videorozhovory a podcasty.
A právě to je důvod, proč Národní knihovna vytvořila Webarchiv a začala elektronicky publikované informace archivovat. Inspirovat se mohla i v zahraničí, kromě nejznámějšího webového archivu Archive.org, který provozuje americká nezisková organizace Internet Archive, vytváří webové archivy i např. Britská knihovna, Francouzská národní knihovna nebo např. Chorvatská národní knihovna.
„Uživateli Webarchivu jsou zejména jednotliví badatelé, kteří vyhledávají v archivu historické informace, které dnes již na živém webu nejsou,“ prozrazuje Rudišinová a dodává, že aktuálním zejména zahraničním trendem je také využití metadat z webových archivů (tzv. big data) k vědeckým bádáním, např. historickým, jazykovědným, sociologickým aj.
Proč se do archivu zaregistrovat?
Nechoďme kolem horké kaše. Nejspíš vás napadá otázka, proč byste se měli do Webarchivu registrovat. Ve skutečnosti vám to nezdvojnásobí návštěvnost webu ani jeho ziskovost, na druhou stranu se ale zařadíte mezi výběrové zdroje s historickou, kulturní nebo vědeckou hodnotou. Výhodou je i to, že váš pracně vytvořený obsah může být dohledatelný i v budoucnu, až už váš web třeba nebude existovat (což jednoho dne nejspíš nebude).
Přiznám se, že já osobně se Mladého podnikatele pokoušel zaregistrovat již poměrně dlouho, protože tvořím obsah především proto, aby pomohl čtenářům, inspiroval je a obohatil český internet. V minulosti jsem byl ale odmítnut. Přesto jsem to zkusil znovu a konečně to vyšlo. Zajímalo mne proto, podle jakých kritérií se určuje, který web archivován bude a který nikoliv.
„Není snadné určit, jaké informace budou v budoucnosti společnost zajímat. V ideálním případě by bylo vhodné tedy archivovat vše. To však není z technických a kapacitních důvodů možné, proto ve Webarchivu provádíme tzv. celoplošné sklizně (zpravidla jednou ročně), kdy je archivován celý český internet, tedy zdroje s doménou .cz, a to do určité hloubky, přičemž je to omezeno počtem stažených objektů na doménu,“ říká Rudišinová.
Do hry vstupuje i autorský zákon. Podle něj nemohou být tato data zpřístupněna online, ale pouze na terminálech v budově knihovny. Pro uživatele je však budována navíc také kolekce vybraných webů, která je přístupná online, prostřednictvím webu webarchiv.cz. Zpřístupněny nejsou ale žádné weby, jejichž provozovatel s tím výslovně nesouhlasil (mě teď čeká i podpis smlouvy, aby byl můj web skutečtě do archivu zařazen).
Weby do této kolekce vybírají kurátoři Webarchivu, případně mohou být navrženy uživateli prostřednictvím formuláře na webu. „Všechny weby prochází hodnocením a schvalovacím procesem. Hodnoceny jsou jak z technického, tak z obsahového hlediska. Z technického hlediska se jedná především o kontrolu, zda bude technicky možné dané stránky archivovat a zobrazit alespoň podstatnou část obsahu (např. některé interaktivní prvky, jako jsou mapy Google, videa aj. nelze aktuálně archivovat). Z obsahového je posuzována zejména originalita a unikátnost informací (nejsou převzaté z jiného zdroje), aktuálnost nebo nekomerční povaha,“ dodává Rudišinová.
Z toho vyplývá, že jsou preferovány zejména weby významných institucí, jako jsou vědecké ústavy, profesní komory, odborné časopisy atd. Šanci ale mohou mít i webové stránky jednotlivců (třeba blogy), pokud obsahují unikátní obsah. Jedním z nejčastějších důvodů odmítnutí je malá informační hodnota stránek (informace na stránkách jsou stručné a běžně dostupné). Odmítnutý web pak může být archivován jen v rámci celoplošné sklizně, nebo se svým obsahem něco udělat, aby Národní knihovně stál za archivaci. :-)
Statistiky Webarchivu
Webarchiv Národní knihovny ČR neexistuje dlouho. Poprvé vznikl až v roce 2000, o rok později proběhla archivace prvních webových stránek a běžný provoz probíhá od roku 2006. V současnosti obsahuje přes 200 TB dat a v rámci výběrové kolekce nabízí přes 4700 webových stránek.
Podle mě je to super nástroj pro rozvoj vlastního webu. Mě osobně naštvalo, když mě Webarchiv poprvé odmítl. O to větší motivaci zlepšit svůj web jsem cítil a nutilo mě to přemýšlet nad kvalitou obsahu Mladého podnikatele, nad jeho dlouhodobým smyslem, přínosem pro čtenáře a hodnotou pro český internet.
A i když vím, že je stále na čem pracovat a je stále co zlepšovat, je zařazení do Webarchivu při nejmenším důkazem, že jsme na dobré cestě a že kvalita našeho obsahu roste. Přál bych si, aby podobně uvažovali všichni provozovatelé webů a aby se snažili tvořit co nejkvalitnější obsah, který bude Národní knihovna ráda archivovat. Jak sami víme, řada provozovatelů se zaměřuje jen na svůj zisk a na to, jak ošulit své uživatele. Na hodnotu obsahu už ale zapomíná.
Možná, že kdybychom se při tvorbě obsahu všichni ptali, zda stojí za archivaci Národní knihovně a zda má takovou hodnotu, aby se dostal do její výběrové kolekce, vypadal by výsledek naší práce přeci jen trochu jinak…
Veškerá doporučení, informace, data, služby, reklamy nebo jakékoliv jiné sdělení zveřejněné na našich stránkách je pouze nezávazného charakteru a nejedná se o odborné rady nebo doporučení z naší strany. Podrobnosti na odkazu zde.
Jirka ve svých 18 letech založil MladýPodnikatel.cz. Posledních 8 let na něj zpovídá úspěšné osobnosti ze světa byznysu a vydává s nimi videorozhovory a podcasty, kterých má za sebou už bezmála 1 200. Jeho posláním je vzdělávat české a slovenské podnikatele, živnostníky, majitele firem a jejich zaměstnance. Pořádá také off-line akce, přednáší na vysokých školách a pomáhá s podnikáním ostatním v rámci konzultací. Časopis Forbes ho zařadil do žebříčku 30 pod 30 a získal řadu dalších ocenění a nominací.
Nenechte si ujít
E-mail marketing a AI. Co už dnes funguje v praxi? | Dan Nytra
Nebuďte na podnikání sami. Čerpejte know-how zkušených podnikatelů. Praktické informace pro vaši firmu. Přidejte se mezi podnikatele, co rostou s námi.
Na našich stránkách používáme cookies. Kliknutím na „Přijmout vše“ souhlasíte s použitím všech cookies. Kliknutím na „Nastavení“ nám můžete poskytnout souhlas jen s konkrétními cookies. Zjistit více Přijmout všeOdmítnout všeNastavení
Nastavení cookies
Nastavení cookies
Tento web používá cookies, aby zlepšil váš zážitek při procházení našeho webu. Z nich jsou cookies, které jsou ohodnoceny jako nezbytné, uloženy ve vašem prohlížeči, protože jsou třeba pro základní fungování webových stránek. Používáme také soubory cookies třetích stran, které nám pomáhají analyzovat a pochopit, jak náš web užíváte. Tyto soubory cookies budou ve vašem prohlížeči uloženy pouze s Vaším souhlasem. Současně máte možnost se z těchto cookies odhlásit. Odhlášení z těchto souborů cookies však může ovlivnit váš zážitek z užívání webových stránek.
Nezbytné soubory cookies jsou zásadní pro správnou funkci webových stránek. Tyto cookies zajišťují základní a bezpečnostní funkce webu zcela anonymně.
Cookie
Délka
Popis
cookielawinfo-checkbox-analytics
11 měsíců
Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Cookie slouží k ukládání souhlasu uživatele s cookies v kategorii “Analytické”.
cookielawinfo-checkbox-functional
11 měsíců
Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Cookie slouží k ukládání souhlasu uživatele s cookies v kategorii “Funkční”.
cookielawinfo-checkbox-necessary
11 měsíců
Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Cookies slouží k ukládání souhlasu uživatele s cookies v kategorii “Nezbytné”.
cookielawinfo-checkbox-others
11 měsíců
Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Cookie slouží k ukládání souhlasu uživatele s cookies v kategorii “Ostatní”.
cookielawinfo-checkbox-performance
11 měsíců
Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Cookie slouží k ukládání souhlasu uživatele s cookies v kategorii “Výkonnostní”.
PHPSESSID
relační
Tato cookie je nativním prvkem aplikací PHP. Tento soubor cookie se používá k ukládání a identifikaci jedinečného ID relace uživatele za účelem správy relace uživatele na webových stránkách.
viewed_cookie_policy
11 měsíců
Cookies jsou nastaveny pluginem GDPR Cookie Consent. Cookie slouží k ukládání informace, zda uživatel udělil souhlas s použitím cookies. Neukládá žádné osobní údaje.
Funkční soubory cookies pomáhají provádět funkce, jako je například sdílení obsahu webových stránek na sociálních sítích, sbírání zpětné vazby a další funkce třetích stran.
Cookie
Délka
Popis
language
relační
Tato cookie zaznamenává jazykové preference uživatele.
sb
2 roky
Tuto cookie používá společnost Facebook pro zapamatování si jazykových preferencí uživatele, kontrole funkcí a sdílených stránek.
sp_landing
1 den
Tuto cookies používá společnost Spotify za účelem implementace zvukového obsahu a také k zaznamenání informací o interakcích uživatele souvisejících s obsahem.
sp_t
1 rok
Tuto cookies používá společnost Spotify za účelem implementace zvukového obsahu a také k zaznamenání informací o interakcích uživatele souvisejících s obsahem.
wordpress_logged_in_*
14,5 dne
Cookie slouží k autorizaci přihlášení
wordpress_sec_*
14,5 dne
Cookie slouží k autorizaci přihlášení
wordpress_test_cookie
wpj_is_logged_in
14,5 dne
Cookie slouží k informaci, zda je uživatel přihlášený
Analytické soubory cookies slouží k pochopení interakce mezi návštěvníky a webem. Tyto soubory cookies poskytují informace o statistikách, počtech návštěvníků, míře okamžitých odchodů, zdroji návštěvnosti atd.
Cookie
Délka
Popis
_ga
2 roky
Tuto cookies používá společnost Google jako uživatelské ID, na základě kterého generuje statistická data o užívání stránek uživatelem.
_gat
1 den
Tuto cookies používá společnost Google k omezování počtu požadavků k omezení sběru dat na stránkách s vysokou návštěvností.
_gid
1 den
Tuto cookies používá společnost Google jako uživatelské ID, na základě kterého generuje statistická data o užívání stránek uživatelem.
_hjAbsoluteSessionInProgress
30 minut
Tato cookie počítá, kolikrát byla webová stránka navštívena různými návštěvníky. Tento proces je prováděn přidělením unikátního identifikátoru každému návštěvníkovi, aby nebyl do součtu zaregistrován dvakrát.
_hjFirstSeen
30 minut
Určuje, zda návštěvník tuto webovou stránku v minulosti již navštívil, nebo se jedná o nového návštěvníka.
_hjid
365 dní
Nastavuje unikátní identifikátor pro danou relaci. Tímto způsobem získává webová stránka data o návštěvníkově chování pro statistické účely.
_hjIncludedInPageviewSample
2 minuty (prodlužováno o 30 sekund)
Určuje, zda by měl být uživatelův pohyb registrován v určitém statistickém zástupném symbolu.
_hjIncludedInSessionSample
2 minuty (prodlužováno o 30 sekund)
Registruje data o návštěvníkově chování na webové stránce. Data jsou použita pro interní analýzu a optimalizaci stránky.
_hjIncludedInSessionSample
2 minuty (prodlužováno o 30 sekund)
Určuje, zda by měl být uživatelův pohyb registrován v určitém statistickém zástupném symbolu.
_hjRecordingEnable
relační
Tato cookie se používá pro identifikaci návštěvníka a optimalizaci relevance reklam pomocí sbírání dat o návštěvníkovi z několika webových stránek. Tato výměna dat o návštěvníkovi je obvykle zprostředkována datovým centrem či reklamní výměnou třetích stran.
_hjRecordingLastActivity
relační
Nastavuje unikátní identifikátor pro danou relaci. Tímto způsobem získává webová stránka data o návštěvníkově chování pro statistické účely.
_hjRecordingLastActivity
Soubor cookie, který obsahuje data aktuální relace.
_hjTLDTest
relační
Registruje statistická data o návštěvníkově chování na webové stránce. Data jsou použita pro interní analytiku provozovatelem webové stránky.
CONSENT
2 roky
Tuto cookies používá společnost YouTube k ukládání prostřednictvím embeddovaných videí a využívá je k získávání anonymizovaných statistických údajù.
hjViewportId
relační
Nastavuje unikátní identifikátor pro danou relaci. Tímto způsobem získává webová stránka data o návštěvníkově chování pro statistické účely.
Vuid
2 roky
Tuto cookies používá společnost Vimeo k ukládání statistických údajů o používání uživatelem, včetně informací o stránkách, které byly zobrazeny.
Reklamní soubory cookies se používají k poskytování relevantních reklam a marketingových kampaní návštěvníkům. Tyto soubory cookies sledují návštěvníky na různých webových stránkách a shromažďují informace za účelem poskytování reklam přizpůsobených na míru.
Cookie
Délka
Popis
_fbp
3 měsíce
Tuto cookies používá společnost Facebook a slouží k sledování Vašich návštěv.
fr
3 měsíce
Tuto cookies používá společnost Facebook a slouží k zobrazování reklamy v rámci inzertního systému této společnosti
NID
6 měsíců
Tuto cookies používá společnost Google a slouží k omezení zobrazení reklamy uživateli, ztlumení nežádoucí reklamy a měření účinnosti reklam.
VISITOR_INFO1_LIVE
6 měsíců
Tuto cookies používá společnost Youtube a slouží k měření a určení zobrazení rozhraní přehrávače.
YSC
relační
Tuto cookies používá společnost Youtube a slouží k měření a sledování Vaší interakce.
yt-remote-connected-devices
Neomezené
Tuto cookies používá společnost Youtube a slouží ji k získávání informací o nastavení při užívání YouTube přehrávače.
yt-remote-device-id
Neomezené
Tuto cookies používá společnost Youtube a slouží ji k získávání informací o nastavení při užívání YouTube přehrávače.
yt.innertube::nextId
Neomezené
Tuto cookies používá společnost Youtube a slouží k zaznamenání informací o tom, jaká videa uživatel viděl.
yt.innertube::requests
Neomezené
Tuto cookies používá společnost Youtube a slouží k zaznamenání informací o tom, jaká videa uživatel viděl.
Miloš Hamsa Sledovat @miloslavhamsa
Před 8 roky
Vyzkoušeno a píše mi to, že obsah je blokován nebo web není v databázi. Tak nevím, co znamená když je web blokován.
Odpovědět »