CDR.cz - Vybráno z IT

Archiv internetu se stane i vyhledávačem, nic už nebude zapomenuto

Seznam History 1
Stroj času na adrese archive.org vás přenese do dob, kdy byl internet ještě pískovištěm pro pár vyvolených, ale nejen to. Jedná se o unikátní databázi webových stránek a toho, jak se měnily s čase. Brzy se služba konečně naučí vyhledávat.

Jestliže se Google snaží o dostupnost informací pro každého, Internet Archive si pro změnu klade za cíl co nejvíce informací zachovat. Služba s příhodným názvem Wayback Machine zjednodušeně řečeno vytváří otisky webových stránek v čase. Podívat se tak např. můžete, o čem jsme psali přesně před 10 lety a jak tehdá náš magazín vypadal.

Cdr Historie

Vedle záznamu webových stránek provozuje archive.org i obsáhlý archiv hudby, videa, softwaru či her. Na obrázku CDR.cz 29.10.2005

I kdyby stránky které služba otiskla byly smazány, bude je možné dohledat alespoň v archivu. Archiv má však zatím jeden podstatný nedostatek - můžete v něm zadat určitý den u konkrétní stránky (URL), ale nelze v něm hledat informace jako jsme zvyklí třeba na Google. Navíc, pokud se URL stránek změní, je v tuto chvíli dohledávání problém.

Internet Archive se proto rozhodl inovovat. Vedle přidání fulltextového vyhledávání se můžeme těšit na nové uživatelské rozhraní a vylepšení způsobu zachytávání stránek. Internetový archiv je dnešní době, kdy vzniká i zaniká obrovské množství informací každý den, nesmírně hodnotným počinem.

Seznam History

V tuto chvíli se Wayback Machine podílí např. na nahrazování "mrtvých" odkazů na Wikipedii. Nahrazuje nefunkční odkazy URL směřujícími na otisky, které služba v minulosti udělala. I přes fakt, že je cílový web vypnutý, mohou být informace z něj opět nalezeny.

Zálohovat internet je nemožné, ale částečně to jde

Za 19 let svého provozu služba zaznamenala přes 439 milionů stránek. Do roku 2017, kdy má funkce vyhledávání přibýt, jich bude ještě více. Na vylepšení získali tvůrci grant 1,9 milionu dolarů (cca 50 milionů korun) a my už se těšíme, až si budeme historii nejen pasivně prohlížet, ale budeme moci navíc vyhledávat zapomenuté informace ze zapomenutých zákoutí internetu.

Lukáš Voříšek (Google+)

Šéfredaktor nového technologického magazínu inSmart.cz. Autor je fanouškem revolučních technologií a projektů, jako je fotoaparát Lytro a minipočítač Raspberry Pi. Dříve přispíval do magazínů PCTuning a Stahuj. S nadějí čeká na den, kdy nebude muset sedět u klávesnice a vše obstará čip v hlavě...

více článků, blogů a informací o autorovi

Diskuse ke článku Archiv internetu se stane i vyhledávačem, nic už nebude zapomenuto

Sobota, 31 Říjen 2015 - 00:43 | tony | Opravdu tam lze najit vse z historie? A co "...
Pátek, 30 Říjen 2015 - 23:27 | Daniel Křenský | Pokud existuje "Out there" inteligentní...
Pátek, 30 Říjen 2015 - 16:51 | Damel | Děkuji za odpověď a za v podstatě dobré zprávy....
Pátek, 30 Říjen 2015 - 10:37 | Jiří Molnár | Vím o tom Damele. Věř, že urguji opravu těch...
Pátek, 30 Říjen 2015 - 00:06 | trodas | <i>On by se net zlohovat i dal...</i...
Pátek, 30 Říjen 2015 - 00:02 | Damel | Chybí jednoduchý vzhled, chybí kvalitní obsah,...
Čtvrtek, 29 Říjen 2015 - 20:51 | JVc | On by se net zlohovat i dal, kdyby nebyly stranky...
Čtvrtek, 29 Říjen 2015 - 19:50 | HKMaly | Samozrejme ze cely internet zazalohovat nejde....
Čtvrtek, 29 Říjen 2015 - 14:21 | Derryk | Koukám, že nejsem sám komu starý jednoduchý...
Čtvrtek, 29 Říjen 2015 - 11:53 | Tomas A | ...a stránka mala 20 kB a nie 5 MB :(

Zobrazit diskusi