CDR.cz - Vybráno z IT

Otec internetu: Co bude s daty za pár let, přečteme je ještě vůbec?

human-data
Lidstvo denně vytvoří ohromné množství dat. Podle Vintona Gray Cerfa, jednoho z tvůrců TPC/IP protokolu, možná brzy nastane doba, kdy nebudeme schopni uložené informace přečíst, nebo spíše správně interpretovat. Budeme muset znovu objevovat „ztracené jazyky“?

Když americký informatik Vinton Gray Cerf společně s Bobem Kahnem pracoval na komunikačním protokolu TCP/IP, určitě neměl tušení, jaké v celosvětové síti nalezne obrovské uplatnění. Čas plyne a vedle ocenění Turingovou cenou a zaměstnání u vyhledávacího giganta Google se „otec internetu“ sem tam rád zamyslí nad zajímavým problémem současné informatiky.

646px-Vint_Cerf,_Bangalore_2007_3

Naposledy se zmínil o faktu, že většina dat, které jsme kdy vytvořili, bude v budoucnu jen nesmyslnou snůškou nul a jedniček. Všechny dnes vytvořené dokumenty, tabulky, prezentace a spoustu dalších specifických digitálních informací prý nebudeme v horizontu desítek až stovek let zkrátka schopni přečíst. Podle Cerfa není takovým problémem ani samotné uložení dat, jako jejich následná interpretace a čtení i po letech.

K ilustraci si vybral nepříliš šťastný příklad, kdy na svém Macintoshi spustil MS Office 2011 a nebyl v něm schopen otevřít PowerPoint prezentaci z verze 1997. „Program zkrátka nevěděl o co se jedná. Nevyčítám to Microsoftu, říkám jen to, že zpětnou kompatibilitu je velmi těžké zachovat.“

solve-big-data-problems-239x300

Data dávají smysl jen tehdy, když máme po ruce software, který je schopný je správně interpretovat. Nehrozí podle něj tedy ani tak ztráta uložených dat, jako postupná absence správných programů k jejich interpretaci. A rozhodně se to netýká jen  prezentací. Vědecká komunita shromažďuje obrovské množství výstupů ze simulací a nejrůznějších měření. Právě u těchto informací je nesmírně důležité pečlivě vyplňovat metadata, která nám v budoucnu řeknou, jak byla daná informace získána, jak byl nastavený měřící přístroj apod.

knihovna_stara

Podle Vintona Cerfa je zapotřebí i lepší dlouhodobé médium, tedy jakási digitální obdoba pergamenu, která přežije dlouhé věky. Podle nás to ale neřeší problém o kterém se zmiňuje, a tím je správná interpretace informací. V historii však máme spoustu zmínek o nalezených textech v neznámém jazyce, kdy si jazykovědci zkrátka museli dát tu práci a znovu objevit způsob, jak vše správně přečíst.

Podobně to možná bude za několik desítek až stovek let s našimi daty. Uložená budou na „pergamenu“ poměrně bezpečně, ale jak je přečíst, to bude nutné znovu objevit...

Lukáš Voříšek (Google+)

Šéfredaktor nového technologického magazínu inSmart.cz. Autor je fanouškem revolučních technologií a projektů, jako je fotoaparát Lytro a minipočítač Raspberry Pi. Dříve přispíval do magazínů PCTuning a Stahuj. S nadějí čeká na den, kdy nebude muset sedět u klávesnice a vše obstará čip v hlavě...

více článků, blogů a informací o autorovi

Diskuse ke článku Otec internetu: Co bude s daty za pár let, přečteme je ještě vůbec?

Pátek, 7 Červen 2013 - 20:40 | Nick | Při dnešních velikostí souborů by klidně mohl být...
Pátek, 7 Červen 2013 - 07:57 | randomofamber | Takové stránky neexistují. Ano je spousta stránek...
Čtvrtek, 6 Červen 2013 - 21:08 | Tom27 | takove www stranky existujou jsou jich mraky a...
Čtvrtek, 6 Červen 2013 - 16:10 | HKMaly | Univerzalni format je nesmysl. Klicove je...
Čtvrtek, 6 Červen 2013 - 15:58 | HKMaly | Ten tvuj plaintext je ASCII, kdyz se ztrati ASCII...
Čtvrtek, 6 Červen 2013 - 15:51 | HKMaly | No a nebo staci vynalezt FTL pohon, nalozit na...
Čtvrtek, 6 Červen 2013 - 10:23 | Milan Tomka | MICROSOFTU bych to vycital. Nema ani cenu pocitat...
Čtvrtek, 6 Červen 2013 - 09:41 | maruširi | "Uz NIKDY nebude mozne podruhe zmerit...
Čtvrtek, 6 Červen 2013 - 09:19 | randomofamber | To chce univerzální formát. Ten by v sobě nesl...
Čtvrtek, 6 Červen 2013 - 09:00 | Jan Tulak | Tak nějak nemůžu nevzpomenout na Asimovu Nadaci....

Zobrazit diskusi