Otec internetu: Co bude s daty za pár let, přečteme je ještě vůbec?
Když americký informatik Vinton Gray Cerf společně s Bobem Kahnem pracoval na komunikačním protokolu TCP/IP, určitě neměl tušení, jaké v celosvětové síti nalezne obrovské uplatnění. Čas plyne a vedle ocenění Turingovou cenou a zaměstnání u vyhledávacího giganta Google se „otec internetu“ sem tam rád zamyslí nad zajímavým problémem současné informatiky.
Naposledy se zmínil o faktu, že většina dat, které jsme kdy vytvořili, bude v budoucnu jen nesmyslnou snůškou nul a jedniček. Všechny dnes vytvořené dokumenty, tabulky, prezentace a spoustu dalších specifických digitálních informací prý nebudeme v horizontu desítek až stovek let zkrátka schopni přečíst. Podle Cerfa není takovým problémem ani samotné uložení dat, jako jejich následná interpretace a čtení i po letech.
K ilustraci si vybral nepříliš šťastný příklad, kdy na svém Macintoshi spustil MS Office 2011 a nebyl v něm schopen otevřít PowerPoint prezentaci z verze 1997. „Program zkrátka nevěděl o co se jedná. Nevyčítám to Microsoftu, říkám jen to, že zpětnou kompatibilitu je velmi těžké zachovat.“
Data dávají smysl jen tehdy, když máme po ruce software, který je schopný je správně interpretovat. Nehrozí podle něj tedy ani tak ztráta uložených dat, jako postupná absence správných programů k jejich interpretaci. A rozhodně se to netýká jen prezentací. Vědecká komunita shromažďuje obrovské množství výstupů ze simulací a nejrůznějších měření. Právě u těchto informací je nesmírně důležité pečlivě vyplňovat metadata, která nám v budoucnu řeknou, jak byla daná informace získána, jak byl nastavený měřící přístroj apod.
Podle Vintona Cerfa je zapotřebí i lepší dlouhodobé médium, tedy jakási digitální obdoba pergamenu, která přežije dlouhé věky. Podle nás to ale neřeší problém o kterém se zmiňuje, a tím je správná interpretace informací. V historii však máme spoustu zmínek o nalezených textech v neznámém jazyce, kdy si jazykovědci zkrátka museli dát tu práci a znovu objevit způsob, jak vše správně přečíst.
Podobně to možná bude za několik desítek až stovek let s našimi daty. Uložená budou na „pergamenu“ poměrně bezpečně, ale jak je přečíst, to bude nutné znovu objevit...