CDR.cz - Vybráno z IT

Diskuse k Otec internetu: Co bude s daty za pár let, přečteme je ještě vůbec?

Pokud data nejsou dost důležitá (využívaná, hlídaná) na to, aby je někdo udržoval v aktuálním formátu, jaká je pravděpodobnost, že budou někdy později opravdu k něčemu užitečná?

Užitečná v jiném smyslu, než že za 100 let si někdo získá grant na rozluštění hdd z roku 2000, zjistí, že je tam spousta faktur a spokojeně se na to zase zapomene, hlavně že se propálily prachy :)

zrovna vědecká data jsou relevantní, jen dokud přístroje které je měří a zapisují jsou přijímány jako to pravé co na tu veličinu máme, jakmile je nahradí jiný lepší přístroj, všechna ta stará data jsou víceméně jen historický pohled.

to srovnání se starými jazyky je takové podobné, protože je jasné, že když 20let tesali do skály nápis, tak pak už nikdo neměl chuť se drbat s přepisování, když už věřili v něco jiného

+1
-1
-1
Je komentář přínosný?

Grant nebude na rozlusteni jednoho HDD. Grant bude na jeden format. Vysledkem (pokud se to povede) lusteni bude software, ktery se pote pusti na 200TB dat, vyplivne ze 100TB jsou nejaky jiny format a zbytek prevede do neceho moderniho, coz se nacpe do vyhledavaci AI.

A veda je napriklad i astronomie. Uz NIKDY nebude mozne podruhe zmerit supernovu, ktera nekdy ted zrovna vybuchne. Jeste dneska jsme vdecni za astronomicka data sesbirana cinany pred 1000 lety, protoze nam pomahaji odhalit, ktere komety jsou nove a ktere tu uz byli.

Nebo takova data o klimatu. Na globalnim oteplovani si budou delat studenti doktoraty jeste peknych par stoleti ... (vcetne studentu politologie; konecne, ten klimaticky fenomen je jednoduchy ve srovnani s tim, kolik politiky kolem vzniklo aby se mohli konkretni firmy na obou stranach barikady napakovat ...).

A na zaver: mozna vas to prekvapi, ale egyptane nebyli lini prepisovat jmena faraonu vytesana do pyramid.

PS: Ja bych to microsoftu vycital. Ano, zpetna kompatibilita stoji urcitou praci, ale kdyby to neprasili, tak ten format treba vykresli s chybami v zarovnavani ale vykresli. Jenze to by se formaty nesmeli identifikovat hashem DLL co je umi precist napriklad ...

+1
+3
-1
Je komentář přínosný?

"Uz NIKDY nebude mozne podruhe zmerit supernovu..." - nesouhlasím, časoprostor se už kdysi rozpínal rychleji, než je rychlost světla v něm, a může si to klidně zopakovat. Pak bychom si mohli v pohodě přemeřit všechny supernovy znova.

+1
-5
-1
Je komentář přínosný?

No a nebo staci vynalezt FTL pohon, nalozit na nej teleskop a poslat ho predhonit to svetlo ze ... IMHO je levnejsi lusteni toho formatu :-).

+1
-12
-1
Je komentář přínosný?

To co je dolezite dnes, nemusi byt dolezite zajtra.
To co je dolezite zajtra, nemusi byt dolezite dnes.

your argument is invalid.jpg

+1
0
-1
Je komentář přínosný?

Ja bych nebyl takovy pesimista. Dokud se bude darit lamat sifry producentu filmu a her a psat emulatory ... dneska jsou emulatory na spoustu pocitacu co jsou davno ve srotu.

+1
-11
-1
Je komentář přínosný?

Při dnešních velikostí souborů by klidně mohl být emulátor součástí file. Nebo alespoň nějaká forma logické šablony. Koneckonců existují RAW datové soubory (nejznámější jsou fotky) a tam vůbec není dekódovací postup, spoléhá se na aktuální znalost algoritmu pár firem. Čili tam by to taky chtělo navěsit nějaký, zatím redundantní klíč.

+1
-3
-1
Je komentář přínosný?

Teoreticky se to muze stat se binarnimi formaty jako pdf, stary doc a podobne. Ale dnes uz je vicemene vse v plaintextu, az na pdf, ktere se asi zas tak moc nepouziva pro ukladani. Stejne je nekde zdroj ze ktereho to pdf bylo vytvoreno a to je v plaintextu. Teoreticky by mohl byt problem s obrazovyma formatama, ale i tam kde je to vazne zapotrebi, tak to bude v nejakem raw formatu. Ale fakt to problem byt muze. V soucasne dobe je 99% vsech dat jenom odpad typu youtube, facefuck a podobne ..... ale o to 1% bude par exabajtu skutene relevantnich dat, ktere bude treba nejak archivovat a uchovat ..... dneska je to OK, je to nekde na discich, paskach, maximalne nejakych 10-20 let co skutecne zacaly pocitace .... ale za 100-200 let to nepujde precist .... a pokud nahodou jo, tak uz nebudou pocitace v kterych to precist, nebude se vedet jaky to byl filesystem a podobne .....
Z filozofickeho hlediska je to vazne velmi zajimava otazka. Driv se to nekde napsalo do kroniky a slo to precist i za dva tisice let .... na HDD nebo CD to uz za 10-20 let neprecte nikdo ..... a kdyby jo, tak tomu uz treba nikdy neporozumi. Samozrejme se pokrok nezastavi, pro vyvoj jsou relevantni data tak max 10 let nazpatek. Ale treba i blbe pocasi nebo zpravy, pokud se ta informace nebude prubezne a naveky updatovat, tak proste zanikne, protoze vetsina z toho nikdy nebyla nikde vytistena .... z toho je mi smutno:)

+1
-4
-1
Je komentář přínosný?

Ten tvuj plaintext je ASCII, kdyz se ztrati ASCII ... ale to se snad neztrati. A pdf je vicemene zazipovany plaintext, zip je s nami taky dost dlouho. Horsi jsou slozitejsi formaty jako zminene video, CAD a jina 3D data ...

Driv se v podstate nic nezapisovalo. Mnozstvi informace vygenerovane pred 20 stoletim je zanedbatelne. Precist exabyte kronik se da leda teoreticky, kdyz je to psane rucne tak to musi lustit clovek, dnesni digitalni formaty alespon JDOU updatovat.

+1
-8
-1
Je komentář přínosný?

Tak nějak nemůžu nevzpomenout na Asimovu Nadaci. Napsal ji sice někdy v padesátých letech, ale problém velkého množství starých dat tam zmiňuje. :)

+1
-1
-1
Je komentář přínosný?

To chce univerzální formát. Ten by v sobě nesl informaci o tom jak se reprodukovat. Něco "podobného", jako vzkaz ze země od SETI viz http://seti.czechnationalteam.cz/seti/vzkaz.html . Problém ovšem je jak zjistit jak přečíst onu specifikaci formátu...

Jinou možností by bylo vytvořit aplikaci v podobě www stránek, které by byly dostupné všem zdarma (dotovaný provoz všemi státy světa). Tato stránka by obsahovala převodníky všech "starých" formátů na "nové". Je jasné, že by bylo nezbytné vynucovat, aby každý nový formát byl otevřený tedy zveřejněná specifikace. Bude-li pro daný formát známa specifikace, pak lze kdykoliv vytvořit interpretr nebo převodník... Mimo jiné, jestli si dobře pamatuji, tak Microsoft zveřejnil specifikace starých formátů, takže sice nové M$ Office už možná daný formát nepodporují, ale lze na daný formát vytvořit prohlížeč nebo převodník...

No a další ne zcela ideální možností je data postupně neustále převádět do nových formátů. Data pak samozřejmě nesmí být ve ztrátovém formátu, což je náročné na objem dat hlavně u multimédií (obrázky, zvuk, video). Což mě připomíná, že bych rád zeptal. Jaký je aktuálně nejlepší bezeztrátový formát pro Video? Převádění dat má tu nevýhodu, že když je nějaká specifická aplikace např. CAD a její autoři s aplikací skončí, pak není kam převádět a pokud neexistuje otevřený formát, pak jste nahraní musíte danou aplikaci používat co to jde a nebo vše překreslit do jiné CAD aplikace, kde ovšem může nastat za nějakou dobu stejný případ. To nás vrací k tomu, že je nutné vynucovat otevřené formáty a nejlépe kombinovat s onou zmíněnou dotovanou stránkou, která by se starala o zachování možnosti interpretace.

Vím, že USA má sklad "všech" dosud vyrobených počítačů, od každého typu jeden funkční kus i s příslušným rozhraním (např. malá TV coby výstup nebo kazeťák) a totéž se snaží dělat s aplikacemi. To proto, aby byli schopni interpretovat případná nalezená data či aplikace. Viděl jsem na to pořad, kde chlápek vytáhl náhodně něco starého zaprášeného (samo, že zabalené) a podařilo se mu to rozchodit, tedy mu najel OS a nějaký příkazový řádek jako to bylo na 8-bitech (něco jako PMD)... Mají na to speciálně vyhrazenou budovu, sklady a lidi. Prostě vědí, že elektronická data stárnou nejen fyzicky, ale i vývojově...

+1
-9
-1
Je komentář přínosný?

Univerzalni format je nesmysl. Klicove je skutecne mit ke kazdemu formatu otevrenou specifikaci, ktera bude napsana ve formatu, ke kteremu mame otevrenou specifikaci, ktera ... a tenhle retez musi koncit u neceho co umime precist.

Ztratovy format neni tak velky problem jak se zda: vetsina formatu videa je zalozena na DCT (diskretni cosinova transformace) a pri prevodu mezi jednim formatem zalozenym na DCT a jinym formatem zalozenym na DCT dochazi ke ztrate pouze proto, ze je prevodni software odflaknuty - nebo samozrejme kdyz snizite bitrate. Novejsi formaty jsou sice zalozene na waveletech, ale IMHO bude pro DCT porad vyuziti, protoze je rychlejsi. Bezeztratovy format na video je pitomost.

Skladovat HW je pitomost. Driv nebo pozdeji se rozbije. Samozrejme treba s magnetofonem se neda nic jineho delat, ale s pocitacem ano: dulezite je skladovat emulatory. Nepotrebujes fyzicke ZX spektrum, kdyz mas software, ktery emuluje ZX spektrum na PC (a to PC).

+1
-6
-1
Je komentář přínosný?

takove www stranky existujou jsou jich mraky a umi zdarma prevadet ruzne stare ci nove formaty myslim, ze kdyby si ten pan vynalezce internetu vyndal hlavu ze zadku tak by je nasel a svuj powerpointovy dokument prevedl bez problemu na dnesni verzi, ale to by pak nemel namet na chytrou prednasku...

+1
+3
-1
Je komentář přínosný?

Takové stránky neexistují. Ano je spousta stránek, co umí převádět zdarma různé formáty, ale je to nekoncepční, roztříštěné. Mnohé stránky pak převádět neumí a konverze formátů jako wmf, emf, cdr a další, které dopadají úděsně. A co se týká známých formátů řekněme dokumenty doc, docx, odt či pdf? To aby člověk pohledal než se mu povede najít převodník, který provede použitelnou konverzi...

+1
-6
-1
Je komentář přínosný?

MICROSOFTU bych to vycital.
Nema ani cenu pocitat kolik casu a usili mne stoji kdyz vemu starsi prezentaci a musim opravovat spatne prevedenu diakritiku a atd.

Chyba nevznikla pouzitim dvou ruznych verzi PowerPointu, ale tim ze prezentace byla jednou vytvorena pod Windows 98 SE a druha prezentace byla vytvorena po Windows XP. Powerpoint byl porad ten stejny.

+1
-10
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.