Úložiště budoucnosti: Nvidia hledá cestu k rychlosti, která dnes neexistuje
Zatímco grafické čipy dosahují výkonů, které si ještě před pár lety málokdo dokázal představit, úzkým hrdlem vývoje se stává něco méně nápadného – úložiště. Výkon GPU a propustnost pamětí dnes běžně šplhá k terabajtům za sekundu, ale pevná a flashová úložiště zaostávají. Pro výpočetně náročné AI modely, které pracují s obrovským množstvím fragmentovaných dat, je to problém, který Nvidia plánuje řešit radikálně: cílem je překročit hranici 100 milionů IOPS.
100 milionů IOPS: Smělý cíl, kterému nestačí současná technologie
Pro představu – dnešní nejrychlejší SSD disky s rozhraním PCIe 5.0 dosahují rychlosti okolo 14,5 GB/s a 2 až 3 milionů IOPS (Input/Output Operations Per Second), pokud se testují na náhodném čtení malých bloků (typicky 4K nebo dokonce jen 512 bajtů). Ale právě tyto drobné a roztroušené přístupy dominují inferenci umělé inteligence, kdy se data načítají ve vysoké rychlosti z různých míst úložiště.
Nvidia tedy podle CEO společnosti Silicon Motion, Wallace C. Kua, míří výš než kdokoliv předtím. „Jejich aktuálním cílem je 100 milionů IOPS, což je extrémní požadavek,“ uvedl pro Tom’s Hardware.
Zdroj: Shutterstock
Současné technologie nestačí. Přijde změna média?
Pro dosažení takové výkonnosti nestačí jen vylepšit stávající řadiče nebo navýšit počet NAND kanálů. Kromě optimalizace firmwaru a architektury samotných SSD bude pravděpodobně nutná i změna samotného typu paměťového média.
Dříve se pozornost upírala k technologii Intel Optane (3D XPoint), která měla ideální vlastnosti – nízkou latenci, vysokou výdrž, rychlý náhodný přístup. Jenže Intel projekt zrušil a na trhu po něm zůstala mezera, kterou se teď snaží zaplnit jiní hráči.
Společnost Kioxia už připravuje tzv. AI SSD postavený na XL-Flash, což je technologie typu SLC NAND s vyšším výkonem. Očekává se, že tento model překročí hranici 10 milionů IOPS a mohl by být uveden ve stejném časovém rámci jako nová platforma Nvidia Vera Rubin, která má přijít v roce 2026.
Ale i to je podle Kua stále málo. „Kioxia se snaží posílit XL-NAND, SanDisk mluví o High Bandwidth Flash, ale osobně tomu moc nevěřím. Bez něčeho zcela nového to prostě nepůjde,“ dodal.
Výzvy: Latence, cena i spotřeba
K dosažení cíle 100 milionů IOPS bude potřeba kombinace extrémně rychlého přístupu, nízké latence, rozumné spotřeby a nízkých nákladů – a právě tyto vlastnosti se navzájem často vylučují.
Například:
- SLC NAND je rychlá, ale drahá.
- DRAM nebo SCM paměti mají nízkou latenci, ale jsou příliš náročné na spotřebu a kapacitu.
- Nové generace NAND nabízejí hustotu, ale přicházejí se zpožděním.
Na vývoji nových typů nevolatilní paměti pracuje více firem – například Micron, SanDisk a další. Nikdo ale zatím nemá v ruce finální řešení, které by splňovalo všechny podmínky: výkon, rozumnou cenu, odolnost i škálovatelnost.
Co bude dál?
Nvidia zatím drží informace o svém budoucím řešení pod pokličkou, ale z útržků je jasné, že na obzoru je nová generace úložišť určená výhradně pro AI výpočty. Ty budou potřebovat nejen masivní výpočetní sílu, ale především rychlý, nepřetržitý a efektivní přístup k datům.
Zda se podaří včas přijít s novým typem paměti, který umožní překonat současné limity a přiblížit se ke snu o „giga IOPS“ výkonu, ukážou následující měsíce. Jedno je ale jisté: v datových centrech zítřka už nebudou disky jen podpůrným komponentem – stanou se klíčovým faktorem výkonnosti celého systému.