Diskuse k Minipočítač Parallella s 64 jádry: Paralelní výpočty nemusí být otázkou velkých serverů

Pavel Francírek | 24. 4. 2013 - 14:18

45 GHz je od tvůrců taky marketing (když už ne podvod), protože pak by AMD mohlo psát 56GHz (3.5*16) a to nemluvě o tom, že budou úlohy rozhodně lépe škálovat na 16 jádrech než na 64.

Tomáš Bohuněk | 24. 4. 2013 - 16:41

To proto, že jsou psané jako málovláknové. Tohle je dobrý způsob (nenákladný), jak vývojáře přimět laborovat s více vlákny, a nakonec psát silně multivláknové algoritmy, a za to palec hore...

AndyF1 | 24. 4. 2013 - 17:12

Uz sa predsa davno pisu multivlaknove algoritmy ;-).Hlavne tie co ide dobre paralelizovat. Vid GPU akceleracia grafiky, Larabi Cuda, Open CL na GPU, programy na supercomputer clustre a podobne. Vyslovene sekvencne algoritmy sa paralelizovat nedaju. Maximalne bezia viacere naraz=to je uloha OS aby efektivne rozdeloval zataz medzi dostupne jadra.

Trovaricon | 24. 4. 2013 - 18:46

Prosim otvorte si task manager a skontrolujte pocet procesov a ich vlaken - co vam brani napisat 500 vlaknovy algoritmus na jednojadrovom CPU ?
Ak algoritmus nie je 100% datovo nezavisly medzi vlaknami (typicky "GPGPU foreach"), tak paralelizovat ho na 64 vlaken je dost velka hlupost.
Aplikovat nejaky algoritmus na kazdy element pola zvladaju dnesne GPU extremne dobre.

Na domovskej stranke si este vypisu:
"The CPU has an efficient general-purpose instruction set that excels at compute intensive applications while being efficiently programmable in C/C++ without any need to write code using assembly or processor specific intrinsics."
Ok, takze CPU je blackbox a pouzivatel ma len pisat Cckovy kod ? ehm. Co tak rovno sa pustit do C++AMP, OpenCL alebo CUDA, ktore maju realne vyuzitie (je po nich dopyt na trhu)?

Ak sa ma vsak jednat o datovo zavisle vlakna, tak znova nerozumiem na aku vyuku je dobre na ARMv7 s RISC koprocesorom (s boh vie akou instrukcnou sadou) pisat tzv. paralelne programy. To seriozne ocakavaju, ze na CortexA9 dvojjadre sa bude v Eclipse debugovat ? Odhliadnuc od narusenia psychickeho zdravia tych nestastnikov, ktori sa na to podujmu to moze byt aj znacny technicky problem. Ono totiz cela masina ma 1GB RAM > wtf. Ak to niekto planuje vyvijat na x86 PC, tak potom toto zariadenie vobec netreba. Napise, zdebuguje aj sprofiluje algoritmy rovno na danom PC.
Btw samozrejme dalsi kickstarter projekt, ktory ziskal zadarmo reklamu vo vyssej sume nez o aku dokazu osklbat ludi - pocitacovych analfabetov.

Michal Lazo | 24. 4. 2013 - 20:53

oni tam maju 2 jadrovy ARM na obsluhu asi + 64 jadrovu paramelnu svinu co zlada OpenCL alebo neaky ich jazyk.
Skratka kasila ako Tesla masiny: X86 cpu + Tesly(CUDA a opencl,..)

rozdiel je ale v tom ze toto zere par W a par dolacov a ta Tesla zere tak 1kW a stoji 2000$ a viac mam ten pocit

cca to iste planuje nVIDIA alebo sa daju aj na youtube najst uz neake videa

Trovaricon | 24. 4. 2013 - 22:50

Skus seriozne pouzivat Eclipse (vid. stranka vyrobcu: "GNU/Eclipse based tool chain") na Pentium III s 1GB RAM, ktory je zdielany aj pre koprocesor !!! a pochopis o com pisem s tym vykonom ARM-u.

Doska s amd E-350 stoji od 60€ + 15€ za 4GB RAM. Akurat ze tam nikoho nenapadlo na koprocesor (GPU) napisat, ze je to 80 jadrovy "CPU", ktory ma 40GHz (0.5GHz * 80, 80 gflops). Narozriel od tohto "wow riesenia" podporuje ten AMD system DC (C++AMP) aj OpenCL.

Preco to porovnavas s prac.stanicou s Teslou ? Ved ta je vykonom v totalne inej kategorii. To je ako porovnavat vrtulku na dyname z bicykla za zahradou na potoku s jadrovym reaktorom... Toto riesenie len s prizmurenymi ocami mozes porovnavat so spominanym E-350, ktory je navyse x86 (oproti 1GHz A9 je "trochu" vykonnejsi).

AD Tesla:
Ano urcite 1kW - riesenie dlhodobeho chladenia takeho cipu (vzhladom na rozmery) by bolo asi na Nobelovu cenu... Tesly vacsinou zeru menej / porovnatelne (tie s vela RAM) s ich desktopovymi ekvivalentmi.

>"64 jadrovu paramelnu svinu co zlada OpenCL alebo neaky ich jazyk."
Prave o tom pisem, ze to podporuje c/c++ nie openCL. Proste uzavrete riesenie absolutne nevhodne na ucebne ucely. Napisat algoritmus, ktory sa ma aplikovat na kazdy prvok pola vie aj opica po lobotomii (a to DX11 GPU zvladne rovnako dobre ako tento risc). Pri rieseni paralelizovania algoritmov je takato masina uplne nahovno, pretoze nesplna ani parametre testovacieho simulatora. Totiz... ako sa tu simuluje NUMA system ? Zaroven ked 64 vlaken zacne tlacit na pilu tomu (zrejme) jednokanalovemu nahovno (cortex-A9) radicu, tak akademicke vysledky s tymto "omg superpocitac za 2 stovky" budu, ze "j*bat paralelizaciu, singlethread ide rychlejsie"

Ja proste zboznujem tie perly ked sa hardveristi zacnu vyjadrovat o softverovych architekturach.

Skus seriozne pouzivat

Trovaricon https://cdr.cz/profil/trovaricon

24. 4. 2013 - 22:50 https://cdr.cz/clanek/preview-minipocitace-parallella-paralelni-vypocty-pro-kazdeho/diskuse Skus seriozne pouzivat Eclipse (vid. stranka vyrobcu: "GNU/Eclipse based tool chain") na Pentium III s 1GB RAM, ktory je zdielany aj pre koprocesor !!! a pochopis o com pisem s tym vykonom ARM-u. Doska s amd E-350 stoji od 60€ + 15€ za 4GB RAM. Akurat ze tam nikoho nenapadlo na koprocesor (GPU) napisat, ze je to 80 jadrovy "CPU", ktory ma 40GHz (0.5GHz * 80, 80 gflops). Narozriel od tohto "wow riesenia" podporuje ten AMD system DC (C++AMP) aj OpenCL. Preco to porovnavas s prac.stanicou s Teslou ? Ved ta je vykonom v totalne inej kategorii. To je ako porovnavat vrtulku na dyname z bicykla za zahradou na potoku s jadrovym reaktorom... Toto riesenie len s prizmurenymi ocami mozes porovnavat so spominanym E-350, ktory je navyse x86 (oproti 1GHz A9 je "trochu" vykonnejsi). AD Tesla: Ano urcite 1kW - riesenie dlhodobeho chladenia takeho cipu (vzhladom na rozmery) by bolo asi na Nobelovu cenu... Tesly vacsinou zeru menej / porovnatelne (tie s vela RAM) s ich desktopovymi ekvivalentmi. >"64 jadrovu paramelnu svinu co zlada OpenCL alebo neaky ich jazyk." Prave o tom pisem, ze to podporuje c/c++ nie openCL. Proste uzavrete riesenie absolutne nevhodne na ucebne ucely. Napisat algoritmus, ktory sa ma aplikovat na kazdy prvok pola vie aj opica po lobotomii (a to DX11 GPU zvladne rovnako dobre ako tento risc). Pri rieseni paralelizovania algoritmov je takato masina uplne nahovno, pretoze nesplna ani parametre testovacieho simulatora. Totiz... ako sa tu simuluje NUMA system ? Zaroven ked 64 vlaken zacne tlacit na pilu tomu (zrejme) jednokanalovemu nahovno (cortex-A9) radicu, tak akademicke vysledky s tymto "omg superpocitac za 2 stovky" budu, ze "j*bat paralelizaciu, singlethread ide rychlejsie" Ja proste zboznujem tie perly ked sa hardveristi zacnu vyjadrovat o softverovych architekturach. https://cdr.cz/clanek/preview-minipocitace-parallella-paralelni-vypocty-pro-kazdeho/diskuse#comment-651694 +

Trovaricon | 24. 4. 2013 - 23:01

Errata: 30€ za RAM (wtf, riadne zdrazeli...)

Michal Lazo | 25. 4. 2013 - 10:57

pisu tu ze to podporuje openCL
http://www.parallella.org/developers/

1.
ja si nemyslim ze ta ich doska je myslena ako nahrada tesly
ber to tak ze vo vela situaciach potrebujes lowcost lowpower zariadenie
a pre taketo veci je to myslene,
mozno este aj ako neake vyukove zariadenie
podobne ako raspberry pi.

2. v sucastnosti vlastne neexistuje embeded zariadenie ktore podporuje openCL
az tie najnovsie GPU podporuju opencL a moc zariadeni ich nema
v notebooku jedine s ati alebo nvidia gpu, a az najnovsie intel hd 4000

vykon radsej nekomentujem. ale ten vykon na vat moze byt samozrejme zaujimavy

Trovaricon | 25. 4. 2013 - 18:48

Ved prave o pouziti ako vyukoveho zariadenia je tento clanok. Ja som len podotkol, ze ako vyukove zariadenie to stoji za velke H. Ako zo stranky financnej tak aj vykonovej. Rozumej: nie je to zariadenie na development ale na deployment.

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.

CDR.cz - Vybráno z IT

Diskuse k Minipočítač Parallella s 64 jádry: Paralelní výpočty nemusí být otázkou velkých serverů

Komerční sdělení

CDR Hry

Nvidia: CPU v AI končí, jejich potenciál byl vyčerpán. AI není bublinou.

Ryzen 7 9850X3D a Ryzen 9 9950X3D2 stojí na novém křemíku, lépe boostují

Ovladače 590 vypustily podporu Maxwell (GTX 700 / 900), Pascal (GTX 10) a Volta

Černý den pro IT: Micron ukončí výrobu DDR5 a SSD pro PC, značka Crucial zanikne

Zaměstnanci OpenAI věděli, co se chystá. Skupovali zbývající zásoby DDR5

Aktuálně z blogů

Patriot Burst Elite 240GB SATA SSD [Čtenářský blog] - Potřetí

Patriot Burst Elite 240GB SATA SSD [Čtenářský blog] - Pokračování

Testujeme nižší cenovou: Patriot Burst Elite 240GB SATA SSD [Čtenářský blog]

Jsou SMS po smrti? Jak šel čas s mobilními zprávami a kam zmizelo jejich kouzlo

Co si přeji od předělávky Mafia? Vyplnění mezer a čtvrtý díl s Tommyho dcerou