Je všeobecne známe, že za posledných 30 rokov, odkedy sa začalo masívne rozširovanie počítačov pre bežných ľudí, dosiaha výpočtová technika neuveriteľný nárast výkonu. Je to akceptovaný fakt, ale málokto si dokáže pod týmto tvrdením predstaviť niečo konkrétne. V tomto článku by som teda chcel demonštrovať na zrozumiteľnejších číselných údajoch, k akému pokroku došlo vo výkone počítačov.
Ako rámec použijem počítačové komponenty, ktoré som sám vlastnil a vlastním, a teda mám s nimi osobnú skúsenosť, zároveň u tých starších komponentov sa jedná o v tej dobe veľmi rozšírené produkty
Začneme procesormi, ktoré sú základom každého počítača. Na porovnanie použijem svoj prvý procesor, ktorým bol Intel 486 DX4 100 MHz a porovnám ho so svojim súčasným procesorom AMD Ryzen 9 5950X. Dnes už síce existujú aj výkonnejšie procesory, ale chcel som zostať u hardware, s ktorým mám osobnú skúsenosť a tento procesor sa stále považuje za veľmi výkonný.
----------
Základné porovnanie procesorov:
Intel 486 DX4 100 MHz (1994)
Počet jadier: 1
Taktovacia frekvencia: 100 MHz
Počet tranzistorov: 1,6 milióna
Výrobný proces: 800 nm (nanometrov)
Inštrukcie za cyklus (IPC): 1 (veľmi základné schopnosti spracovania)
Architektúra: 32-bitová
Výpočtový výkon: približne 20-30 MFLOPS (miliónov operácií za sekundu)
----------
AMD Ryzen 9 5950X (2020)
Počet jadier: 16 (32 vlákien)
Taktovacia frekvencia: 3,4-4,9 GHz (34-49x rýchlejší takt)
Počet tranzistorov: 4,15 miliardy (asi 2600-násobne viac)
Výrobný proces: 7 nm (115-krát menší)
Inštrukcie za cyklus (IPC): Omnoho vyššie, moderné procesory dokážu spracovať viac inštrukcií súčasne
Architektúra: 64-bitová
Výpočtový výkon: približne 1 TFLOPS (bilión operácií za sekundu)
----------
Odhad výkonnostného rozdielu:
FLOPS (Floating Point Operations per Second):
486 DX4: približne 20-30 MFLOPS
Ryzen 9 5950X: okolo 1 TFLOPS (1000 miliárd FLOPS)
Výsledok: Ryzen 5950X je približne 33 000 až 50 000-krát výkonnejší len z pohľadu hrubého výpočtového výkonu!
Počet jadier a multithreading:
486 DX4: 1 jadro, bez multithreadingu
Ryzen 9 5950X: 16 fyzických jadier a 32 vlákien (hyper-threading), čo umožňuje vykonávať viac operácií súčasne.
Frekvencia a efektivita:
486 DX4 mal frekvenciu 100 MHz, zatiaľ čo moderné Ryzen procesory bežia pri frekvenciách okolo 3,4-4,9 GHz, čo je až 49-násobne vyššia frekvencia.
Moderné procesory sú omnoho efektívnejšie, vedia spracovať oveľa viac inštrukcií na takt.
Výrobná technológia:
Procesory ako 486 DX4 boli vyrábané 800 nm procesom, zatiaľ čo Ryzen 5950X využíva pokročilý 7 nm proces. To znamená, že moderné procesory sú oveľa menšie a výkonnejšie, pričom spotrebujú menej energie na rovnaký výkon.
Záver:
Z pohľadu výkonu je AMD Ryzen 9 5950X približne 33 000 až 50 000-krát výkonnejší než môj starý 486 DX4. Navyše, pokrok v počte jadier, frekvencii, efektivite a možnosti multithreadingu výrazne zvyšuje reálny výkon. Ryzen 5950X dokáže zvládnuť omnoho náročnejšie výpočty, vrátane videa, hier a simulácií, ktoré by boli na 486 úplne nemožné.
Až pri porovnaní konkrétnych čísiel je dobre viditeľné, že technologický pokrok a nárast výkonu za posledných 30 rokov je obrovský!
A čo grafické karty?
Čo sa týka výkonu, nemôžme zabudnúť na druhý komponent počítačov, ktorého nárast výkonu je dokonca ešte väčší ako u procesorov, a tým sú grafické karty. Opäť použijem komponenty, ktoré som vlastnil, a to jednu z mojich prvých grafických kariet, ktorá bola vo svojej dobe veľmi obľúbená, Riva TNT2. Porovnáme ju s mojou novou grafickou kartou GeForce RTX 4070 Super. Tá je v súčasnej dobe považovaná za jednu z najlepších grafických kariet v pomere cena/výkon.
Základné porovnanie:
Riva TNT2 (1999):
Taktovacia frekvencia: 125 MHz
Počet tranzistorov: 15 miliónov
VRAM: 32 MB SDRAM
Shader Units: Nemala špeciálne jednotky pre programovateľné shadery (vtedy sa používal fixed pipeline)
DirectX: Podpora do DirectX 6
----------
GeForce RTX 4070 Super (2023):
Taktovacia frekvencia: približne 2500 MHz (20x vyššia)
Počet tranzistorov: cez 35 miliárd (asi 2300-násobok)
VRAM: 12 GB GDDR6X (približne 384-násobok)
Shader Units (CUDA Cores): 5888 (TNT2 nemala žiadne moderné shader jednotky)
DirectX: Podpora DirectX 12 Ultimate
Odhad výkonnostného rozdielu:
----------
Hrubá výpočtová sila (Floating Point Operations per Second - FLOPS):
TNT2: okolo 480 MFLOPS (milióny operácií za sekundu)
RTX 4070 Super: okolo 29 TFLOPS (bilióny operácií za sekundu)
Výsledok: RTX 4070 Super je približne 60 000-krát výkonnejšia len z pohľadu FLOPS.
----------
Pixel Fillrate (koľko pixelov je karta schopná spracovať za sekundu):
TNT2: približne 250 Mpix/s
RTX 4070 Super: okolo 280 Gpix/s (1 120-násobne viac)
----------
Pamäťová priepustnosť (ako rýchlo karta dokáže spracovať dáta z pamäte):
TNT2: približne 2,9 GB/s
RTX 4070 Super: okolo 504 GB/s (približne 170-násobne viac)
----------
Záver porovnania:
Ak sa na to pozrieme z rôznych aspektov, nová karta RTX 4070 Super je tisíce až desaťtisíce násobne výkonnejšia ako stará Riva TNT2. V hernom svete je to obrovský skok, ktorý umožňuje hranie moderných hier v 4K rozlíšení s vysokými snímkami, zatiaľ čo TNT2 bola schopná zvládať hry v rozlíšeniach okolo 640x480 až 1024x768 pri omnoho nižšej kvalite grafiky. To je teda obrovský technologický pokrok.
----------
V súvislosti s výsledkami porovnania týchto priepastných výkonnostných rozdielov ma napadla otázka, aká je vlastne hranica teoreticky dosiahnuteľného výkonu počítačov. No nie z pohľadu maximálnej hranice, ale skôr hranice, kedy už zvyšovanie výkonu nebude mať pre bežného užívateľa význam. Pre pochopenie, už dnes sme túto hranicu dosiahli napríklad u internetového prehliadania, v dnešnej dobe sú počítače tak výkonné, že nás pri surfovaní po internete hardware už vôbec neobmedzuje. Určité obmedzenia stále zostávajú v oblasti videa a hier, ale postupne sa dostávame aj k prekonaniu týchto obmedzení. Napríklad u videa je dnes na vrchole zobrazovacej škály 8K rozlíšenie, ale aj to je už na hranici rozpoznania ľudského oka, a ďaľšie zvyšovanie prakticky nemá zmysel (samozrejme existujú špeciálne aplikácie, v ktorých by sa využilo aj vyššie rozlíšenie, ale tam už sa skôr jedná o profesionálne použitie). Proste, ak už dosiahneme bod, kedy človek nedokáže rozoznať rozdiel v kvalite zobrazenia, ďaľšie zvyšovanie už stráca zmysel. S tým je spojený aj výkon v hrách. Keď budeme mať hardware dostatočne výkonný na to, aby bol schopný výkonnostne pokryť všetky aspekty hry, teda keď s rezervou zvládne grafiku, zvuk aj herné prostredie a hernú mechaniku bez toho, aby dosiahol hranicu výpočtového výkonu, bude ďaľšie zvyšovanie výkonu pre bežného používateľa vlastne zbytočné (samozrejme bude určite potrebná nejaká výkonová rezerva smerom nahor, ale napokon dosiahneme bod, kedy už bude ďaľší výkon nepotrebný). Všetky dáta nám ukazujú, že sa veľmi rýchlo blížime k hranici potrebného výkonu počítačov.
Pozrime sa na vývoj výkonu počítačov: Zrýchľuje alebo spomaľuje?
Z historického hľadiska je pravda, že výkon počítačov rástol extrémne rýchlo, najmä v 90. rokoch a na začiatku 21. storočia. Mooreov zákon hovoril o tom, že počet tranzistorov (a tým aj výkon) sa zdvojnásobí približne každých 18-24 mesiacov. To bolo pravda po desaťročia, no v posledných rokoch sa tento trend začal spomaľovať. Fyzikálne limity výroby čipov, ako je veľkosť tranzistorov a tepelné straty, spôsobujú, že zdvojnásobovanie výkonu už nie je také rýchle ako kedysi.
Napriek tomu stále vidíme veľké skoky v efektivite výkonu vďaka novým architektúram, optimalizáciám a paralelizácii výpočtov (napr. viacjadrové procesory).
Koľkokrát sa musí zvýšiť výkon?
Hry a zábava: Ak vezmeme do úvahy, že už dnes máme počítače, ktoré dokážu plynule zvládnuť hry v 4K alebo 8K rozlíšení pri vysokých snímkových frekvenciách (napr. 120 fps), dá sa povedať, že ďalšie zvýšenie výkonu bude slúžiť viac na optimalizáciu detailov, fyziky a umelej inteligencie než na samotnú grafiku. Množstvo výkonu, ktoré ešte potrebujeme na absolútne realistické hry, sa odhaduje možno na násobok 10-50x oproti dnešnému high-end hardvéru.
Kódovanie videa: Technológie ako AI asistované kódovanie už dnes urýchľujú celý proces, a pokiaľ dosiahneme bod, kedy môžeme v reálnom čase kódovať 8K videá alebo aj komplexnejšie multimédiá, bude toto zlepšenie asi na úrovni násobku 10-20x.
Bežné úlohy: Pre každodenné používanie je výkon už dnes viac než dostatočný, takže by sme mohli povedať, že bežný užívateľ už v podstate nepotrebuje ďalší nárast výkonu – počítače sú dostatočne rýchle na multitasking, streaming, prehliadanie internetu a bežné aplikácie. Ak predpokladáme, že sa zameriame len na extrémne aplikácie (napr. veľmi náročné simulácie, VR alebo AR), môže byť potrebné zvýšenie výkonu o 5-10x, aby sme dosiahli absolútnu plynulosť.
Existujú nejaké prekážky, ktoré môžu spomaliť tento vývoj?
Fyzikálne limity čipov: Tranzistory sa už dostávajú na fyzikálne limity svojej veľkosti (nanoškála). Výrobcovia ako Intel a AMD už začínajú prechádzať na nové výrobné procesy (napr. 5nm a menšie), ale zmenšovanie tranzistorov je čoraz ťažšie.
Tepelný manažment: S rastúcim výkonom prichádzajú aj problémy s odvodom tepla. Zvyšovanie výkonu znamená vyššiu spotrebu energie a tým aj väčšie tepelné straty, čo môže limitovať schopnosť udržať stabilný výkon.
Vývoj softvéru: Softvér sa musí prispôsobovať hardvérovým inováciám, čo znamená, že aj keď máme extrémne výkonný hardvér, pokiaľ softvér nie je optimalizovaný na jeho využitie, môže výkon stagnovať. Toto sa už deje v niektorých prípadoch, kde hardvér má viac jadier, ale softvér ich nevie plne využiť.
Paralelizácia výpočtov: Veľa moderných procesorov a grafických kariet je optimalizovaných pre paralelné spracovanie (napríklad viacjadrové procesory). Pre niektoré typy úloh však stále potrebujeme vysoký jednovláknový výkon, čo je ťažšie dosiahnuť. Nie všetky úlohy môžu byť efektívne rozdelené medzi viac jadier.
Aký násobok výkonu teda potrebujeme?
Ak predpokladáme, že máme dnes high-end procesory a grafické karty s výkonom, ktorý je dostatočný pre väčšinu úloh, môžeme si predstaviť, že na dosiahnutie skutočného bodu, kde nás výkon vôbec neobmedzuje (vrátane hier, videa, multitaskingu na profesionálnej úrovni), by sme potrebovali zvýšiť výkon približne 10 až 100x. To závisí od toho, či hovoríme o veľmi špecifických profesionálnych aplikáciách, alebo o bežnom používaní.
Pre každodenné úlohy je výkon dnešných procesorov už dostatočný. Ak sa pozeráme na hry alebo veľmi náročné simulácie (napr. veda, vývoj umelej inteligencie), tam by bolo potrebné zvýšenie ešte možno o 10 až 20x.
Záver: Kedy dosiahneme limit?
Realistický odhad je, že sa môžeme k tejto hranici priblížiť do 10 rokov. Ak vezmeme do úvahy historické tempo vývoja, hardvér bude schopný zvládnuť všetky bežné aj náročnejšie úlohy bez znateľných obmedzení už čoskoro. Pokiaľ nenastanú zásadné technologické prekážky (napr. limity miniaturizácie alebo energetickej efektivity), môžeme očakávať, že v nasledujúcej dekáde bude pre väčšinu používateľov výkon viac než dostatočný.
Zdroj: Faktické dáta do článku boli získané pomocou ChatGPT.