Udržitelnost vyžaduje nový přístup k využívání energie v éře umělé inteligence

-PR-

Rostoucí zájem o generativní umělou inteligenci vedl k výraznému nárůstu poptávky po výkonných výpočetních systémech. S tím ruku v ruce roste i spotřeba energie a náklady s tím spojené, a tento trend bude nadále pokračovat. Od svého vzniku se velikost modelů umělé inteligence exponenciálně zvětšuje. A větší modely znamenají výkonnější systémy, nebo delší dobu výpočtů a obojí vyžaduje více energie.


Například ChatGPT před koncem roku 2024 spotřebovával více než 500 000 kilowatthodin elektřiny denně, zatímco průměrná americká domácnost spotřebuje přibližně 29 kilowatthodin za den. 

Mezinárodní energetická agentura (IEA) také v roce 2024 upozornila na to, že potřeba energie datových center do roku 2026 vzroste oproti roku 2022 na více než dvojnásobek. Značná část tohoto růstu přitom souvisí s rozvojem AI.
Zároveň se mnoho podniků zaměřuje na udržitelnost a zavázalo se, že do roku 2050 dosáhnou uhlíkové neutrality, aby se přizpůsobily cíli OSN v oblasti nulových emisí. Aby tento cíl splnily, musí snížit spotřebu energie, zvýšit podíl obnovitelných a bezemisních zdrojů, nalézt způsoby, jak uhlík zachytit nebo uložit dříve, než se uvolní do atmosféry, a naučit se opakovaně využívat zdroje a minimalizovat odpad. Stručně řečeno, pro dosažení udržitelné umělé inteligence je nezbytný komplexní přístup.
 

Čtyři strategie pro energeticky efektivnější AI

Vědci v současnosti zkoumají, jak využívat zdroje co nejefektivněji bez ohledu na to, zda jsou AI úlohy provozovány v cloudu, na superpočítačích, nebo v datových centrech umístěných přímo u zákazníka. Různé typy výpočetních zdrojů mohou být při zpracování konkrétních typů úloh efektivnější než jiné. Pokud organizace potřebuje provozovat určité druhy úloh, jak je má rozdělit? Některé úlohy mohou být nejvhodnější pro cloud, jiné zase pro superpočítače nebo on-premise datová centra.

1. Analogové akcelerátory

Digitální obvody byly po celá desetiletí preferovanou volbou. Jsou rychlé, výkonné a umožňují zpracovávat obrovské objemy dat v rekordním čase. S masivním rozšířením AI však digitální obvody narážejí na své limity. Jejich provoz vyžaduje obrovské množství energie. Ale jak se říká: staré je zase nové. Analogové obvody jsou tvořeny součástkami, jako jsou rezistory, kondenzátory a induktory, které pracují v analogové oblasti, a představují slibnou alternativu ke snížení spotřeby energie. Namísto binárního systému nul a jedniček používají analogové obvody spojité signály v určitém rozsahu. Pokud jsou složeny z komponent, jako jsou memristory schopné uchovávat data, snižuje se potřeba jejich přesunu z paměti do akcelerátoru, což vede k nižší spotřebě energie. Akcelerátory určené pro konkrétní úlohy bývají obecně energeticky účinnější než univerzální řešení. Tento odlišný přístup dosahuje stejného cíle, avšak může přinést výrazné úspory energie na úrovni samotného čipu.

2. Digitální dvojčata

Virtuální reprezentace fyzického systému, jako je cloud, superpočítač nebo lokální datové centrum. Tato virtuální reprezentace se průběžně aktualizuje a můžeme ji využít k optimalizaci fyzického systému v reálném čase. Digitální dvojčata se obvykle klasifikují podle způsobu interakce s fyzickým systémem. Nejzákladnější formou digitálního dvojčete je simulace fyzického systému. Příkladem je simulace chladicí infrastruktury v datovém centru používaná při návrhu jeho uspořádání. Tento typ „dvojčat“ se v inženýrství používá již desítky let. Pokud simulace vyměňuje data s fyzickým systémem, aby zůstala aktuální – například snímáním spotřeby energie fyzických komponent v datovém centru a následnou aktualizací modelu – může se vyvíjet spolu s fyzickým systémem. Takové propojení umožňuje mimo jiné udržovat provozní efektivitu systému.

3. Geograficky rozložené úlohy

Dostupnost energie a vody se liší a závisí na konkrétní lokalitě. Laboratoře HPE ve spolupráci s Colorado State University vyvinuly sadu optimalizačních algoritmů, které analyzují rozdíly v uhlíkové intenzitě, dostupnosti vody a nákladech na energii v jednotlivých regionech. Tyto údaje se následně využívají k určení optimálního místa pro spuštění úloh, jako je generativní AI, s cílem lokálně optimalizovat využití zdrojů, snížit spotřebu energie i vody a zároveň snížit náklady.

4. Využití odpadního tepla

Veškerá elektrická energie spotřebovaná v datovém centru se nakonec přemění na teplo, které je nutné ochladit a odvést. Datová centra tradičně používají chlazení vzduchem, které je však méně účinné a nákladnější než přímé kapalinové chlazení (DLC), jež si v éře AI získává stále větší oblibu. DLC je metoda chlazení, při které se kapalina čerpá přímo do serveru, kde absorbuje teplo ze všech systémových komponent včetně procesorů, GPU a pamětí. Poté je odváděna do výměníku mimo datové centrum. Tato metoda je účinnější, protože voda má čtyřikrát vyšší tepelnou kapacitu než vzduch. Kapalinu je také snazší zadržet a přepravovat s menšími tepelnými ztrátami, což zlepšuje využití odpadního tepla. Zachycování odpadního tepla je důležité, protože ho lze využít i k jiným účelům, například k vytápění skleníků a vytvoření ideálních podmínek pro pěstování rajčat nebo k vytápění budov. 
Shrnutí
S rostoucí oblibou umělé inteligence se otevírají rozsáhlé možnosti, jak zvýšit kreativitu, objevovat nové aplikace a zvyšovat produktivitu napříč odvětvími. Popularita AI však zároveň vyžaduje stále více energie pro získávání dat a trénování modelů, které zásadně změní způsob naší práce i života. Minimalizace dopadů této spotřeby energie bude zásadní pro naši budoucí existenci.
 
Cullen Bash
Autor článku je viceprezidentem Hewlett Packard Labs pro výzkum a vývoj ve společnosti Hewlett Packard Enterprise.