Energetická náročnosť AI: Presné meranie spotreby a efektívnosti

Energetická stopa umelej inteligencie: mýty versus fakty

Energetická náročnosť umelej inteligencie (AI) je dôležitou a legitímnou témou, ktorá však často trpí nepresnosťami. Často sa stretávame so „strašiakmi“ založenými na nekonzistentných alebo nekompletných údajoch, alebo s nesprávne interpretovanými číslami bez adekvátneho kontextu. Na získanie spoľahlivých údajov je nevyhnutná presná definícia hraníc systému, transparentné a konzistentné predpoklady a použitie porovnateľných metrík. Tento článok prináša komplexný rámec na správne meranie energetickej náročnosti AI, identifikuje časté zdroje nepresností a ponúka overené metodiky na vyhodnocovanie efektívnosti a spotreby energie.

Definovanie hraníc merania energetickej spotreby AI

Fáza tréningu versus inferencia

Energetická náročnosť AI sa výrazne líši v závislosti od fázy, ktorú sledujeme.

  • Tréning modelu: fáza učenia je energeticky najnáročnejšia a prebieha v epizodických intervaloch. Vyžaduje vysoký výpočtový výkon a často sa spája s výraznou spotrebou energie na krátky časový úsek.
  • Inferencia: prevádzkovanie modelu po jeho vytrénovaní znamená rozloženie energetických nákladov na dlhšiu dobu, pričom každá požiadavka generuje malú, no kumulatívnu spotrebu.

Spotreba IT zariadení verzus celé dátové centrum

Pri hodnotení spotreby energie je potrebné rozlišovať medzi priamou spotrebou výpočtovej techniky (GPU, CPU, pamäte) a celkovou spotrebou dátového centra vrátane chladenia, napájacích zdrojov a infraštruktúry. Tento pomer vyjadruje metrika PUE (Power Usage Effectiveness), ktorá je nevyhnutná pre presný prepočet celkovej spotreby.

Životný cyklus zariadení (LCA) a vložená energia

Okrem operatívnej spotreby elektrickej energie je dôležité zahrnúť vloženú energiu potrebnú na výrobu čipov, serverov, batérií a budov. Analýza životného cyklu (LCA) hrá rozhodujúcu rolu pri navrhovaní infraštruktúry a strategických rozhodnutiach, hoci pri každodennej prevádzke je jej význam menší.

Metriky na kvantifikáciu spotreby a emisií

Základné jednotky energie a ich výpočet

Základnou jednotkou pre meranie spotreby energie je kilowatthodina (kWh). Výpočet energie vychádza zo vzťahu:

E = priemerný príkon (kW) × čas (h)

Metrika PUE (Power Usage Effectiveness)

PUE vypovedá o energetickej efektívnosti dátového centra a definuje pomer celkovej energie dátového centra k energii priamo spotrebovanej IT zariadeniami:

PUE = (energetická spotreba dátového centra) / (energetická spotreba IT zariadení)

Moderné dátové centrá dosahujú hodnoty PUE približne 1,1 až 1,3, zatiaľ čo staršie alebo menej optimalizované prevádzky môžu mať hodnoty nad 1,5.

Emisný faktor elektrickej energie

Emisie skleníkových plynov sú odvodené z emisného faktora siete, ktorý sa udáva v gramoch CO2 ekvivalentu na kWh (gCO2e/kWh) a závisí od zdrojov energie použitých na výrobu elektriny.

Emisie = energia (kWh) × emisný faktor (gCO₂e/kWh)

Intenzita energie podľa jednotky služby

Pre presné vyhodnotenie energetickej náročnosti je vhodné merať spotrebu na jednotku služby, napríklad:

  • kWh/tréning modelu
  • Wh/požiadavka na inferenciu
  • Wh/token alebo Wh/generovaný obrázok

Tieto metriky umožňujú porovnateľné a transparentné vyhodnocovanie efektívnosti AI systémov.

Praktické výpočty spotreby energie pri AI

Odhad spotreby pri tréningu stredne veľkého modelu

Nasledujúci príklad ilustruje typický, konzervatívny výpočet spotreby energie počas tréningu:

  1. Hardvérové parametre: použitie 8 GPU, každé s príkonem približne 350 W, vedie k IT príkonu okolo 2,8 kW. Po započítaní ďalších komponentov servera (+30 %) je celkový príkon cca 3,64 kW.
  2. Trvanie tréningu: 1 000 hodín znamená celkovú spotrebu energie IT zariadení:
  3. E_IT = 3,64 kW × 1 000 h = 3 640 kWh
  4. Vplyv PUE: s hodnotou PUE 1,2 potom celková spotreba dátového centra dosiahne:
  5. E_DC = 3 640 kWh × 1,2 = 4 368 kWh
  6. Emisie CO₂ podľa energetického mixu: pri emisnom faktore 400 gCO2e/kWh:
  7. Emisie ≈ 4 368 kWh × 0,4 kg CO₂e/kWh = 1,75 t CO₂e

Interpretácia: použitie elektromixu s nižšími emisiami (napr. 100 gCO2e/kWh) znižuje emisie na približne 0,44 t CO₂e. Naopak, pri vyššej hodnote PUE (napr. 1,6) a emisnom faktore 700 gCO2e/kWh sa emisie môžu zvýšiť nad 4 tony CO₂e. Tieto rozdiely zdôrazňujú význam infraštruktúry a energetického mixu.

Energetická náročnosť inferencie na jednu požiadavku

Výpočet energie potrebnej pre jednu inferenciu zohľadňuje veľkosť modelu, počet tokenov, batchovanie a zdieľanie zdrojov:

  1. Príkon IT zariadení: GPU alebo akcelerátory zvyčajne spotrebujú 200–400 W;
  2. Dĺžka požiadavky: interaktívna odpoveď trvá zvyčajne 1–3 sekundy. Pri priemernom príkonu 250 W a dobe 2 sekundy je spotreba tejto požiadavky:
  3. energia = 250 W × 2 s = 500 J ≈ 0,139 Wh
  4. Započítanie PUE: s PUE 1,2 je výsledná spotreba približne 0,167 Wh na požiadavku.

Kontext: táto hodnota je porovnateľná s energetickou spotrebou niekoľkých sekúnd HD videostreamingu alebo veľmi malou časťou energie potrebnej na nabitie smartfónu. Pri generovaní rozsiahlejších výstupov (dlhé texty, obrázky, videá) táto hodnota výrazne rastie.

Najčastejšie zdroje skreslenia v hodnotení energetickej náročnosti AI

  • Ignorovanie hodnoty PUE: používanie iba priamej spotreby GPU bez započítania celej infraštruktúry vedie k podhodnoteniu, zatiaľ čo nadhodnocovanie pomocou neoverených „priemerných“ koeficientov je rovnako zavádzajúce.
  • Zamieňanie energetickej náročnosti tréningu a inferencie: náklady na tréning nemožno rozpočítať len na jednu požiadavku; tréningové náklady sa musia amortizovať vzhľadom na celú životnosť modelu.
  • Fixné emisné faktory: emisie sa líšia podľa geografickej polohy a časového obdobia, preto je vhodné využívať regionálne a časovo špecifické údaje na čo presnejšie vyhodnotenie.
  • Nejednotné používanie LCA: variabilita v započítavaní výrobných energií vyžaduje jasne definované metodiky na zaručenie porovnateľnosti údajov.

Prehľad porovnaní spotreby energie AI s bežnými činnosťami

  • Tréning stredne veľkého modelu: spotreba je rádovo v megawatthodinách (MWh), čo zodpovedá emisiám produkcie niekoľkých desiatok až stovák litrov paliva, v závislosti od energetického mixu.
  • Energia na jednorazovú textovú požiadavku: len zlomky Wh a emisne malé množstvá, porovnateľné s energetickou spotrebou krátkej doby sledovania videa.
  • Generovanie obrázkov alebo dlhých textov: vyžaduje jednotky Wh, pričom energetická náročnosť pri obrazových modeloch s difúziou je ovplyvnená počtom krokov a rozlíšením.

Možnosti zvyšovania energetickej efektívnosti v prevádzke AI

  • Optimalizovaná architektúra modelov: menšie a špecializované modely alebo koncepty ako mixture-of-experts výrazne znižujú počet aktívnych parametrov počas inferencie.
  • Technické optimalizácie a kvantizácia: použitie formátov INT8 či FP8, sparsity, kompilátorových optimalizácií, batchovania často vedie k 2- až 5-násobným úsporám bez zníženia kvality výsledkov.
  • Zlepšenia v tréningových postupoch: využitie opakovaného použitia kontrolných bodov, curriculum learningu alebo low-rank adaptácie (LoRA) namiesto úplného doladenia modelu.
  • Zníženie PUE dátových centier: implementácia free coolingu, imerzného chladenia a optimalizácia prietokov vzduchu môžu PUE znížiť na hodnoty okolo 1,1 až 1,2.
  • Optimalizácia umiestnenia a načasovania: kolokácia dátových centier pri zdrojoch obnoviteľnej energie, využívanie flexibelných energetických taríf a časové posunutie energeticky náročných úloh do obdobia so zelenou energiou.

Efektivita z pohľadu používateľov a produktov

  • Výber správneho modelu podľa potreby: použitie malých lokálnych modelov pre jednoduché úlohy namiesto veľkých univerzálnych modelov, keď to postačuje.
  • Zdieľanie a znovuvyužitie modelov: využívanie predtrénovaných modelov s možnosťou prispôsobenia len malou dávkou dát šetrí výrazne tréningové náklady.
  • Monitorovanie a zlepšovanie používateľských scenárov: analýza reálnej potreby generovania výstupov a optimalizácia dĺžky odpovedí znižujú zbytočné energetické výdaje.
  • Vzdelávanie a osvetové aktivity: zvyšovanie povedomia o environmentálnych dopadoch AI môže viesť k zodpovednejšiemu využívaniu týchto technológií.

Energetická náročnosť AI je komplexná téma, ktorá si vyžaduje viacrozmerný prístup. Dôležitá je nielen optimalizácia hardvéru a softvéru, ale aj uvážlivé plánovanie a štruktúrovanie AI projektov s ohľadom na ich skutočný prínos a efektívnosť. Iba tak môžeme dosiahnuť udržateľný rozvoj AI technológií v súlade s environmentálnymi cieľmi.