Mezi komentátory a analytiky se čím dál častěji ozývá názor, že se éra levné, často zcela bezplatné umělé inteligence chýlí ke konci.
Začátkem dubna obdržely miliony uživatelů nejen populárního agentního nástroje OpenClaw [bezplatný a open-source autonomní agent umělé inteligence, který dokáže provádět úkoly prostřednictvím velkých jazykových modelů (LLM) — pozn. red.] nepříjemnou zprávu: Anthropic, společnost stojící za modely Claude, zásadně omezil to, jak mohou nástroje třetích stran její umělou inteligenci využívat. Kdo chce, aby mu OpenClaw a podobné nástroje dál běžely, bude muset začít platit, nebo sáhnout hlouběji do kapsy.
Čas účtů
OpenClaw je open-source nástroj rakouského vývojáře Petera Steinbergera, který dokáže samostatně plnit vícekrokové úkoly. Letos se stal hitem a v době oznámení podle odhadů běželo přes 135 tisíc jeho instancí.
Háček byl v tom, že i intenzivní agentní provoz vyšel přes paušální předplatné více než 5× levněji než přes oficiální rozhraní (API). Předplatné tak v tichosti dotovalo způsob používání, na který nebylo naceněné.
„Naše předplatné nebylo stavěno na takový způsob používání těchto nástrojů třetích stran,“ napsal na síti X šéf vývoje Claude Code Boris Cherny a dodal, že kapacitu firma spravuje uvážlivě a přednost dává zákazníkům vlastních produktů.
Anthropic v tomto ohledu není sám. Investoři podle The Verge nalili do firem jako OpenAI a Anthropic stovky miliard dolarů, aby mohly růst a budovat výpočetní kapacity, a nyní očekávají návratnost. Po letech, kdy byl přístup k pokročilým modelům laciný nebo zadarmo, začíná účet docházet a dopady pociťují i koncoví uživatelé. Velké laboratoře zaváděly nové, dražší úrovně předplatného, OpenAI i Anthropic překopaly podnikové ceníky a OpenAI pustil do svého chatbota reklamu.
Z pohledu historie technologií jde o překvapivě známý příběh. The Verge sám připomíná ozvěnu technologického boomu z minulého desetiletí, kdy rizikový kapitál dotoval překotný růst v nejrůznějších odvětvích, od sdílené přepravy přes e-shopy až po rozvoz jídla.
Jakmile firmy upevnily své postavení, zvedly ceny, přidaly nové zdroje příjmů a investorům začaly vracet vložené peníze. Případně nevrátily a zkrachovaly. Vzpomeňme na roky, kdy služby jako Uber jezdily hluboko pod nákladovou cenou nebo kdy streamovací platformy lákaly diváky bez jediné reklamy. Levný komfort nebyl projevem štědrosti, ale nástrojem, jak obsadit trh.
Rozdíl je v měřítku a tempu. Umělá inteligence podle The Verge spotřebovala investorské peníze rychleji než kterékoli jiné odvětví v nedávné historii. Firmy se zavázaly k výstavbě datových center po celém světě a vsadily na ně miliardy s příslibem lepších modelů, nižších cen a umělé inteligence pro všechny. Zastavit samotné krvácení bude obtížné, natož vydělat tolik, kolik investoři vyhlížejí.
Stojí za připomenutí, že podobnými investičními horečkami prošla řada přelomových technologií. Železniční mánie viktoriánské Anglie, telegrafní boom nebo internetová bublina kolem roku 2000 mají společný vzorec: do nové infrastruktury se nahrne víc peněz, než kolik trh krátkodobě unese, následuje korekce a teprve po ní přijde dlouhodobý užitek. Optická vlákna položená v přemrštěném nadšení dot-com éry dnes tvoří páteř internetu, akcionáři tehdejších firem ovšem o své peníze namnoze přišli. Případná korekce u umělé inteligence by tedy nemusela znamenat její konec, spíš výměnu majitelů a vystřízlivění z očekávání.
Stegosauří paradox
Kolik přesně je ve hře, shrnul pro The Verge analytik společnosti Gartner Will Sommer: kapitálové investice do datových center pro AI mají mezi roky 2024 a 2029 dosáhnout zhruba 6,3 bil. USD.
Aby se suma nemusela odepsat jako ztráta, potřebovali by poskytovatelé modelů dosáhnout návratnosti investovaného kapitálu kolem 25 %, tedy zhruba tolik, kolik na svých investicích běžně vydělávají Amazon, Microsoft či Google. Klesne-li návratnost pod 12 %, ztrácí o obor zájem velký institucionální kapitál, který najde lepší zhodnocení jinde. Pod 7 % už jde podle Sommera o odpisové pásmo a o pohromu pro všechny, kdo do technologie vložili peníze.
Jen na tu nejnižší, 7% hranici by velké firmy podle Gartneru musely do roku 2029 vydělat na umělé inteligenci dohromady téměř 7 bil. USD, ke konci období bezmála 2 bil. USD ročně. Pro srovnání, OpenAI se podle vlastního únorového vyjádření zavázal k výdajům 600 mld. USD do roku 2030, a i to je výrazně méně než dřívější plán ve výši 1,4 bil. USD.
Sommer celou situaci přirovnává k tomu, co nazývá stegosauřím paradoxem. Když vědci poprvé našli kostru tohoto dinosaura, nechápali, jak mohla tak malá hlava s nepatrnou tlamou uživit obří tělo. Vznikla teorie, že stegosaurus musel takřka nepřetržitě požírat vysoce výživnou potravu.
S umělou inteligencí je to podle něj obdobné: aby obří tělo přežilo, musí pro ně poskytovatelé najít dost potravy, a navíc výživné. Tělem se rozumí AI laboratoře a jejich infrastruktura, potravou příjmy z celé světové ekonomiky, nejen z technologického trhu, a výživností schopnost na nich skutečně vydělávat, a ne je dotovat. Pokud se paradox nevyřeší a tlama zůstane na takové tělo příliš malá, hrozí odpisy, padající valuace, vyschlé financování a plošné přenastavení očekávání od umělé inteligence.
Všechno se točí kolem tokenů
Jednotkou, na které se celá ekonomika láme, je takzvaný token. The Verge ho vysvětluje jako základní díl dat, který model dokáže zpracovat, ať už jde o text, obrázek, nebo zvuk. V angličtině zhruba odpovídá čtyřem znakům, jeden odstavec vydá přibližně na sto tokenů. Tento článek by jich tedy v anglické verzi spotřeboval cca dva tisíce. V české však zhruba dvakrát tolik, protože čeština je pro velké anglické modely přibližně dvakrát „tokenově náročnější“ než angličtina, ale to můžeme nechat stranou. Většina dotazů na AI velkých hráčů je v angličtině.
Poskytovatelé prodávají přístup k tokenům a jejich počty jsou už dnes závratné. Google v říjnu 2025 oznámil, že měsíčně zpracovává 1,3 kvadrilionu tokenů, a sečteme-li odhady všech hráčů, vyjde to podle Gartneru na sto až dvě stě kvadrilionů ročně.
Jenže aby firmy dosáhly oněch dvou bilionů dolarů příjmů ročně, musely by podle střízlivých propočtů zpracovávat řádově deset sextilionů tokenů za rok. Kvadrilion má patnáct nul, sextilion jednadvacet, takže spotřeba tokenů by mezi dneškem a rokem 2030 musela narůst desetitisíckrát až statisíckrát.
Na takový objem dnes není k dispozici výpočetní kapacita. A i kdyby byla, narazily by firmy na jiný problém: na řadě tokenů zřejmě prodělávají. Při započtení jen přímých nákladů na infrastrukturu a elektřinu je marže podle Sommera ještě rozumná, u novějších, na tokeny hladovějších modelů se však ztenčuje k nule a docela ji spolykají nepřímé náklady na budování další výpočetní kapacity a na trénink každého dalšího velkého modelu.
Proč modely tolik tokenů spotřebují, souvisí s jejich proměnou. V počátcích padala většina nákladů na trénink, kdežto samotný provoz byl levný. Jak modely zmohutněly, obrátil se poměr a nejnáročnější je dnes inference, tedy běžné plnění úkolů. Agentní nástroje a „uvažující“ modely, které za viditelnou odpovědí ještě promýšlejí různé postupy, spouštějí dílčí podúkoly a ověřují si jednotlivé kroky, spotřebují mnohonásobně víc tokenů než prostý chatbot před pár lety.
Profesor Mark Riedl z Georgia Tech to popisuje názorně: zadáte jednu větu a model si pak „povídá sám se sebou“ tisíci, u programování i desetitisíci slovy. Při milionech uživatelů denně náklady na tento skrytý provoz převáží nad tréninkem. A protože agenti jako OpenClaw navíc běží na pozadí prakticky pořád, vrací se příběh zpět na začátek: právě tento typ zátěže vedl Anthropic k dubnovému omezení.
Firmy, které své produkty stavějí na špičkových modelech, podražení obvykle přenášejí na vlastní zákazníky, a ti hledají, jak náklady obejít. Část zákazníků přechází zcela nebo zčásti na otevřené modely (open-source, případně open-weight), které se v poslední době na žebříčcích výrazně zlepšily, jiní si modely provozují na vlastní infrastruktuře, aby měli větší kontrolu, a další pečlivě testují, kde levnější model stačí a kde je drahý špičkový nutný.
Konkurence otevřených modelů tlačí velké hráče především k tomu, aby zlevňovali své levné modely, na nichž mají beztak vyšší marži. I tady se opakuje vzorec známý z dějin softwaru, kdy volně dostupná řešení dlouhodobě stlačují ceny komerčních. Otevřené modely ovšem nejsou všelék. U programování zatím podle dosavadních zkušeností nedosahují kvality těch nejlepších placených, takže volba mezi cenou a kvalitou zůstává každodenním kompromisem.
Konec záboru
Tlak povede ke konsolidaci. Sommer předpovídá, že mnoho firem neufinancuje rychlost, s jakou spalují peníze, a že v každém regionálním trhu nakonec přežijí nanejvýš dva velcí poskytovatelé jazykových modelů. S nimi zřejmě skončí i éra štědrých neplacených verzí. Otázka podle oslovených odborníků nikdy nezněla, zda bezplatnou vrstvu zpoplatnit, ale kdy a jak tvrdě. Šéf firmy Box Aaron Levie pro The Verge soudí, že se to vyjasní během příštích dvou let a že korekci nepřežijí všichni.
Pro koncového uživatele to nemusí být nutně špatná zpráva. Dokud spolu laboratoře soupeří a náklady na přechod jsou nulové, profituje hlavně zákazník. Z širšího pohledu jde spíš o dospívání odvětví, o přechod od růstu za každou cenu k hledání skutečného obchodního modelu. Připomeňme, že podobně „zdarma“ fungují i jiné samozřejmé služby, e-mail, mapy či sociální sítě, jen za ně platíme jinak, svou pozorností a daty. Reklama, kterou OpenAI pustil do svého chatbota, je první vlaštovkou téhož přístupu i u umělé inteligence.
Madheswaran to shrnuje bez příkras: éra zdarma byla zábor území, běžná startupová taktika. Není to ale obchodní model a takhle dlouho fungovat nejde. Jakou cenu nakonec za vyřešení stegosauřího paradoxu zaplatíme my uživatelé, se teprve ukáže.