L'intelligenza artificiale a corto di fiato: quando il compute non basta più

L'intelligenza artificiale a corto di fiato: quando il compute non basta più

Il WSJ certifica la crisi computazionale dell'AI: GPU Nvidia +48% in due mesi, Anthropic raziona i token, OpenAI chiude Sora. Analisi della nuova scarsità che ridisegnerà l'industria.

C'è un paradosso al cuore dell'industria che promette di reinventare il mondo: più l'intelligenza artificiale diventa capace, meno è disponibile. Il Wall Street Journal ha pubblicato nei giorni scorsi un'inchiesta che mette in fila i dati di una crisi strutturale che si stava costruendo sotto la superficie da mesi: "AI Is Using So Much Energy That Computing Firepower Is Running Out" (https://www.wsj.com/tech/ai/ai-energy-computing-firepower-running-out).

Non è una crisi temporanea. È il segnale che il modello di crescita dell'AI — fondato sull'assunzione implicita che potenza di calcolo ed energia fossero risorse virtualmente infinite — si è scontrato con la fisica del mondo reale.


I NUMERI CHE NESSUNO VUOLE SENTIRE

I dati pubblicati dal WSJ e analizzati da ricercatori e analisti di settore parlano chiaro. Il noleggio spot di una GPU Nvidia Blackwell — la linea di chip più avanzata disponibile oggi — ha raggiunto questa settimana quota 4,08 dollari all'ora, secondo l'indice Ornn GPU Pricing (https://ornn.ai), un rialzo del 48% rispetto ai 2,75 dollari di appena due mesi fa. CoreWeave, il principale provider cloud focalizzato sull'AI, ha aumentato i propri prezzi del 20% e ha esteso i contratti minimi da uno a tre anni — un segnale inequivocabile di quanto la domanda stia divorando l'offerta disponibile.

J.J. Kardwell, CEO di Vultr, ha sintetizzato la situazione con una schiettezza insolita nel settore: "questa è la peggiore carenza di compute che abbia visto nei cinque anni in cui gestisco questa azienda. Tutta la capacità elettrica disponibile per il 2026 è già stata prenotata."

Secondo le proiezioni della International Energy Agency (https://www.iea.org/reports/electricity-2025), i data center potrebbero consumare il 3% dell'elettricità globale entro il 2030 — il doppio rispetto ai livelli attuali — con l'AI come principale driver di questa crescita.


ANTHROPIC: TOKEN RAZIONATI E UPTIME IN CRISI

La crisi è visibile nei dati operativi delle aziende più esposte. Anthropic, la società fondata da ex-ricercatori di OpenAI e considerata il principale competitor tecnico di quest'ultima, ha registrato un uptime del suo Claude API pari al 98,95% nei 90 giorni precedenti l'8 aprile 2026 — un dato che suona bene finché non lo si confronta con lo standard di settore del 99,99%.

La differenza in termini pratici è brutale: mentre lo standard accetta circa 52 minuti di downtime all'anno, il 98,95% di Anthropic si traduce in oltre 46 ore di interruzioni nei tre mesi analizzati. Non è un numero astratto: è la ragione per cui David Hsu, CEO di Retool — una delle più stimate piattaforme di sviluppo software enterprise — ha deciso di migrare i propri sistemi da Claude a OpenAI con una motivazione sintetica: "Anthropic continuava ad andare giù."

A partire dalla fine di marzo, Anthropic ha introdotto limitazioni esplicite al consumo di token nelle ore di punta: tra le 5:00 e le 11:00 di mattina dal lunedì al venerdì (ora del Pacifico), gli utenti trovano la propria capacità di utilizzo ridotta. La narrazione di un servizio AI sempre disponibile, illimitato e scalabile comincia a scricchiolare.


OPENAI: SCELTE IMPOSSIBILI

OpenAI non sta meglio. Sarah Friar, CFO dell'azienda, ha ammesso pubblicamente quello che i dipendenti sussurravano da mesi: "Stiamo facendo scelte difficilissime su cosa non perseguire perché non abbiamo abbastanza compute."

La traduzione pratica di questa affermazione è già visibile nel mercato. Sora — il generatore video che aveva strabiliato il settore al momento del lancio e che era legato a un accordo di licenza da 1 miliardo di dollari con Disney — è stato abruptly chiuso. La ragione: il costo computazionale di far girare il servizio era diventato insostenibile rispetto alle priorità strategiche di OpenAI, che ha dirottato quelle risorse su Codex, il suo assistente per il coding.

Fidji Simo, CEO of Applications di OpenAI, ha usato in una comunicazione interna le stesse parole che Sam Altman aveva usato durante la crisi di dicembre con Gemini: "Stiamo agendo come se fosse un'emergenza." Per un'azienda che sta pianificando una delle IPO più attese della storia, ammettere una "code red" ricorrente non è esattamente il messaggio che si vorrebbe comunicare agli investitori.


LA RADICE DEL PROBLEMA: GLI AI AGENT

Per capire perché la crisi sia esplosa proprio ora, bisogna guardare a un'evoluzione quasi invisibile nel modo in cui l'AI viene usata. I sistemi agentici — come Claude Code di Anthropic (https://www.anthropic.com/claude/code), Codex di OpenAI, e i framework che permettono all'AI di eseguire task complessi in autonomia — consumano token a una velocità tra le 10 e le 100 volte superiore rispetto a una semplice conversazione testuale.

Quando un utente chiede a un agente AI di scrivere e testare un programma, di analizzare un dataset o di gestire una sequenza di azioni autonome, il sistema esegue decine o centinaia di chiamate API in sequenza, ognuna delle quali richiede potenza computazionale. Questo tipo di utilizzo era teoricamente previsto ma praticamente ignorato nei piani di capacità: le aziende AI hanno costruito la loro infrastruttura pensando agli utenti che chattano, non agli agenti che lavorano.

Il problema strutturale è che i due trend si alimentano a vicenda: più i modelli diventano capaci, più vengono usati in modalità agentiche; più vengono usati in modalità agentiche, più consumano compute; più consume compute, meno compute è disponibile per tutti.


UN MERCATO A DUE VELOCITÀ

Le conseguenze di questa crisi non sono distribuite in modo uniforme. Il venture capitalist Tomasz Tunguz di Theory Ventures (https://tomtunguz.com/ai-compute-crisis-2026) ha identificato cinque caratteristiche della nuova era di scarsità computazionale:

I modelli state-of-the-art non saranno più accessibili a tutti: Anthropic ha già limitato il proprio modello più recente a circa 40 organizzazioni selezionate. L'accesso al bleeding edge dell'AI diventa un privilegio riservato ai clienti strategici e a chi può permettersi contratti enterprise pluriennali.

L'AI va al miglior offerente: la scarsità spingerà i prezzi verso l'alto. Le aziende con accesso a capitali significativi o con profitti robusti avranno un vantaggio strutturale. Le startup e i singoli sviluppatori si troveranno a competere per le briciole di capacity rimaste.

Disponibile ma lento: anche chi può permettersi di pagare non ha garanzie sulla velocità di risposta. Un'API teoricamente accessibile ma con latenze elevate non è la stessa cosa di un servizio affidabile.

Diversificazione forzata: gli sviluppatori saranno spinti verso modelli più piccoli, deployment on-premise, o verso provider alternativi. Fino a quando la costruzione di nuovi data center e le infrastrutture energetiche non raggiungeranno la domanda — il che potrebbe richiedere anni.

Inflazione come commodity: la scarsità renderà il compute un bene inflazionario. Gestire i costi computazionali e ottimizzare i margini diventeranno competenze strategiche per qualsiasi azienda che integra AI nei propri prodotti.


L'ELEFANTE NELLA STANZA: L'ENERGIA

Dietro la crisi dei chip c'è una crisi ancora più fondamentale: quella energetica. I data center che alimentano l'AI richiedono quantità enormi di elettricità, e la rete elettrica non si aggiorna alla stessa velocità delle roadmap di Nvidia.

L'Agenzia Internazionale per l'Energia stima che i data center potrebbero raddoppiare il loro consumo elettrico entro il 2030. Le grandi aziende tech stanno investendo in soluzioni nucleari (Google, Microsoft), in accordi con utility locali, in sistemi di raffreddamento a liquido più efficienti. Ma tutte queste soluzioni richiedono anni per essere operative, non mesi.

Google ha annunciato di voler portare i propri capex a 175-185 miliardi di dollari nel 2026, quasi il doppio dei 91-93 miliardi del 2025, con l'energia e i data center come principale destinazione degli investimenti. Il CEO Sundar Pichai ha identificato la capacità computazionale come "la domanda principale" a cui l'azienda deve rispondere.


COSA CAMBIA PER LE AZIENDE ITALIANE

Per le imprese italiane che stanno valutando o hanno già avviato progetti di AI integration, questa crisi ha implicazioni concrete:

I costi di utilizzo delle API AI sono destinati a salire. Chi ha costruito piani di business basati sui prezzi attuali dovrà aggiornare i propri modelli finanziari.

La disponibilità non è garantita. I Service Level Agreement dei provider AI sono diventati meno affidabili. Per applicazioni critiche, è necessario prevedere sistemi di fallback e diversificazione tra provider.

L'accesso ai modelli più avanzati potrebbe richiedere negoziazioni enterprise esplicite. L'epoca in cui chiunque poteva accedere al modello più capace del momento con una semplice chiave API potrebbe essere finita.

La sovranità computazionale — tema già discusso a livello europeo — acquista una nuova urgenza. Dipendere interamente da provider americani per l'infrastruttura AI significa essere esposti alle loro scelte di razionamento.


CONCLUSIONE

L'industria AI ha costruito la propria narrativa su una promessa implicita: che la tecnologia avrebbe scalato all'infinito, che i prezzi sarebbero scesi, che l'accesso sarebbe stato universale. Il Wall Street Journal sta documentando la prima incrinatura seria di questa promessa.

Non si tratta di un crollo del settore — le prospettive di crescita dell'AI rimangono straordinarie — ma di un ricalibramento necessario. La scarsità di compute è reale, i vincoli fisici sono reali, e il prezzo da pagare per ignorarli è già visibile nei downtime di Anthropic, nelle chiusure di prodotti di OpenAI, nei prezzi dei chip in risalita.

Chi navigerà meglio questa transizione non sarà chi ha il modello più potente, ma chi ha la capacità infrastrutturale di farlo girare in modo affidabile, efficiente e sostenibile.

L'era dell'AI abbondante è finita. Comincia quella dell'AI come risorsa scarsa.