C'è un numero che circola da qualche settimana tra i CFO della Silicon Valley e che nessuno sa ancora esattamente come contabilizzare: $250.000. Non è uno stipendio. È la quota di token AI che Jensen Huang, CEO di Nvidia, si aspetta che un ingegnere da $500.000 all'anno consumi nel corso di dodici mesi. "Se quell'ingegnere mi dice che ha speso $5.000 in token, mi preoccupo molto," ha dichiarato Huang nell'episodio dell'All-In Podcast registrato all'ultimo giorno del GTC 2026. "Se non ha consumato almeno $250.000 in token, sono profondamente allarmato." Alla domanda se Nvidia stia spendendo due miliardi di dollari l'anno in token per i propri team di ingegneria, la risposta è stata diretta: "Ci stiamo provando."
La dichiarazione ha innescato un dibattito che va ben oltre la singola azienda. Perché la logica di Huang, applicata all'ingegnere mediano statunitense — stipendio base attorno ai $130.000 — produce una matematica inquietante: la spesa in token AI supererebbe lo stipendio della persona. Come ha calcolato R&D World in un'analisi dettagliata, applicando la regola del 50% alla total compensation media di $190.000, si ottiene un budget token di circa $95.000 l'anno. Non lo stipendio di una risorsa senior: più o meno quello di una junior.
IL FENOMENO TOKENMAXXING
Il contesto in cui emerge questa discussione ha un nome preciso: tokenmaxxing. A marzo 2026, il New York Times ha documentato come ingegneri di Meta, OpenAI e altre grandi aziende stessero competendo su classifiche interne basate sul volume di token consumati. Il caso più estremo: un ingegnere di OpenAI ha processato 210 miliardi di token in una settimana sola, un volume equivalente a 33 volte il testo dell'intera Wikipedia. Un singolo utente della piattaforma Claude Code di Anthropic ha accumulato una bolletta da $150.000 in un mese.
Meta aveva formalizzato questa competizione in uno strumento chiamato "Claudenomics": una leaderboard interna per tracciare chi bruciasse più token Claude per dipendente. Il top 1% del team arrivava a 281 milioni di token in trenta giorni. Il progetto è stato chiuso dopo le rivelazioni di The Information, ma il principio che lo animava non è scomparso dalle agende manageriali.
I TOKEN COME VOCE DI COMPENSAZIONE
Huang non si è limitato a chiedere più consumo: ha proposto di includere i token come componente strutturale della retribuzione. "Darò loro probabilmente la metà del loro stipendio base in token, in modo che possano essere amplificati 10 volte," ha dichiarato al GTC. CNBC ha riportato che i budget di accesso all'AI inference starebbero già diventando uno degli elementi di recruiting più discussi a Silicon Valley: "Quanti token vengono con questa posizione?" è diventata una domanda standard nei colloqui.
I numeri di mercato confermano la velocità del cambiamento. Secondo un'analisi di TechCrunch di marzo 2026, oltre il 40% delle aziende tech include già qualche forma di budget AI nei pacchetti retributivi — una quota che era inferiore al 5% diciotto mesi fa. Un'analisi del mercato condotta da Levels.fyi a febbraio 2026 ha rilevato che il 62% degli ingegneri software considera l'accesso agli strumenti AI un requisito imprescindibile nella valutazione di un'offerta di lavoro.
Il caso più eloquente arriva da Stoccolma: un ingegnere di Ericsson intervistato dal New York Times ha dichiarato che la sua azienda spende in Claude più di quanto lui guadagni come stipendio. È lo scenario che TechCrunch definisce senza mezzi termini "un segnale di cambiamento fondamentale nel modo in cui le aziende tech pensano al costo di fare business nell'era AI."
IL PROBLEMA CHE I CFO NON RIESCONO ANCORA A NOMINARE
La questione non è se i token siano utili. Lo sono, e i dati sulla produttività degli sviluppatori che li usano intensivamente lo confermano. Il problema è strutturale: quando la spesa in compute per singola persona si avvicina o supera il suo stipendio, la logica finanziaria del headcount cambia radicalmente. Come nota TechCrunch nell'analisi citata, "se il compute fa il lavoro, la domanda su quanti umani servano a coordinarlo diventa più difficile da evitare."
C'è poi una critica più tecnica al tokenmaxxing come metrica. Itsmeduncan la formula in modo tagliente: misurare i token consumati è la versione agentive del vecchio errore di misurare le righe di codice scritte. Premia l'input, non l'output. Un ingegnere che brucia 10 miliardi di token su swarm di agenti non supervisionati non è più produttivo di chi ne usa 100 milioni con precisione chirurgica — è solo più costoso.
Rimane aperta un'altra domanda, ancora più scomoda: il token budget, a differenza di stipendio e equity, non cresce, non matura, non si porta nella prossima trattativa salariale. Se le aziende riescono a normalizzare i token come componente di compensazione, ottengono uno strumento per mantenere piatta la retribuzione cash pur presentando pacchetti apparentemente più ricchi.
Siamo, probabilmente, all'inizio di una rinegoziazione profonda di cosa significhi "costo del lavoro" nel settore tecnologico. I token non sono ancora più costosi dei dipendenti. Ma la traiettoria è quella.