La promesse était simple : déployer des agents IA, réduire les coûts, faire exploser la productivité. Microsoft y a cru plus que n’importe qui. Résultat inattendu : la firme de Redmond commence à annuler ses licences Claude Code parce que certains usages reviennent plus cher qu’un employé humain. Numerama a mis en lumière ce virage discret mais révélateur.
Microsoft et Claude Code : un succès qui a mal tourné
Fin 2025, Microsoft a ouvert l’accès à Claude Code, l’outil de programmation par IA d’Anthropic, à plusieurs milliers de ses propres développeurs. L’adoption a été rapide. Trop rapide, selon les informations rapportées par The Verge.
Le problème : Claude Code a pris de la place dans les habitudes des ingénieurs, au détriment de GitHub Copilot CLI, l’outil maison que Microsoft voulait pousser en interne. Copilot CLI est la version en ligne de commande de GitHub Copilot, conçue pour fonctionner hors des environnements classiques comme Visual Studio Code. Sur le papier, Microsoft préfère naturellement promouvoir son propre produit.
Mais la concurrence interne n’est pas la seule explication. Des documents internes cités par The Verge indiquent que, dans certains scénarios, les agents IA coûtent plus cher que des salariés humains chargés des mêmes tâches. C’est là que ça devient intéressant.
La division concernée est la Experiences + Devices, qui regroupe les équipes Windows, Microsoft 365, Outlook, Teams et Surface. Elle réduit progressivement son usage de Claude Code d’ici fin juin 2026.
Pourquoi fin juin précisément ?
La date n’est pas anodine. Le 30 juin marque la clôture de l’exercice fiscal de Microsoft. Annuler les licences Claude Code maintenant permet de réduire des dépenses opérationnelles avant l’ouverture du nouvel exercice en juillet. C’est une décision autant comptable que technologique.
À noter : cette annulation n’affecte pas les grands accords entre Microsoft et Anthropic. L’accord Foundry, qui prévoit un investissement de Microsoft pouvant atteindre 5 milliards de dollars dans Anthropic, reste intact. L’engagement d’Anthropic d’acheter pour 30 milliards de dollars de capacité de calcul Azure non plus. Ce sont deux niveaux de décision très différents.
Le problème de fond : la facturation au token
Pour comprendre pourquoi la note grimpe, il faut regarder la mécanique de facturation des agents IA.
Chaque prompt, chaque réponse, chaque étape intermédiaire consomme des tokens. Un agent chargé d’orchestrer une tâche complexe ne sollicite pas un modèle une seule fois. Il peut le faire des dizaines, voire des centaines de fois, en boucle, avec des contextes souvent très longs.
Sur une tâche simple ou à petite échelle, le modèle économique tient. Mais dès qu’on déploie des agents autonomes auprès de milliers d’employés, la consommation de tokens peut exploser bien au-delà des projections initiales.
Les chiffres avancés par Goldman Sachs donnent le vertige : l’essor des agents pourrait multiplier par 24 la consommation mondiale de tokens d’ici 2030, pour atteindre environ 120 quadrillions de tokens par mois.
La baisse des prix ne suffit pas
On pourrait objecter que le coût unitaire des tokens baisse régulièrement. Gartner estime qu’en 2030, le coût d’inférence sur un modèle de 1 000 milliards de paramètres sera plus de 90 % inférieur à celui de 2025.
Mais deux dynamiques viennent compliquer ce calcul :
- Les fournisseurs n’ont aucune obligation de répercuter intégralement leurs gains d’efficacité sur les prix clients.
- Les agents consomment beaucoup plus de tokens par tâche qu’un simple chatbot.
Résultat : même si chaque token coûte moins cher, la combinaison de plus de tâches automatisées, de plus d’agents et d’une consommation plus élevée par tâche peut faire grimper la facture plus vite que les baisses de prix ne la compensent. Ce n’est pas un paradoxe : c’est de l’arithmétique simple.
Bryan Catanzaro, vice-président de l’apprentissage profond appliqué chez Nvidia, l’a dit clairement dans une interview à Axios : « Pour mon équipe, le coût du calcul dépasse largement celui des employés. »
Microsoft n’est pas seule dans cette situation
L’exemple d’Uber est tout aussi parlant. En avril 2026, Praveen Neppalli Naga, directeur technique de l’entreprise, a expliqué à The Information qu’Uber avait consommé, en seulement quatre mois, l’intégralité de son budget 2026 consacré aux outils de programmation par IA.
La cause : une politique très volontariste en interne. Uber avait encouragé ses équipes à adopter massivement ces outils, allant jusqu’à établir des classements internes par niveau d’adoption. L’intention était bonne. Le résultat budgétaire, moins.
Ces deux exemples montrent que le problème ne touche pas que les petites structures mal organisées. Il touche des entreprises avec des équipes FinOps, des budgets tech considérables et des ingénieurs parfaitement capables d’utiliser ces outils. La variable sous-estimée, c’est le volume.
Ce que ça change pour toi
Si tu gères une stack d’outils ou si tu envisages de déployer des agents IA dans ton organisation, ce signal mérite attention.
Concrètement, voici ce que je retiens de cet épisode :
- Les coûts “invisibles” s’accumulent vite. Derrière le prix du token, il faut compter la supervision humaine, la correction des erreurs, l’orchestration technique et l’itération permanente. Ces coûts ne figurent pas sur la facture du fournisseur mais ils existent.
- Déployer à grande échelle sans mesurer au préalable, c’est risqué. La phase de test à petite échelle est indispensable avant tout déploiement massif d’agents autonomes.
- La question n’est pas “est-ce que l’IA est efficace” mais “à quel volume ça reste rentable”. Ce sont deux questions différentes, et beaucoup d’entreprises ne posent que la première.
- Le choix de l’outil compte. Passer de Claude Code à GitHub Copilot CLI peut sembler anodin, mais quand tu multiplies ce delta de coût par des milliers d’utilisateurs, le chiffre devient significatif.
À mon avis, l’épisode Microsoft est un signal utile, pas une catastrophe. L’IA reste un levier réel de productivité dans de nombreux contextes. Mais le narratif “l’IA réduit les coûts par définition” commence à montrer ses limites. Le vrai défi des prochaines années ne sera pas technologique : il sera comptable. Les entreprises qui s’en sortiront seront celles qui auront instrumenté finement leur usage, pas celles qui auront déployé le plus vite.
À lire aussi
- Aive x Nvidia : indexer la vidéo pour le GEO en 2026
- IA en entreprise : le vrai problème, c’est l’intégration
- VivaTech 2026 : ce qu’il faut savoir sur la 10e édition
FAQ
Pourquoi Microsoft annule-t-il ses licences Claude Code ?
Selon des informations rapportées par The Verge, Microsoft estime que certains usages d’agents IA via Claude Code reviennent plus cher que le travail humain équivalent. La décision coïncide aussi avec la clôture fiscale du 30 juin, permettant de réduire des dépenses opérationnelles avant le nouvel exercice.
Est-ce que cela remet en cause le partenariat Microsoft-Anthropic ?
Non. L’annulation des licences Claude Code en interne n’affecte pas l’accord Foundry (investissement de Microsoft pouvant atteindre 5 milliards de dollars dans Anthropic) ni l’engagement d’Anthropic d’acheter 30 milliards de dollars de capacité de calcul Azure. Ce sont des décisions de niveaux très différents.
Pourquoi les agents IA peuvent-ils coûter plus cher qu’un humain ?
La facturation se fait au token et à l’appel de modèle. Un agent autonome qui orchestre une tâche complexe peut solliciter le modèle des dizaines ou centaines de fois en boucle. Déployé à grande échelle, ce volume fait exploser la facture, souvent bien au-delà des projections initiales.
D’autres entreprises font-elles face au même problème ?
Oui. Uber a consommé en quatre mois son budget annuel 2026 dédié aux outils de programmation par IA. Bryan Catanzaro de Nvidia a lui-même déclaré que le coût du calcul dépasse chez lui le coût des employés.
Faut-il arrêter d’utiliser des agents IA dans son organisation ?
Pas nécessairement. Le problème n’est pas l’IA en soi, mais le déploiement massif sans mesure préalable du coût réel par tâche et par volume. Un déploiement ciblé, instrumenté et progressif reste pertinent. C’est le déploiement “à fond dès le départ sans cadrage budgétaire” qui pose problème.