En 2026, l’abonnement IA grand public avait son chiffre magique : 20 $ par mois. ChatGPT Plus, Claude Pro, Perplexity Pro et Cursor Pro ont tous atterri là. C’est un prix net — mais sur un plan à prix fixe de 20 $/mois, l’usage en tokens de chaque client est un coût variable que vous portez. Alors, qu’achètent vraiment ces 20 $, et à partir de quand cessent-ils d’être rentables ?
Ceci est un décryptage du prix, pas des comptes de qui que ce soit. Nous ne connaissons ni le modèle réel d’aucune entreprise, ni son usage, ni ses tarifs négociés — alors nous faisons la seule chose que les chiffres publics permettent : le calcul du seuil de rentabilité. Étant donné un prix public et le tarif public des tokens d’un modèle, combien un client peut-il consommer avant que son coût n’égale ce qu’il paie ?
Ce que 20 $ achètent en tokens
Prenez le seul côté sortie — la partie la plus chère de toute facture LLM. À 20 $/mois, le volume de sortie au point mort est simplement 20 $ ÷ le tarif de sortie du modèle :
- Sur Claude Sonnet (15 $/Mtok en sortie) : environ 1,3 M de tokens de sortie — à peu près un million de mots de texte généré.
- Sur GPT-4o (10 $/Mtok en sortie) : environ 2,0 M de tokens de sortie.
- Sur un modèle de raisonnement (20 $/Mtok en sortie) : environ 1,0 M de tokens de sortie — et les modèles de raisonnement génèrent aussi de longues chaînes de pensée cachées que vous payez.
- Sur GPT-4o mini (0,60 $/Mtok en sortie) : environ 33 M de tokens de sortie — à peu près 25× la marge de manœuvre de Claude Sonnet pour les mêmes 20 $.
Et c’est la version généreuse : elle ignore totalement les tokens d’entrée. Ajoutez les prompts, le contexte et les documents récupérés qu’un vrai produit envoie à chaque requête, et chaque seuil de rentabilité ci-dessus baisse. Un power user sur un produit de code ou un agent peut brûler 1,3 M de tokens en quelques jours, pas en un mois.
Le modèle est le levier de la marge
Cet écart est toute l’histoire : le même plan à 20 $ est environ 25× plus indulgent sur GPT-4o mini que sur Claude Sonnet. C’est pourquoi le routage de modèles — un modèle bon marché pour les requêtes faciles, le premium seulement quand il le faut — est le plus gros levier sur la survie d’un plan IA à prix fixe face à ses gros utilisateurs. Choisissez le mauvais modèle par défaut et vos clients les plus actifs deviennent vos plus grosses pertes.
Voyez-le par modèle
La preuve : GitHub a cligné des yeux
Si le prix fixe en IA fonctionnait toujours, les plus gros acteurs le garderaient. Ils ne l’ont pas fait. En juin 2026, GitHub a fait passer Copilot à la facturation à l’usage — chaque plan inclut désormais une dotation mensuelle d’AI Credits, avec un usage payant au-delà. Quand l’entreprise derrière l’un des produits de code IA les plus efficaces de la planète ajoute un compteur d’usage à un plan de 10 à 39 $/mois, c’est le signal le plus clair à ce jour : à grande échelle, prix fixe et usage IA intense ne coexistent pas sans un mécanisme de marge.
Quoi en faire
Vous n’avez pas à abandonner le prix fixe — mais vous devez l’instrumenter. Suivez la marge brute par client pour voir les gros utilisateurs avant qu’ils ne fassent mal ; connaissez le seuil de rentabilité de chaque plan ; routez le trafic facile vers un modèle moins cher ; et ajoutez des limites d’usage ou des paliers plus élevés pour les comptes qui dépassent le seuil de rentabilité. Le prix fixe, c’est bien — un prix fixe dont vous ne voyez pas l’intérieur, non.
Faites passer votre propre prix dans le calculateur gratuit — prix du plan en entrée, modèle et usage en entrée, marge en sortie — puis connectez Stripe et votre coût LLM avec MarginWard pour surveiller automatiquement la marge de chaque client.
Méthodologie : les prix sont des prix de liste publics en date de juin 2026 (ChatGPT Plus, Claude Pro, Perplexity Pro et Cursor Pro à 20 $/mois ; GitHub Copilot Pro à 10 $, Business à 19 $, Enterprise à 39 $). Les tarifs des modèles sont des prix publics indicatifs par Mtok. Seuil de rentabilité = prix ÷ tarif de sortie (sortie seule, une borne supérieure). Aucun chiffre ici n’est une affirmation sur l’usage, le modèle ou la marge réels d’une quelconque entreprise.